Microsoft Research สร้างระบบที่สามารถสร้างคำอธิบายภาพที่ "ฉลาด" โดยอัตโนมัติ

สารบัญ:

ประกอบด้วยอะไรบ้าง

แน่นอนว่าคุณเจอคำอธิบายภาพที่สับสน ไม่ถูกต้อง หรือพูดถึงรูปภาพที่อ้างถึงเพียงเล็กน้อย และเป็นไปได้ว่าหากคุณอุทิศตนเพื่อเผยแพร่บทความของคุณเอง คุณจะพบว่า น่าเบื่อ มากที่สุดที่จะกรอกข้อมูลในส่วนนี้ ผู้คนจาก Redmond ได้สร้างเครื่องมือที่มีเป้าหมายเพื่อทำให้สิ่งต่างๆ ง่ายขึ้นสำหรับคุณ

ผลงานที่เผยแพร่โดย Microsoft Research ที่อธิบายตัวเองว่าเป็น “ระบบสร้างคำบรรยาย” ที่สามารถเลียนแบบลักษณะการเล่าเรื่องของภาษามนุษย์ได้ นั่นคือเทคโนโลยีที่สามารถอธิบายภาพหน้าจอได้ราวกับว่าเกี่ยวกับพวกเราคนหนึ่ง ด้วยบริบทที่สอดคล้องกันบางอย่างที่บริษัทอย่าง Facebook, Microsoft และ Google กำลังดำเนินการอยู่ระยะหนึ่ง แต่ครั้งนี้เกินความคาดหมาย

ประกอบด้วยอะไรบ้าง

เขามีช่วงเวลาที่ดี

ด้วยวิธีนี้ ระบบ มีความสามารถแม้กระทั่งเล่าเรื่องที่สมบูรณ์จากภาพหลาย ๆ ภาพ บรรยายและเล่าราวกับว่า มันเป็นหนังสือ ยูทิลิตี้ที่ผู้เชี่ยวชาญระบุว่าอาจกลายเป็นคุณสมบัติที่ให้สัมผัสของมนุษย์มากขึ้นกับแอพพลิเคชั่นบางอย่าง แอพพลิเคชั่นการจดจำเสียง สร้างคำอธิบายโดยอัตโนมัติในพื้นที่อื่น ๆ และอื่น ๆ อีกมากมาย

และความจริงก็คือ tool ไม่จำกัดเพียงการกล่าวสั้นๆ ว่า “เห็น” อะไร แต่ให้ความหมายกว้างๆ บริบทของสถานการณ์ที่สะท้อนอยู่ในภาพ บรรลุ "บริบทการเล่าเรื่องและสไตล์การเล่าเรื่องที่ไม่เหมือนใคร" แฟรงก์ เฟอร์ราโร หนึ่งในผู้เขียนงานนี้อธิบายเพื่อให้ตัวเราอยู่ในสถานการณ์ พระองค์ทรงให้ example ที่ชัดเจนแก่เรา

แม่ของเขาภูมิใจในตัวเขา

เราจึง ขอเสนอ กรณีดังนี้ “ลองนึกดูว่าเรามีอัลบั้มรูปของเพื่อนบางคนที่ฉลองวันเกิดใน ผับ. ภาพแรกบางภาพแสดงคนสั่งเบียร์และดื่ม ในขณะที่ภาพสุดท้ายแสดงภาพคนหลับอยู่บนโซฟา” เขาแสดงความคิดเห็น

ระบบทั่วไป “สามารถชี้ไปที่บางสิ่งบางอย่าง เช่น มีคนนอนอยู่บนโซฟา ในขณะที่ระบบของเราอาจเหมารวมว่าพวกเขาอาจอยู่ในสถานการณ์นั้นเพราะพวกเขาเมาหลังจากดื่มไปไม่กี่แก้ว” . ส่วนเสริมที่ให้ ความเข้าใจ และความรู้สึกบางอย่างที่สะท้อนผ่านภาพและคำบรรยายภาพที่รวมอยู่ในบทความนี้

Via | รีวิวเทคโนโลยี MIT

ใน Xataka Windows | Microsoft เปิดตัวแอปที่กำหนดสายพันธุ์สุนัขของคุณ

สารบัญ:

ประกอบด้วยอะไรบ้าง

ตัวเลือกของบรรณาธิการ