บิง

Microsoft ประกาศว่าเทคโนโลยีการรู้จำเสียงช่วยลดอัตราความผิดพลาดและมีประสิทธิภาพเท่ากับมนุษย์

Anonim
"

เป็นหนึ่งในเสาหลักที่หลายคนยืนยันว่าแพลตฟอร์มต่างๆ จะเติบโตในอนาคตอันใกล้ ไม่มีอะไรที่จะโต้ตอบกับคำสั่งหรือท่าทางที่เป็นลายลักษณ์อักษร อนาคตอยู่ที่การพูดคุยกับเครื่องจักรแต่ไม่มีการพูดคุยกับคำสั่งหุ่นยนต์และคำสั่งที่ผิดธรรมชาติ เราจะทำมันด้วยภาษาที่เป็นธรรมชาติ ซึ่งเป็นสิ่งที่เราชื่นชมมากขึ้นเรื่อยๆ ในผู้ช่วยส่วนตัว"

และหนึ่งในบริษัทที่มีอาชีพที่โดดเด่นที่สุดในแง่นี้คือ Microsoft ซึ่งเป็นบริษัทที่มีเส้นทางการพัฒนาซึ่งทำงานเพื่อปรับปรุงการจดจำเสียงของพนักงานอย่างต่อเนื่องจากนั้นบนแพลตฟอร์มของพวกเขาเทคโนโลยีที่ตอนนี้เรามีข่าวเกี่ยวกับทีมพัฒนา ข่าวที่พูดถึง การปรับปรุงที่ยอดเยี่ยมที่ทำให้มีความแม่นยำในระดับเดียวกับที่ใช้กับมนุษย์

ในแง่นี้ พวกเขาได้ประกาศว่า ระบบจดจำเสียงของพวกเขามีถึง 5.1% ใน WER นั่นคือ ข้อผิดพลาดในอัตรา ของคำที่ใช้ สำหรับหลาย ๆ คนอาจไม่ได้พูดอะไร แต่เป็นเรื่องน่าประหลาดใจหากเราเห็นว่าในแง่หนึ่ง อัตรานี้เป็นอัตราเดียวกับที่เราพบในการสื่อสารระหว่างบุคคล

ในการทำเช่นนี้ จาก Redmond พวกเขาเลือกที่จะใช้รูปแบบภาษาพูดและเสียงที่ได้รับการปรับปรุงให้ดีขึ้นตามการใช้โครงข่ายประสาทเทียมสิ่งเหล่านี้ถูกรวมเข้ากับหน่วยความจำแบบสองทิศทางระยะยาวเพื่อปรับปรุงการสร้างแบบจำลองอะคูสติก ดังนั้นจึงปรับปรุงการจดจำด้วยการคาดเดาคำที่สามารถใช้ได้ตามประวัติการสื่อสารการปรับปรุงเหล่านี้ยังได้รับการสนับสนุนจากคลาวด์ด้วยความพยายามที่บริษัททำเพื่อปรับปรุงโครงสร้างพื้นฐานของคลาวด์คอมพิวติ้ง โดยเฉพาะอย่างยิ่งกับ Azure

นอกจากนี้ หมายความว่า อัตราข้อผิดพลาดนี้ลดลงในแง่ของระยะขอบของความล้มเหลว เนื่องจากก่อนหน้านี้อยู่ที่ 5.9% ทำให้ลดลงจาก 12% ซึ่งเป็นตัวเลขที่ระบบมีน้อยกว่าปีที่แล้ว ดังนั้น Microsoft จึงได้บรรลุระบบรู้จำเสียงที่มีประสิทธิภาพเทียบเท่ากับระบบของมนุษย์ และเมื่อเห็นความก้าวหน้าที่กำลังดำเนินการ จึงไม่น่าแปลกใจที่พวกเขาจะปรับปรุงระบบนี้ในอีกไม่กี่เดือนหรือหลายปีข้างหน้า

ใครจะไปรู้ว่าในอีกไม่กี่ปีนับจากนี้ การพูดคุยกับ Windows PC ของเรา การโต้ตอบกับ Cortana หรือแอปพลิเคชันอย่าง Office จะเป็นอะไรที่เป็นธรรมชาติเหมือนกับสิ่งที่พวกเขาทำให้เราฝันไปแล้ว (หรือมีฝันร้าย ใครจะรู้) ในโรงภาพยนตร์

ใน Xataka | ไม่ใช่เสียงจากหลุมฝังศพ แต่เป็นคำสั่งที่ซ่อนอยู่ซึ่งผู้ช่วยเสียงรับรู้และมนุษย์ไม่รับรู้

บิง

ตัวเลือกของบรรณาธิการ

Back to top button