Skype Translator ทำงานอย่างไร
สารบัญ:
นิยายวิทยาศาสตร์เต็มไปด้วยการอ้างอิงถึงอุปกรณ์ขั้นสูงทางเทคโนโลยีซึ่งการดำเนินการเพื่อถอดความการแสดงออกที่เป็นตำนานนั้นแยกไม่ออกจากเวทมนตร์ เกิดขึ้นจากความคิดสร้างสรรค์ของผู้เขียน จึงเป็นเรื่องยากที่จะจินตนาการว่าสิ่งประดิษฐ์ดังกล่าวจะอยู่ในมือของเราเมื่อใด และเราลงเอยด้วยการยอมรับว่าการมีอยู่ของสิ่งประดิษฐ์เหล่านั้นจะไม่กลายเป็นส่วนหนึ่งของวงจรชีวิตของเรา แต่นานๆครั้งจะมีคนๆหนึ่งแอบเข้ามาในชีวิตเราก่อนเวลาอันควร นั่นคือกรณีของ การแปลแบบเรียลไทม์ที่ Microsoft และ Skype กำลังจะทำให้เป็นไปได้
"งานเป็นอะไรที่ง่ายๆมันเกี่ยวข้องกับความสามารถของ Skype ในการประชุมทางวิดีโอ เครือข่ายเซิร์ฟเวอร์คลาวด์ที่กว้างขวางของ Microsoft Azure นวัตกรรมทางเทคโนโลยีของ Microsoft Research และความก้าวหน้าล่าสุดในหลาย ๆ ด้าน เช่น สถิติและการเรียนรู้ของเครื่อง ทั้งหมดนี้ให้บริการคุณ เพื่อให้ทันทีที่คุณออกเสียงประโยคในภาษาของคุณ ระบบจะจดจำสิ่งที่คุณพูด แปลและส่งต่อไปยังผู้ติดต่อของคุณในภาษาอื่น มันเป็นไปได้ยังไงกัน?"
เทคโนโลยีที่ทำให้เป็นไปได้
Skype Translator ซึ่งเป็นชื่อที่เรียกฟังก์ชันการทำงานใหม่นี้ไม่ได้เกิดขึ้นชั่วพริบตา ไม่ถึงปีด้วยซ้ำ . Skype Translator เป็นผลลัพธ์ของการวิจัยหลายทศวรรษเกี่ยวกับการรู้จำเสียง การแปลด้วยคอมพิวเตอร์ และเทคนิคการเรียนรู้ด้วยเครื่อง ในพื้นที่ทั้งหมดเหล่านี้เป็นการทำงานของระบบที่จะเป็นไปไม่ได้หากไม่มีความก้าวหน้าล่าสุด
Skype Translator เป็นผลลัพธ์ของการวิจัยหลายทศวรรษเกี่ยวกับการรู้จำเสียง การแปลด้วยเครื่อง และเทคนิคการเรียนรู้ด้วยเครื่องเริ่มต้นด้วย Speech Recognition เทคโนโลยีที่อยู่ภายใต้การตรวจสอบมาระยะหนึ่งแล้ว แต่การยอมรับมักได้รับผลกระทบจากคนจำนวนมาก จากข้อผิดพลาดและความไวที่มากเกินไปของระบบที่มีอยู่ ข้อสงสัยประการที่สอง ความแตกต่างเล็กน้อยในสำเนียงหรือเสียงรบกวนน้อยที่สุดก็เพียงพอแล้วที่จะทำให้คอมพิวเตอร์สับสนและทำให้เข้าใจว่าต้องการอะไร เป็นเช่นนั้นจนกระทั่งการพัฒนาเทคนิค 'การเรียนรู้เชิงลึก' และการสร้างเครือข่ายประสาทเทียมระเบิดขึ้น ซึ่ง Microsoft Research รู้อะไรบางอย่าง ต้องขอบคุณพวกเขา จึงเป็นไปได้ที่จะลดอัตราข้อผิดพลาดลงได้อย่างมาก และปรับปรุงความน่าเชื่อถือและความทนทานของการรู้จำเสียง ซึ่งเป็นขั้นตอนแรกที่จำเป็นสำหรับ Skype Translator ในการทำงาน
เครื่องแปลภาษา เป็นอีกเสาหลักที่ชัดเจนซึ่ง Skype Translator วางอยู่ ที่นี่ Microsoft ใช้เทคโนโลยีภายในองค์กรอีกครั้งและใช้เครื่องมือแปลภาษา Bing เพื่อแปลข้อความจากภาษาหนึ่งไปยังอีกภาษาหนึ่งระบบของเขาใช้การผสมผสานระหว่างเทคนิคการจดจำไวยากรณ์และแบบจำลองทางสถิติเพื่อปรับแต่งผลลัพธ์ นอกจากนี้ ในโอกาสนี้ เครื่องยนต์ยังได้รับการฝึกฝนมาเป็นพิเศษเพื่อจดจำประเภทของภาษาที่เกิดขึ้นในการสนทนาด้วยคำพูด ซึ่งห่างไกลจากความถูกต้องและความเรียบร้อยที่มักสันนิษฐานเป็นลายลักษณ์อักษร ดังนั้น ระบบ Skype Translator จึงรวมฐานความรู้ด้านภาษาขนาดใหญ่ของ Bing Translator พร้อมด้วยคำและวลีมากมายที่ใช้กันทั่วไปในภาษาพูด
แต่การพูดและภาษาเป็นภูมิประเทศที่ซับซ้อน เปลี่ยนแปลงตลอดเวลา มีหลายรส หลากหลาย แต่ละคนมีสไตล์เฉพาะของตัวเอง ฯลฯ Skype Translator ต้องตามให้ทัน โดยต้องได้รับการฝึกอบรมอย่างต่อเนื่องและเพิ่มประสิทธิภาพทั้งการรู้จำเสียงและการแปลด้วยคอมพิวเตอร์ ในการทำเช่นนี้ ระบบถูกสร้างขึ้นบนแพลตฟอร์ม 'แมชชีนเลิร์นนิง' ที่แข็งแกร่ง ซึ่งเป็นสาขาหนึ่งของปัญญาประดิษฐ์ที่มุ่งพัฒนาเทคนิคที่ช่วยให้เครื่องจักรและอัลกอริทึมสามารถเรียนรู้ได้ โดยฝึกด้วยข้อมูลตัวอย่างการใช้เทคนิคเหล่านี้ ซึ่งพบได้ทั่วไปในด้านสถิติ ช่วยให้บริการสามารถปรับปรุงตามการใช้งาน โดยใช้ประโยชน์จากข้อมูลที่สร้างขึ้นเมื่อใช้งานเพื่อปรับแต่งการรู้จำเสียงและการแปลอัตโนมัติเพิ่มเติม
ข้อมูลการทดสอบบางส่วนถูกสร้างขึ้นโดยอัตโนมัติจากแหล่งที่มาที่หลากหลาย รวมถึงเครือข่ายสังคมเช่น Facebook หน้าเว็บที่แปลแล้ว วิดีโอพร้อมคำบรรยาย หรือแม้กระทั่งการสนทนาที่สร้างขึ้นตามวัตถุประสงค์และคัดลอกและแปลด้วยตนเอง . แต่ข้อมูลอีกส่วนหนึ่งมาจากการสนทนาที่เกิดขึ้นจริงผ่านบริการ นี่เป็นสิ่งสำคัญเนื่องจาก Microsoft จะแจ้งให้คุณทราบเมื่อมีการโทรแต่ละครั้ง คุณควรทราบว่า Skype Translator สามารถบันทึกการสนทนาโดยไม่เปิดเผยชื่อ เพื่อให้อัลกอริทึมวิเคราะห์ในภายหลังได้ และแนะนำในกระบวนการฝึกอบรมแบบจำลองทางสถิติ
Skype Translator สามารถทำงานได้อย่างถูกต้องก็ต่อเมื่อสามารถเรียนรู้ผ่านกระบวนการตามการใช้งานในการสนทนาของมนุษย์จริงๆ
"ระบบไม่สามารถทำงานได้หากไม่มีกระบวนการเรียนรู้นี้ ขณะที่มนุษย์พูด เราหยุดพูดและพูดซ้ำ ทำผิดพลาด และเปลี่ยนความคิดเมื่อเราพูด เราแนะนำ อ่า เอิ่ม อืม>การเรียนรู้เกี่ยวกับการใช้งานจริงเท่านั้นที่สามารถทำให้ดีขึ้น"
จากภาษาพูดหนึ่งไปยังอีกภาษาหนึ่งในไม่กี่วินาที
สนับสนุนโดยความก้าวหน้าทั้งหมดนี้ ที่สำคัญคือ Skype Translator สามารถดำเนินการกระบวนการรับรู้และการแปลทั้งหมดอย่างรวดเร็วและโปร่งใสสำหรับผู้ใช้ ทุกครั้งที่เราพูด ระบบจะต้องจดจำสิ่งที่เราพูด แปลเป็นภาษาของผู้รับ และสื่อสารกับเขาด้วยวิธีที่ยังคงซื่อสัตย์ต่อสิ่งที่เราพยายามสื่อสารในตอนแรกยิ่งเราสังเกตขั้นตอนกลางน้อยเท่าไหร่ก็ยิ่งดี
ทันทีที่ระบบตรวจพบว่าเรากำลังพูด ระบบจะเริ่มบันทึกสิ่งที่เราพูด และ เริ่มกระบวนการรู้จำเสียง นี่ไม่ใช่ ไม่เพียงแต่จดจำคำศัพท์แต่ละคำที่เรากำลังออกเสียงเท่านั้น แต่ยังกำจัดทุกสิ่งที่ไม่จำเป็น ลบการแสดงออกและเสียงรบกวนที่ไม่มีความหมาย ตรวจหาการแบ่งข้อความเป็นประโยค โดยใส่เครื่องหมายวรรคตอนและตัวพิมพ์ใหญ่ และให้บริบท ที่ช่วยในการตีความของคุณ เมื่อคุณลองคิดดูสักนิด คุณจะรู้ว่ามันยากเพียงใดที่จะตัดสินทั้งหมดนี้จากภาษาพูด
Skype Translator ต้องการให้การรู้จำเสียงถูกต้องที่สุดเท่าที่จะเป็นไปได้ เพราะสิ่งที่ตามมาคือ การเตรียมข้อมูลที่รวบรวมเพื่อเปรียบเทียบกับแบบจำลองทางสถิติที่ได้รับการปรับปรุง ผ่านระบบ 'การเรียนรู้ของเครื่อง'กระบวนการนี้ประกอบด้วยการค้นหาความคล้ายคลึงกันระหว่างสิ่งที่ระบบเข้าใจว่าเรากำลังพูด กับคำและบริบทที่อยู่ในแบบจำลอง เพื่อใช้การแปลงที่เรียนรู้ก่อนหน้านี้ซึ่งจะแปลงเสียงเป็นข้อความและแปลเป็นภาษาต่างประเทศ
ในขั้นตอนสุดท้าย Skype ได้เตรียม บอทคู่เสียงผู้หญิงและผู้ชายที่ทำหน้าที่เป็นล่ามในการโทร เมื่อผู้ใช้เลือกหนึ่งรายการแล้ว เขาจะรับผิดชอบในการสื่อสารข้อความที่แปลของเราไปยังผู้รับ ดังนั้นไม่เพียงแต่การถอดความและคำแปลที่เป็นลายลักษณ์อักษรเท่านั้นที่ปรากฏบนหน้าจอ แต่เขายังสามารถได้ยินเสียงดังราวกับว่ามีมนุษย์คนที่สามอยู่ด้วย ตัวกลางระหว่างเรา.. บอทเหล่านี้สามารถสื่อสารข้อความได้อย่างรวดเร็ว ดังนั้นใครก็ตามที่ฟังอยู่อีกด้านหนึ่งของหน้าจอจะได้รับข้อความหลังจากที่เราออกเสียงไม่กี่วินาที
โปรแกรมทดสอบเบื้องต้น
การปรากฏตัวของบอทในฐานะผู้พูดบุคคลที่สามในการสนทนาเป็นหนึ่งในรายละเอียดที่ยังคงได้รับการขัดเกลา Microsoft ตระหนักดีว่าการปรับตัวให้เข้ากับสิ่งเหล่านี้เป็นเรื่องง่ายสำหรับผู้ที่เคยพูดผ่านล่าม แต่สำหรับคนอื่น ๆ นั้นต้องอาศัยระยะเวลาการเรียนรู้ และเป็นที่ Microsoft และ Skype อาจมุ่งมั่นที่จะสร้างประสบการณ์การแปลตามเวลาจริงที่ดีที่สุดที่มีอยู่ แต่การทำเช่นนั้น พวกเขาต้องการให้เราเรียนรู้ทั้งตัวเราเองและเครื่องคอมพิวเตอร์การแสดงตัวอย่างของ Skype Translator เป็นเพียงขั้นตอนเดียวในกระบวนการนั้น
โปรแกรมทดสอบเผยแพร่เมื่อกลางเดือนธันวาคม โดยแนะนำ การแปลด้วยคำพูดระหว่างสองภาษา: อังกฤษและสเปน และการแปลเป็นลายลักษณ์อักษรมากกว่า 40 ภาษา ในการเข้าถึงจำเป็นต้องมีคำเชิญซึ่งเราสามารถขอได้โดยการลงทะเบียนบนเว็บไซต์ของโปรแกรม หากถูกใจ เราสามารถลองใช้ Skype Translator จากแอปพลิเคชัน Skype สำหรับ Windows 8 ได้1 หรือตัวอย่างทางเทคนิคของ Windows 10 มิฉะนั้นจะต้องรอการขยายบริการและเผยแพร่อย่างเป็นทางการ
"ยังไงก็ตาม Skype Translator ได้เริ่มต้นขึ้นในขณะที่เรากำลังจะบอกลาปี 2014 ก่อนจบ หยุดที่นี่สักครู่แล้วนึกถึงปีที่คุณเพิ่งอ่าน: สองพันสิบสี่>"
Via | บล็อก Skype I, II