โครงการ

โดย: PB [IP: 154.47.24.xxx]
เมื่อ: 2023-05-23 20:22:56
"ผู้คนจำนวนมากในโลกนี้พูดภาษาต่างๆ ได้ แต่เครื่องมือเทคโนโลยีทางภาษาไม่ได้รับการพัฒนาสำหรับพวกเขาทั้งหมด" Xinjian Li, Ph.D. กล่าว นักเรียนในสถาบันเทคโนโลยีภาษาของ School of Computer Science (LTI) "การพัฒนาเทคโนโลยีและรูปแบบภาษาที่ดีสำหรับทุกคนเป็นหนึ่งในเป้าหมายของการวิจัยนี้" Li เป็นส่วนหนึ่งของทีมวิจัยที่มุ่งลดความซับซ้อนของภาษาที่ต้องการข้อมูลเพื่อสร้างแบบจำลองการรู้จำเสียง ทีมงาน ซึ่งรวมถึงอาจารย์ของ LTI เช่น Shinji Watanabe, Florian Metze, David Mortensen และ Alan Black ได้นำเสนอผลงานล่าสุดของพวกเขา "ASR2K: Speech Recognition for Around 2,000 Languages ​​Without Audio" ที่งาน Interspeech 2022 ในเกาหลีใต้ โมเดลการรู้จำเสียงส่วนใหญ่ต้องการชุดข้อมูลสองชุด ได้แก่ ข้อความและเสียง ข้อมูลข้อความมีอยู่เป็นพันภาษา ไม่มีข้อมูลเสียง ทีมงานหวังว่าจะขจัดความต้องการข้อมูลเสียงโดยมุ่งเน้นไปที่องค์ประกอบทางภาษาที่ใช้กันในหลายภาษา ในอดีต เทคโนโลยีการรู้จำเสียงเน้นที่หน่วยเสียงของภาษา เสียงที่แตกต่างเหล่านี้ที่ทำให้คำหนึ่งแตกต่างจากอีกคำหนึ่ง เช่น "d" ที่แยกคำว่า "dog" ออกจาก "log" และ "cog" ซึ่งเป็นเสียงเฉพาะสำหรับแต่ละภาษา แต่ภาษาต่างๆ ก็มีโทรศัพท์เช่นกัน ซึ่งอธิบายลักษณะเสียงของคำ โครงการ โทรศัพท์หลายเครื่องอาจสอดคล้องกับหน่วยเสียงเดียว ดังนั้น แม้ว่าภาษาที่แยกจากกันอาจมีหน่วยเสียงต่างกัน แต่โทรศัพท์พื้นฐานก็อาจเหมือนกันได้ ทีมงาน LTI กำลังพัฒนาโมเดลการรู้จำเสียงที่เปลี่ยนจากหน่วยเสียงและพึ่งพาข้อมูลเกี่ยวกับวิธีที่โทรศัพท์ใช้ร่วมกันระหว่างภาษา ซึ่งช่วยลดความพยายามในการสร้างโมเดลแยกสำหรับแต่ละภาษา โดยเฉพาะอย่างยิ่ง จะจับคู่โมเดลกับต้นไม้สายวิวัฒนาการ ซึ่งเป็นแผนภาพที่แสดงความสัมพันธ์ระหว่างภาษา เพื่อช่วยในเรื่องกฎการออกเสียง ด้วยแบบจำลองและโครงสร้างแบบต้นไม้ ทีมงานสามารถประมาณแบบจำลองคำพูดสำหรับภาษาต่างๆ หลายพันภาษาโดยไม่มีข้อมูลเสียง "เรากำลังพยายามลบข้อกำหนดข้อมูลเสียงนี้ ซึ่งช่วยให้เราย้ายจาก 100 หรือ 200 ภาษาเป็น 2,000 ภาษา" หลี่กล่าว "นี่เป็นงานวิจัยชิ้นแรกที่กำหนดเป้าหมายไปยังภาษาจำนวนมาก และเราเป็นทีมแรกที่ตั้งเป้าที่จะขยายเครื่องมือทางภาษาไปยังขอบเขตนี้" การวิจัยยังอยู่ในช่วงเริ่มต้น การวิจัยได้ปรับปรุงเครื่องมือประมาณภาษาที่มีอยู่แล้วเล็กน้อย 5% แต่ทีมงานหวังว่าเครื่องมือนี้จะเป็นแรงบันดาลใจไม่เพียงแต่สำหรับงานในอนาคตเท่านั้น แต่ยังรวมถึงนักวิจัยคนอื่นๆ ด้วย สำหรับ Li งานมีความหมายมากกว่าการทำให้เทคโนโลยีภาษาพร้อมใช้งานสำหรับทุกคน เป็นการอนุรักษ์วัฒนธรรม “แต่ละภาษาเป็นปัจจัยที่สำคัญมากในวัฒนธรรม แต่ละภาษามีเรื่องราวของตนเอง และหากคุณไม่พยายามรักษาภาษาไว้ เรื่องราวเหล่านั้นอาจสูญหายไป” หลี่กล่าว "การพัฒนาระบบการรู้จำเสียงแบบนี้และเครื่องมือนี้เป็นขั้นตอนในการพยายามรักษาภาษาเหล่านั้น"

ชื่อผู้ตอบ:

Visitors: 104,544