AI ตรวจจับ “อารมณ์” ด้วยเสียงตัวใหม่ ใช้เสียงโกรธ, เศร้า, หวาดกลัว มาฝึก !?
Alaa Nfissi นักศึกษาปริญญาเอกจากมหาวิทยาลัย Concordia University ใน เมืองมอนทรีออล, ประเทศแคนาดา ได้ทำการฝึก AI ให้สามารถจดจำและแยกอารมณ์จากคำพูด ด้วยศาตร์การวิเคราะห์อารมณ์จากเสียงพูด Speech Emotion Recognition (SER) โดยมีเป้าหมายในการนำไปใช้เพื่อช่วยเจ้าหน้าที่รับสายด่วนวิกฤต มีเครื่องมือที่ช่วยประเมินสถานการณ์อารมณ์ของผู้ที่โทรมาได้ง่ายขึ้น
แต่เดิม SER เป็นศาสตร์ที่ถูกใช้โดยนักจิตวิทยา เพื่อจับสัญญาณจากน้ำเสียงคำพูด อย่างไรก็ตามศาสตร์ดังกล่าวจำเป็นต้องใช้เวลาและความเชี่ยวชาญเป็นอย่างมาก ในการจะใช้งานมันได้อย่างถูกต้องและแม่นยำ
AI ของ Nfissi จะทำการฝึกด้วยเทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) โดยการใช้บันทึกเสียงจริง ๆ ที่ได้จากคนที่โทรเข้ามาในสายด่วนวิกฤต ร่วมไปกับเสียงของนักแสดงที่เก่งในเรื่องของการแสดงอารมณ์และความรู้สึก โดยตัวข้อมูลที่จะป้อนให้ AI ได้เรียนรู้นี้ จะมีการแยกส่วนอารมณ์ออกเป็น 4 แบบ และจะแปะแต่ละส่วนเอาไว้ ว่าเสียงแบบใดสะท้อนถึงสภาพจิตใจหรืออารมณ์แบบไหน เช่น โกรธ, เศร้า, ปกติ, และ หวาดกลัว/กังวล/วิตกกังวล
หลังการฝึกฝน พบว่า AI ของ Nfissi สามารถจดจำอารมณ์ทั้ง 4 ได้อย่างแม่นยำ และสามารถแยกอารมณ์ความรู้สึกจากเสียงได้แล้ว โดย ตัว AI สามารถระบุเสียงที่มีความกลัว/กังวล/วิตกกังวลได้อย่างถูกต้อง 82%, ความเศร้า 77%, ความโกรธ 72%, และปกติ 78%
เมื่อนำไปใช้ตรวจจับในเสียงที่มีการโทรเข้ามาแบบจริง ๆ พบว่าสามารถตรวจจับเสียงที่มีความเศร้าได้อย่างถูกต้องสูงถึง 78% และความโกรธสูงถึง 100%
Nfissi หวังว่า AI ของเขาจะได้ถูกนำไปใช้พัฒนาเป็นแดชบอร์ด ที่สามารถแสดงข้อมูลอารมณ์จากเสียงได้แบบเรียลไทม์ เพื่อให้ผู้ปฏิบัติงานที่ต้องรับสายด่วนวิกฤต สามารถรับรู้ถึงอารมณ์ของคนที่โทรเข้ามาได้ และหากลยุทธ์ที่ดี หรือวิธีรับมือได้อย่างเหมาะสม สำหรับผู้ที่อยู่ในสภาวะอารมณ์ที่ค่อนข้างวิกฤต
บทความเรื่อง AI ของ Nfissi ได้ถูกนำเสนอในงาน 2024 IEEE 18th International Conference on Semantic Computing (ICSC) แคลิฟอร์เนียที่ผ่านมา และได้รับรางวัล Best Student Paper อีกด้วย
บทความจาก : newatlas.com