NVIDIA เปิดตัว AI เปลี่ยนข้อความเป็นเสียง ใส่อารมณ์และร้องเพลงได้

NVIDIA เปิดตัว AI เปลี่ยนข้อความเป็นเสียง ใส่อารมณ์และร้องเพลงได้
TNN ช่อง16
2 กันยายน 2564 ( 09:53 )
31
NVIDIA เปิดตัว AI เปลี่ยนข้อความเป็นเสียง ใส่อารมณ์และร้องเพลงได้

NVIDIA หยิบเจ้า RAD-TTS ออกมาอัพเกรดอีกครั้ง หลังจากครั้งก่อน NVIDIA เคยหยิบเอา AI ดังกล่าวมาเปิดตัวในงาน SIGGRAPH’s Real-Time Live ซึ่งในขณะนั้น ตัว AI สามารถที่จะแปลงข้อความเป็นเสียงได้แล้ว และเจ๋งยิ่งกว่าใคร เพราะตัว AI สามารถลงลึกไปได้ไปถึงระดับความละเอียดของน้ำเสียง ระยะเวลาในการเปล่งเสียง และพลังในการเปล่งเสียง แต่ดูเหมือนว่าในการสาธิตล่าสุดนี้ RAD-TTS จะสามารถทำได้มากกว่านั้น


การสาธิตรอบล่าสุด RAD-TTS สามารถที่จะแปลงเสียงจากโปรดิวเซอร์ให้กลายเป็นเสียงสังเคราะห์โดยยังเก็บน้ำหนักเสียงและอารมณ์เอาไว้ได้ทั้งหมด แม้เสียงที่พูดออกมา จะเป็นเสียงคนละเพศกับคนพูดก็ตาม และเนื่องจาก AI ได้สร้างเสียงจากข้อความ ทำให้ก่อนสังเคราะห์เสียงออกมา สามารถปรับแต่งโทนเสียงให้ต่างจากตอนบันทึกได้ด้วย


อนาคตของคนพิการ, งานพากษ์, เกม, งานแสดง, และสื่อมีเดียทั้งหมด

ต้องยอมรับก่อนว่าในทุกวันนี้ การพากย์เสียงผลงานนั้นค่อนข้างที่จะยุ่งยาก มีโอกาสเกิดข้อผิดพลาดได้ง่าย ซึ่งเมื่อเกิดข้อผิดพลาด การแก้ไขอาจไม่ง่ายแค่แก้ไฟล์ แต่จำเป็นต้องพากย์เสียงในส่วนนั้น ๆ ใหม่ทั้งหมด เสียทั้งต้นทุน เวลา และกำลังคนเป็นอย่างมาก หรือบางครั้งเสียงที่พากย์ออกมาอาจจะทำไม่ได้ถึงระดับอารมณ์หรือความรู้สึกที่ต้องการ รวมไปถึงงานสื่อมีเดียต่าง ๆ โดยเฉพาะเกม ที่มองว่าการพากย์เสียงค่อนข้างเป็นส่วนที่สิ้นเปลือง เพราะต้องจ้างนักแสดงมากมายและใช้เวลาในการผลิตที่มากขึ้น ทำให้เกมในปัจจุบันส่วนใหญ่ ตัวละครภายในเกมส่วนมาก มักจะไม่มีเสียงเป็นของตัวเอง


หาก RAD-TTS ถูกพัฒนาจนสามารถนำมาใช้ได้โดยทั่วไปได้ ผู้พิการทางปาก จะสามารถกลับมาพูดด้วยน้ำเสียงที่สื่อถึงอารมณ์ได้อีกครั้ง งานที่ต้องใช้เสียงพูดตามสคริปต์ทั้งหมด สามารถใช้เสียงสังเคราะห์แทนได้ โดยเฉพาะเกมที่มีตัวละครเยอะ ๆ เราจะไม่ต้องจ้างคนพากย์เสียงอีกต่อไป ในเมื่อระบบสามารถสร้างเสียงที่มีองค์ประกอบครบถ้วนได้เหมือนมนุษย์ แถมพิเศษกว่าตรงที่ควบคุมและปรับแต่งได้ นักพากย์หรือคนที่ต้องใช้เสียงในการทำงาน จะยังจำเป็นอยู่อีกเหรอ ?


แหล่งที่มา blogs.nvidia.com

ข่าวที่เกี่ยวข้อง