คุยกับเกมได้เหมือนคุยกับคน ฟีเชอร์ใหม่จากพลัง AI ของ NVIDIA
สำหรับผู้ที่เล่นเกมบนคอมพิวเตอร์ (PC) กันบ่อย ๆ จะคุ้นเคยการสนทนากับตัวละครที่ไม่ใช่ผู้เล่น หรือ NPC (Non-Plabled Character) ซึ่งเป็นส่วนเสริมในการเล่าเนื้อหาและดำเนินเนื้อเรื่องของเกม อย่างไรก็ตาม NPC เหล่านี้มักมีบทที่ตายตัว และการโต้ตอบที่ไม่เป็นธรรมชาติ ซึ่งปัญหาเหล่านี้ได้รับการแก้ไขโดยอินวิเดีย (NVIDIA) ผู้พัฒนาชิปประมวลผลกราฟิก (GPU) ชื่อดัง ผ่านฟีเชอร์ที่ชื่อว่าเอซ (ACE)
ระบบ ACE ของ NVIDIA คืออะไร
เอซ (ACE: Avatar Cloud Engine) เป็นระบบการพัฒนาการโต้ตอบของกลุ่ม NPC บนพื้นฐานของปัญญาประดิษฐ์ หรือเอไอ (AI) และระบบคลาวด์ (Cloud) ที่ใช้การประมวลผลกลางผ่านเครือข่ายอินเทอร์เน็ต ซึ่งมีหน้าที่หลักในการรับฟังเสียงของผู้เล่น ก่อนประมวลผลและสร้าง (Generate) คำตอบเป็นเสียงสนทนาที่เหมาะสมกับสถานการณ์
ความสามารถดังกล่าวได้รับการสาธิตผ่านวิดีโอโฆษณาที่เป็นส่วนหนึ่งของการแถลงข่าวประจำปีของบริษัท โดยแสดงความสามารถในการโต้ตอบผ่านเสียงที่ผู้เล่นพูดผ่านหูฟัง (Headset) ก่อนที่ NPC ที่เป็นเจ้าของร้านซูชิจะโต้ตอบกลับมา (ข้อสังเกต: วิดีโอดังกล่าวมีสัดส่วนภาพ 32:9 ซึ่งเป็นการนำเสนอที่แปลกกว่าวิดีโอปกติที่ใช้สัดส่วน 16:9)
ผู้เล่น: "Hey Jin, how are you," (สวัสดี จิน เป็นยังไงบ้าง)
จิน: "Unfortunately, not so good," (แย่หน่อย ไม่ค่อยดีเลย)
ผู้เล่น: "How come?" (เกิดอะไรขึ้น)จิน: " I am worried about the crime around here. It's gotten bad lately. My ramen shop got caught in the crossfire." (ฉันกังวลอาชญากรรมแถวนี้น่ะสิ พักหลังนี้ชักหนักข้อขึ้นแล้ว ร้านฉันดันติดอยู่กลางดงโจรเลย)
การพัฒนาระบบ ACE ของ NVIDIA
แม้ว่าการสนทนาและคำที่ใช้จะไม่เป็นธรรมชาติมากนัก (เมื่อเทียบกับการพูดแบบธรรมชาติของเจ้าของภาษา) แต่เป็นก้าวสำคัญที่เพิ่มมิติตัวละครและเนื้อเรื่องมากยิ่งขึ้น อีกทั้งยังเป็นก้าวสำคัญในการยกระดับการเล่นเกมให้สมจริง หลังจากที่ระบบอันเรียล เอนจิน 5 (Unreal Engine 5) ได้ทำให้ภาพการเล่น (Gameplay) สมจริงจนคล้ายกับคนมากขึ้นเช่นเดียวกับที่เห็นผ่านวิดีโอสาธิตของเอซด้วย
เทคโนโลยีเอซมุ่งเน้นการพัฒนาไปในด้านการพูด, การสนทนา, และการแสดงสีหน้าท่าทางของตัวละคร ผ่าน 3 เทคโนโลยีของบริษัท ได้แก่
- NVIDIA NeMo™ เทคโนโลยีด้านการสร้างคลังภาษาด้วยการป้อนข้อมูลพื้นหลังตัวละครและการเรียนรู้ภาษามนุษย์
- NVIDIA Riva เทคโนโลยีแปลงข้อความเป็นเสียงพูดสำหรับการสนทนา
- NVIDIA Omniverse Audio2Face เทคโนโลยีการสร้างใบหน้าให้สมจริงทั้งการแสดงออกของสีหน้าและท่าทางให้เข้ากับการพูด
ฟีเจอร์เอซเป็นการจับมือกันระหว่างอินวิเดียกับบริษัท คอนวาย (Convai) ผู้เชี่ยวชาญด้านการสร้างบทสนทนาด้วยเอไอ ซึ่งตอนนี้รองรับการประมวลผลบนคลาวด์และฮาร์ดแวร์ของอินวิเดียที่รองรับ พร้อมทั้งสร้างระบบป้องกันการสนทนาที่ไม่เหมาะสม เช่นการคุกคามทางเพศหรือการใช้ความรุนแรง โดยเทคโนโลยีนี้มีค่ายเกมจะนำไปใช้แล้วบางส่วน อย่างในเกมที่มีชื่อว่า สตอล์กเกอร์ 2: เฮิร์ต ออฟ เชอร์โนบิล (S.T.A.L.K.E.R. 2: Heart of Chernobyl) วิดีโอเกมแนวสยองขวัญเอาชีวิตรอดที่พัฒนาและเผยแพร่โดยจีเอสซี เกม เวิลด์ (GSC Game World) ผู้พัฒนาเกมรายใหญ่ของยุโรปจากยูเครน เป็นต้น
ที่มาข้อมูล Engadget