รีเซต

เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-4o พูดโต้ตอบเรียลไทม์ และปรับโทนเสียงตามอารมณ์

เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-4o พูดโต้ตอบเรียลไทม์ และปรับโทนเสียงตามอารมณ์
TNN ช่อง16
14 พฤษภาคม 2567 ( 01:06 )
63

บริษัท OpenAI ผู้นำด้านเทคโนโลยีปัญญาประดิษฐ์จัดงาน Spring Update ภายในงานได้เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-4o ซึ่งตัว o ถูกตั้งตามอักษรย่อของคำว่า "omnimodel" 


โมเดลปัญญาประดิษฐ์ GPT-4o รองรับความสามารถในการพูดคุยโต้ตอบแบบเรียลไทม์ตามเวลาจริง แปลภาษาได้รวดเร็ว และแสดงอารมณ์ในการออกเสียงรูปแบบต่าง ๆ ได้ บริษัทเตรียมเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรี 


บริษัทเปิดเผยว่าการทำงานของ GPT-4o มีความคล้ายกับ GPT-4 แต่มีการทำงานที่รวดเร็วมากกว่าประมาณ 2 เท่า รวมไปถึงความสามารถด้านเสียงเพื่อพูดคุยกับผู้ใช้งาน โดยบริษัทต้องการพัฒนาให้มีการพูดคุยเหมือนการพูดคุยกับมนุษย์จริง ๆ 


ในระหว่างสาธิตการใช้งานสนทนากับ GPT-4o นอกจากความสามารถตอบสนองแทบจะในทันทีเมื่อผู้นำเสนอพูดจบ แต่ยังตอบกลับด้วยการอ่านออกเสียงข้อความอีกด้วย โดยให้ความรู้สึกเหมือนกับว่าคุณกำลังพูดคุยกับใครบางคนแบบเรียลไทม์ 


ความสามารถในการแนะนำข้อมูลเพิ่มเติม เล่าเรื่องราวต่าง ๆ รวมไปถึงสอนวิธีการหายใจที่มีประสิทธิภาพให้กับร่างกายผู้ทดสอบมากที่สุด รวมไปถึงการสาธิตการเล่านิทานก่อนนอน โดย GPT-4o เปลี่ยนโทนเสียงคล้ายการแสดงอารมณ์ไปมาระหว่างการสนทนาให้เร็วขึ้นหรือช้าลง


จุดเด่นอีกย่างของ GPT-4o คือ การทำหน้าที่เป็นผู้ช่วยประจำตัวผู้ใช้งานบนหน้าจอคอมพิวเตอร์ โดยสามารถช่วยอธิบายข้อความ กราฟิกต่าง ๆ หรือแม้แต่การอธิบายการทำงานของโค้ดโปรแกรมที่ยากให้กลายเป็นเรื่องง่าย


นอกจากนี้ ทีมงานได้ปรับหน้าจอ UI ของแอปพลิเคชัน ChatGPT บนคอมพิวเตอร์ให้ใช้งานได้ง่ายเพิ่มมากขึ้น รวมไปถึงการปรับปรุงโมเดลปัญญาประดิษฐ์ GTP-4o ให้รองรับภาษาต่าง ๆ ที่ดีมากขึ้นกว่า 50 ภาษา 




ที่มาของข้อมูล xda-developersTechcrunch 

 

ยอดนิยมในตอนนี้

แท็กยอดนิยม

ข่าวที่เกี่ยวข้อง