ยกระดับ AI ! ChatGPT ฟัง - พูดกับผู้ใช้ แถมใส่ภาพเพื่อถามคำถามได้แล้ว


โอเพนเอไอ (OpenAI) บริษัทเจ้าของบริการแชตจีที (ChatGPT) บริการปัญญาประดิษฐ์หรือเอไอที่เรียนรู้ด้วยตัวเองได้ (Generative AI) ที่โด่งดังที่สุดในโลก ได้ประกาศความสามารถใหม่ในการฟังเสียงผู้ใช้ พูดกับผู้ใช้ และคุยกับผู้ใช้จากภาพที่กำหนดได้แล้ว
ความสามารถใหม่ของ ChatGPT : ฟัง, พูด และอ่านภาพที่ส่งจากผู้ใช้
การเปลี่ยนแปลงดังกล่าวเริ่มจากความสามารถในการพูดด้วยเสียงสังเคราะห์ที่กำหนดได้ทั้งหมด 5 รูปแบบ พร้อมสามารถรับฟังเสียงผู้ใช้ในการป้อนคำสั่งแทนการพิมพ์ได้ ซึ่งรองรับการป้อนคำสั่งด้วยเสียงคล้ายกับการสนทนาจริง รองรับทั้งสถานการณ์การขอข้อมูล การให้เล่าเรื่องราว การแต่งกลอน หรือการสอนวิธีทำอาหารเหมือนกับที่คนสอนได้จริง ๆ
ส่วนความสามารถในการอ่านภาพที่ผู้ใช้ส่งไปจะเป็นการรับภาพไปประมวผลคู่กับคำสั่งที่พิมพ์ส่งไป เช่น หากเราถ่ายภาพจักรยานพร้อมกับถาม ChatGPT ว่าจะต้องลดความสูงอานจักรยานอย่างไร ChatGPT จะไล่เรียงวิธีการปรับระดับ พร้อมทั้งสามารถส่งภาพเครื่องมือและคู่มือของจักรยานเพื่อให้ ChatGPT ช่วยดูว่าเครื่องมือที่มีเหมาะสมตามขั้นตอนในคู่มือหรือไม่ได้ด้วย
ผู้ใช้ ChatGPT ใน iOS และ Android จะได้อัปเดตมากที่สุด
ในหน้าประกาศของโอเพนเอไอ (OpenAI) เมื่อ 25 กันยายนที่ผ่านมาระบุว่าการอัปเดตความสามารถใหม่จะให้เอกสิทธิ์เฉพาะผู้ใช้ที่จ่ายค่าบริการรายเดือนก่อน และเฉพาะผู้ใช้บริการบนสมาร์ตโฟนทั้งฝั่งระบบปฏิบัติการ iOS และ Android เท่านั้นที่จะได้การฟังและพูดของ ChatGPT ไป ส่วนการวิเคราะห์รูปภาพนั้นจะให้กับทุกแพลตฟอร์ม
อย่างไรก็ตาม ผู้เชี่ยวชาญหลายคนต่างวิตกกังวลกับการเพิ่มความสามารถการพูดจากข้อความแปลงเป็นเสียง (text-to-speech) ของ ChatGPT ที่อาจเปิดช่องโหว่ให้มีการปลอมแปลงตัวตน หรือดีปเฟค (Deepfake) ได้สมจริงมากยิ่งขึ้น รวมถึงความกังวลต่อการรักษาความเป็นส่วนตัวและการจัดการกับเสียงของผู้ใช้ ซึ่งทางโอเพนเอไอนั้นย้ำนโยบายบริษัทว่าจะไม่มีการนำเสียงผู้ใช้มาบันทึกเก็บไว้ แต่ก็ยอมรับว่าอาจมีการนำบางคำสั่งเสียงมาใช้เพื่อปรับปรุงโมเดล AI ของตนเช่นกัน
ที่มาข้อมูล CNBC