เซี่ยงไฮ้เปิดตัว 'โมเดลภาษาขนาดใหญ่' รุ่นใหม่ สรุปสาระสำคัญบันทึกการประชุมยาว 3 ชม. ได้อย่างแม่นยำ
(แฟ้มภาพซินหัว : ผู้คนเรียนรู้เกี่ยวกับโมเดลภาษาขนาดใหญ่ที่ขับเคลื่อนด้วยเอไอ ระหว่างการประชุมการประมวลผลโลก ประจำปี 2023 ในนครฉางซา มณฑลหูหนานทางตอนกลางของจีน วันที่ 15 ก.ย. 2023)
เซี่ยงไฮ้, 18 ม.ค. (ซินหัว) -- เมื่อวันพุธ (17 ม.ค.) เซี่ยงไฮ้ได้เปิดตัวโมเดลภาษาขนาดใหญ่รุ่นใหม่ สามารถรองรับและประมวลผลตัวอักษรภาษาจีนได้ประมาณ 300,000 ตัวในครั้งเดียว
ปัจจุบัน ขีดจำกัดที่มีในด้านความยาวบริบท (Context Length) ของบรรดาโมเดลขนาดใหญ่ นับเป็นหนึ่งในปัญหาสำคัญของเทคโนโลยีปัญญาประดิษฐ์หรือเอไอ (AI)
โมเดลใหม่นี้มีชื่อว่า "อินเทิร์นแอลเอ็ม2" (InternLM2) ได้รับการพัฒนาขึ้นโดยบริษัท เซี่ยงไฮ้ อาทิฟิเชียล อินเทลลิเจนซ์ แลบบอราทอรี่ (Shanghai Artificial Intelligence Laboratory) บริษัทเซนส์ไทม์ (SenseTime) มหาวิทยาลัยจีนแห่งฮ่องกง (CUHK) และมหาวิทยาลัยฟู่ตั้น
ระหว่างการทดลอง คณะนักวิจัยได้ป้อนบันทึกการประชุมสาธารณะที่กินเวลานาน 3 ชั่วโมง ให้กับโมเดลและขอให้มันดึงสาระสำคัญออกมา ผลการทดสอบแสดงให้เห็นว่าถึงแม้จะมีการพิมพ์ผิดหลายจุดในข้อความที่ยังไม่ได้ผ่านการตรวจทาน แต่อินเทิร์นแอลเอ็ม2 ก็สามารถดึงสาระสำคัญและสรุปประเด็นหลักของผู้บรรยายออกมาได้อย่างแม่นยำ
คณะนักพัฒนาตั้งเป้ายกระดับความสามารถในการจำลองภาษาของฐานโมเดลดังกล่าวด้วยการปรับปรุงคุณภาพคลังข้อมูลและความหนาแน่นของข้อมูลให้ดีขึ้น
ทั้งนี้ เซี่ยงไฮ้ อาทิฟิเชียล อินเทลลิเจนซ์ แลบบอราทอรี่ เผยว่าจะอนุญาตให้มีการนำอินเทิร์นแอลเอ็ม2 ไปใช้ในเชิงพาณิชย์โดยไม่มีค่าใช้จ่ายต่อไป