รีเซต

กูเกิลพัฒนา AI “DolphinGemma” ก้าวแรกสู่การสื่อสารกับโลมา

กูเกิลพัฒนา AI “DolphinGemma” ก้าวแรกสู่การสื่อสารกับโลมา
TNN ช่อง16
16 เมษายน 2568 ( 00:07 )
11

วันที่ 14 เมษายนที่ผ่านมา เนื่องในวันโลมาแห่งชาติ (National Dolphin Day) กูเกิล (Google) ประกาศความก้าวหน้าครั้งสำคัญในโครงการ DolphinGemma ระบบปัญญาประดิษฐ์ (AI) รุ่นใหม่ที่ออกแบบมาเพื่อวิเคราะห์เสียงและรูปแบบการสื่อสารตามธรรมชาติของโลมา 

กูเกิล (Google) ร่วมมือกับนักวิจัยจากสถาบันเทคโนโลยีจอร์เจีย (Georgia Tech) และโครงการ Wild Dolphin Project (WDP) ที่ดำเนินการศึกษาชีวิตโลมาแอตแลนติกจุดแต้ม (Atlantic spotted dolphin) ในน่านน้ำบาฮามาสมายาวนานกว่า 40 ปี

วิทยาศาสตร์เบื้องหลังเสียงของโลมา

WDP เป็นโครงการศึกษาชีวิตโลมาใต้น้ำแบบไม่ล่วงล้ำหรือรบกวนการดำรงชีวิตของโลมา ซึ่งทีมงานได้ใช้วิธีรวบรวมข้อมูลภาพและเสียงตลอดหลายทศวรรษ โดยเชื่อมโยงเสียงแต่ละแบบกับพฤติกรรมของโลมาที่มีตัวตนชัดเจน เช่น

1. เสียงหวีดเฉพาะตัว (Signature whistles) ใช้เรียกหากันระหว่างแม่และลูก
2. เสียงกระตุก (Burst-pulse squawks) ปรากฏระหว่างการต่อสู้
3. เสียงคลิกแบบเร่ง (Buzzing clicks) ใช้ในการเกี้ยวพาราสีหรือไล่ฉลาม

ข้อมูลเชิงลึกเหล่านี้มีความสำคัญอย่างยิ่งต่อการเข้าใจโครงสร้างและความหมายที่อาจแฝงอยู่ในระบบการสื่อสารของโลมา ซึ่งเป็นรากฐานในการพัฒนา AI สำหรับวิเคราะห์ภาษาโลมา

โดเดล DolphinGemma: AI ฟังเสียงโลมา

DolphinGemma คือ โมเดลปัญญาประดิษฐ์ AI ที่ใช้เทคโนโลยีเสียงของกูเกิล โดยอาศัย SoundStream tokenizer เทคโนโลยีของกูเกิลที่ใช้ในการแปลงสัญญาณเสียง (Audio waveform) และโครงสร้างโมเดลสำหรับการจัดการข้อมูลตามลำดับ (Sequence modeling) ขนาดประมาณ 400 ล้านพารามิเตอร์ ซึ่งสามารถทำงานบนสมาร์ตโฟน Pixel ของกูเกิล (Google) ได้โดยตรง

โมเดลนี้สามารถวิเคราะห์เสียงของโลมาตามธรรมชาติ เพื่อค้นหารูปแบบ ซ้ำ และลำดับของเสียงที่อาจมีความหมาย โดยใช้หลักการคล้ายกับโมเดลภาษาสำหรับมนุษย์ เช่น การคาดการณ์คำถัดไปในประโยค

WDP เริ่มนำโมเดล DolphinGemma ไปใช้ในฤดูกาลภาคสนามล่าสุด โดยคาดว่าจะช่วยลดภาระของนักวิจัย และอาจนำไปสู่การสร้าง “พจนานุกรมร่วม” ระหว่างมนุษย์กับโลมาในอนาคต

การสื่อสารแบบสองทางในท้องทะเล

นอกจากการวิเคราะห์เสียงธรรมชาติ WDP ยังพัฒนาเครื่องมือสื่อสารแบบสองทางภายใต้ชื่อ CHAT (Cetacean Hearing Augmentation Telemetry) โดยร่วมมือกับ Georgia Tech เป้าหมายของ CHAT คือ การสร้างคำศัพท์ร่วมโดยใช้เสียงนกหวีดสังเคราะห์แทนวัตถุที่โลมาสนใจ เช่น หญ้าทะเลหรือของเล่น

ระบบจะตรวจจับเสียงที่โลมาเลียนแบบในเวลาจริง แจ้งให้นักวิจัยทราบผ่านหูฟังที่ใช้งานใต้น้ำได้ และให้นักวิจัยตอบสนองด้วยวัตถุประสงค์ที่สอดคล้องกัน โดยใช้ Pixel 6 และในอนาคต Pixel 9 ที่จะสามารถประมวลผลโมเดลปัญญาประดิษฐ์ AI ได้ในตัวแบบเรียลไทม์

การใช้สมาร์ตโฟน Pixel ช่วยลดความซับซ้อนของฮาร์ดแวร์ ลดต้นทุน ขนาด และการใช้พลังงาน ซึ่งเหมาะสมกับการใช้งานในมหาสมุทรอย่างมาก


เตรียมเปิดโมเดลสู่ชุมชนวิทยาศาสตร์

กูเกิลวางแผนเปิดให้ใช้งานโมเดล DolphinGemma แบบโอเพ่นซอร์ส หรือการเปิดให้นักพัฒนาทั่วโลกมีส่วนร่วมกับทีมงานในช่วงฤดูร้อนนี้ แม้โมเดลจะฝึกจากเสียงโลมาแอตแลนติกจุดแต้ม แต่สามารถนำไปปรับแต่ง (Fine-tune) ให้ใช้กับสายพันธุ์อื่นได้ เช่น โลมาปากขวดหรือโลมากระโดด

คาดว่าความก้าวนี้จะเปิดทางให้นักวิจัยทั่วโลกเข้าถึงเครื่องมือวิเคราะห์ข้อมูลเสียงสัตว์น้ำของตนเอง ช่วยเร่งความเข้าใจภาษาสัตว์น้ำ และสร้างสะพานเชื่อมการสื่อสารระหว่างสปีชีส์ในอนาคต

“จากเดิมที่เราเพียงรับฟัง วันนี้เรากำลังเริ่มเข้าใจโลมา และอาจใกล้วันสื่อสารกันได้จริง”

ยอดนิยมในตอนนี้

แท็กยอดนิยม

ข่าวที่เกี่ยวข้อง