Google DeepMind เปิดตัว Genie 3 โมเดล AI สร้างโลกเสมือนจริงแบบเรียลไทม์

Google DeepMind ได้เปิดตัว Genie 3 ที่พัฒนาต่อยอดจาก Genie 3 ซึ่งเป็นโมเดลปัญญาประดิษฐ์ (AI) ประเภทโมเดลโลก (World Model) รุ่นล่าสุด ที่สามารถสร้างและจำลองสภาพแวดล้อมเสมือนจริงได้อย่างสมจริงและโต้ตอบได้ทันที (Real-time) ถือเป็นก้าวสำคัญในการพัฒนา AI และอาจนำไปสู่ปัญญาประดิษฐ์ทั่วไป (AGI) ในอนาคต
Genie 3 คืออะไร ?
Genie 3 คือ AI ที่สามารถสร้างโลกเสมือนจริงขึ้นมาจากคำสั่งง่าย ๆ และให้ผู้ใช้หรือ AI อื่น ๆ เรียกว่า "เอเจนต์" เข้าไปโต้ตอบได้แบบเรียลไทม์ แตกต่างจากรุ่นก่อนๆ ที่เน้นการสร้างวิดีโอ Genie 3 มุ่งเน้นไปที่การสร้างประสบการณ์ที่ต่อเนื่องและสมจริง ทำให้เอเจนต์สามารถเรียนรู้และทดลองในสภาพแวดล้อมที่หลากหลายได้อย่างไม่จำกัด
ความสามารถหลักของ Genie 3
รองรับการโต้ตอบแบบเรียลไทม์ ผู้ใช้สามารถควบคุมการเคลื่อนไหวและมุมมองในโลกที่สร้างขึ้นได้อย่างอิสระและทันที เหมือนกับการเล่นเกม
ความสมจริงและความต่อเนื่อง โดยโลกที่สร้างขึ้นมีความต่อเนื่องทางกายภาพสูง แม้จะผ่านไประยะหนึ่งแล้วกลับมาดูที่เดิม สภาพแวดล้อมยังคงเหมือนเดิม ไม่เกิดความผิดเพี้ยนง่ายๆ
สร้างปรากฏการณ์ธรรมชาติและแฟนตาซี เช่น ความสามารถจำลองได้ตั้งแต่ระบบนิเวศที่ซับซ้อน เช่น พฤติกรรมสัตว์ ป่าไม้ ไปจนถึงการสร้างโลกแฟนตาซีและตัวละครแอนิเมชันตามจินตนาการ
ควบคุมเหตุการณ์ในโลก (World Events) ผู้ใช้สามารถใช้คำสั่งข้อความเพื่อเปลี่ยนแปลงสิ่งต่าง ๆ ในโลกได้ทันที เช่น การเปลี่ยนสภาพอากาศเป็นฝนตก หรือ "สร้างรถยนต์ขึ้นมา
สำรวจสถานที่และประวัติศาสตร์สามารถสร้างสภาพแวดล้อมจากยุคสมัยและสถานที่ต่างๆ ทั่วโลก เพื่อการเรียนรู้และสำรวจ
เป้าหมายและการประยุกต์ใช้
สนามฝึกซ้อมสำหรับปัญญาประดิษฐ์ Genie 3 เป็นเครื่องมือสำคัญในการฝึกฝนเอเจนต์ AI เช่น SIMA เอเจนต์อเนกประสงค์ของ Google ให้เรียนรู้การทำภารกิจที่ซับซ้อนในสภาพแวดล้อมที่หลากหลายและคาดเดาไม่ได้
เส้นทางสู่ AGI การที่ AI สามารถเข้าใจและจำลองโลกได้ จะเป็นพื้นฐานสำคัญในการพัฒนาปัญญาประดิษฐ์ทั่วไปที่มีความสามารถทัดเทียมมนุษย์
โอกาสทางการศึกษาและสื่อสร้างสรรค์ สามารถนำไปใช้สร้างสื่อการเรียนรู้แบบโต้ตอบ หรือเป็นเครื่องมือสำหรับนักสร้างสรรค์ในการสร้างผลงานรูปแบบใหม่ๆ
ข้อจำกัดในปัจจุบันของ Genie 3
การสร้างภาพและช่วยเหลือของเอเจนต์ยังมีจำกัด โดยเอเจนต์ยังไม่สามารถโต้ตอบกับวัตถุทุกอย่างในโลกได้อย่างอิสระ
การจำลองตำแหน่งจริงยังไม่แม่นยำ เอเจนต์ยังไม่สามารถสร้างสถานที่จริงบนโลกได้อย่างสมบูรณ์แบบ
ระยะเวลาโต้ตอบจำกัด ปัจจุบันรองรับการโต้ตอบต่อเนื่องได้เพียงไม่กี่นาที
อย่างไรก็ตาม Google DeepMind ตระหนักถึงความท้าทายด้านความปลอดภัยและความรับผิดชอบ จึงได้เปิดให้กลุ่มนักวิจัยและนักสร้างสรรค์จำนวนจำกัดได้ทดลองใช้ก่อน เพื่อรวบรวมความคิดเห็นและพัฒนาระบบบรรเทาความเสี่ยงต่างๆ ก่อนที่จะเปิดให้ใช้งานในวงกว้างต่อไปในอนาคต
Tag
ยอดนิยมในตอนนี้
