Google เปิดตัว “Gemini Omni” AI สร้างวิดีโอสุดล้ำ แก้ฉาก เปลี่ยนโลก และสร้างอวตารได้จากทุกอินพุต

ในงาน Google I/O กูเกิลได้เอาใจเหล่านักสร้างสรรค์ AI ด้วยการเปิดตัวโมเดลใหม่อย่างเป็นทางการในชื่อ "Gemini Omni" โดยกูเกิลระบุว่าโมเดลใหม่นี้สามารถสร้างสรรค์ผลงานได้ทุกสิ่งจากทุกอินพุต โดยเริ่มต้นที่วิดีโอ ซึ่งรุ่นแรกที่ใช้ชื่อว่า Gemini Omni Flash ได้เริ่มเปิดให้ใช้งานแล้วตั้งแต่วันนี้
Gemini Omni ถือ เป็นการยกระดับขึ้นไปอีกขั้นจากโมเดล Nano Banana และเครื่องมือสร้างวิดีโอตัวเดิมอย่าง Veo 3.1 โดยอนุญาตให้ผู้ใช้ผสมผสาน รูปภาพ เสียง วิดีโอ และข้อความเข้าด้วยกันเป็นอินพุต เพื่อสร้างวิดีโอคุณภาพสูงที่อิงจากฐานความรู้บนโลกความเป็นจริงของ Gemini
ผู้ใช้สามารถพิมพ์แชทสั่งแก้ไขวิดีโอได้เหมือนพูดคุยปกติ ระบบจะจดจำคำสั่งก่อนหน้าเพื่อให้ตัวละครและฉากมีความต่อเนื่อง ซึ่งพัฒนาขึ้นจากรุ่น Veo 3.1 ที่ทำได้แค่สร้างวิดีโอจากข้อความและรูปภาพเท่านั้น
ความสามารถที่น่าทึ่ง คือ ผู้ใช้สามารถนำวิดีโอที่ถ่ายไว้มาเป็นจุดเริ่มต้น แล้วสั่งให้ Omni เปลี่ยนแปลงสิ่งที่เกิดขึ้นได้ตามต้องการ เช่น แก้ไขการเคลื่อนไหว เพิ่มตัวละครหรือวัตถุใหม่ เปลี่ยนสภาพแวดล้อม เปลี่ยนมุมกล้อง ตลอดจนเปลี่ยนรายละเอียดหรือสไตล์ของวิดีโอ
นอกจากนี้ ตัวโมเดลยังได้รับการพัฒนาให้เข้าใจแรงทางฟิสิกส์ต่างๆ เช่น แรงโน้มถ่วง พลังงานจลน์ และพลศาสตร์ของไหลได้ดียิ่งขึ้น เพื่อให้ฉากต่าง ๆ มีความสมจริง โดยจะทำงานร่วมกับความรู้ของ Gemini ทั้งในด้านประวัติศาสตร์ วิทยาศาสตร์ และบริบททางวัฒนธรรมเพื่อการเล่าเรื่องที่มีความหมาย
สำหรับผู้ที่ต้องการเป็นตัวเอกในผลงานของตนเอง Omni ยังมีฟีเจอร์ที่ให้ผู้ใช้สร้างอวตารดิจิทัล (Digital Avatar) ที่มีหน้าตาและเสียงพูดเหมือนตัวเอง โดยอิงจากเสียงของผู้ใช้งาน อย่างไรก็ตามในระยะแรกระบบจะรองรับเฉพาะการอ้างอิงจากเสียงเป็นเอาต์พุตเสียงเท่านั้น เพื่อตอบสนองต่อความกังวลด้านความเป็นส่วนตัวและการใช้งานในทางที่ผิด Google ได้ระบุว่ามีนโยบายที่ชัดเจนเพื่อปกป้องผู้ใช้จากอันตราย
โดยวิดีโอทุกชิ้นที่สร้างขึ้นด้วย Gemini Omni จะถูกฝัง SynthID ซึ่งเป็นลายน้ำดิจิทัลที่มองไม่เห็น เพื่อใช้ตรวจสอบยืนยันว่าวิดีโอนั้นสร้างจาก AI ขณะเดียวกัน กูเกิลกำลังอยู่ระหว่างการทดสอบฟังก์ชันสำหรับการแก้ไขเสียงและคำพูดในวิดีโอ เพื่อให้มั่นใจว่าจะถูกนำไปใช้อย่างมีความรับผิดชอบ
ในตอนนี้ Gemini Omni ได้เปิดให้ผู้ใช้ที่สมัครสมาชิก Google AI Plus, Pro และ Ultra ทุกคนทั่วโลกสามารถเข้าใช้งานได้แล้ว รวมไปถึงแพลตฟอร์มต่างๆ อย่างแอป Gemini และ Google Flow โดยจะทยอยเปิดตัวให้กับผู้ใช้งาน YouTube Shorts และแอป YouTube Create เริ่มตั้งแต่สัปดาห์นี้เป็นต้นไป
Tag
ยอดนิยมในตอนนี้
