รีเซต

Google I/O 2024 เปิดตัว Project Astra ที่มาแข่งกับ GPT-4o ของ OpenAI และบริการอื่น ๆ จาก Gemini

Google I/O 2024 เปิดตัว Project Astra ที่มาแข่งกับ GPT-4o ของ OpenAI และบริการอื่น ๆ จาก Gemini
TNN ช่อง16
15 พฤษภาคม 2567 ( 03:26 )
55

ในงานประชุมนักพัฒนา Google I/O 2024 ได้เปิดตัว Gemini 1.5 Flash ที่มีพื้นฐานจาก Gemini 1.5 Pro แต่เน้นความคล่องตัวในด้านการประมวลผลมากขึ้น พร้อมนำไปพัฒนาโครงการแอสตรา (Project Astra) ที่สื่อตั้งข้อสังเกตว่าการใช้งานในลักษณะเดียวกันกับ GPT-4o ของ OpenAI


ความสามารถ Google Gemini ใน Project Astra

ในคลิปการสาธิตได้แสดงให้เห็นว่า Gemini สามารถอ่านข้อมูลจากภาพวิดีโอ ตอบกลับด้วยเสียงแบบทันที รวมถึงสามารถขัดจังหวะการตอบของ Gemini ได้ และอ่านข้อความที่เป็นโค้ดโปรแกรมจากกล้องสมาร์ตโฟนและแปลความหมายได้ทันที 


อย่างไรก็ตาม The Verge สื่อด้านเทคโนโลยีชื่อดัง ตั้งข้อสังเกตว่าการสาธิตของ Google ไม่ได้เป็นแบบ Live Demo เหมือนกับ OpenAI เมื่อวันที่ 14 พฤษภาคมที่ผ่านมา


การเปิดตัวความสามารถอื่น ๆ ของ Google Gemini

นอกจาก Project Astra แล้ว บริษัทยังได้พัฒนาบริการใหม่ ๆ ภายใต้โมเดล AI Gemini 1.5 Pro ดังนี้

1. AI Overviews ระบบการค้นหาที่เป็นระบบและลึกมากขึ้นด้วย AI ที่ Google เรียกว่า Search Generative Experiences หรือคำถามในรูปแบบที่มีความซับซ้อนและมีปฏิสัมพันธ์มากขึ้น เช่น การถามทริปท่องเที่ยว การช่วยวางแผนออกกำลังกาย โดย AI Overviews จะเริ่มให้บริการในสหรัฐอเมริกาเป็นเขตแรก และทยอยให้บริการในประเทศอื่น ๆ ต่อไป


2. Google Photo เปิดตัวฟีเชอร์ Ask Photos ที่นำเอา Gemini มาช่วยค้นหารูปภาพในแบบที่เจาะจงมากขึ้น เช่น การใช้ Ask Photos ค้นหาเลขป้ายทะเบียนรถยนต์ที่เคยถ่ายไว้ หรือแสดงภาพการฝึกว่ายน้ำของลูกสาวที่เคยถ่ายเอาไว้ทั้งหมด


3. Google Workspace เปิดตัวฟีเชอร์สรุปอีเมลจำนวนมากออกมาเป็นรายการสิ่งที่ต้องทำ (Task) ใน Gmail และสรุปใจความสำคัญจากการประชุมผ่าน Google Meet


4. Google Agents ระบุว่า หากเราซื้อรองเท้าผิดคู่ ผิดไซส์ AI Agents จะทำเรื่องคืนให้เองโดยไม่ต้องเสียเวลาไปกับขั้นตอนการคืนสินค้า


5. Google Imagen 3 ปรับปรุงการสร้างภาพ (Generate) ให้ละเอียดและสมจริงมากขึ้น พร้อมรองรับคำสั่ง (Prompt) ที่เป็นธรรมชาติในแบบที่มนุษย์เขียนมากขึ้น


6. Music AI Sandbox บน Youtube จะเข้ามาช่วยสร้างเสียงเพลงสำหรับผู้สร้างเนื้อหาบน Youtube


7. Veo บริการสร้างวิดีโอด้วยคำสั่ง (Prompt) ที่ปรับแต่งได้ โดยสร้างวิดีโอในรูปแบบภาพยนตร์ที่มีความละเอียดสูงสุด 1080p ซึ่งเชื่อว่าเปิดตัวมาเพื่อแข่งกับ Sora ของ OpenAI


8. Google Search นำ Gemini มาใช้ยกระดับการค้นหาบน Google เช่น เมื่อค้นหาคำว่า "สตูดิโอพิลาทิส" นอกจากจะขึ้นข้อมูลตำแหน่งสถานที่ที่ตรงกับการค้นหาแล้ว ยังค้นหาสตูดิโอที่เปิดสอน และช่วงเวลาที่เปิดสอน รวมถึงวิธีการจองคลาสเรียนในคำเดียว


ทั้งนี้ ตลอดการนำเสนองาน Google I/O ตั้งแต่เวลา 0.00 - 1.51 น. ตามเวลาประเทศไทย Google ได้ให้ผู้ร่วมงานทายจำนวนครั้งที่การนำเสนอพูดคำว่า "AI" ก่อนจะเฉลยโดยซุนดรา พิชัย (Sundra Pichai) ประธานเจ้าหน้าที่บริหารของกูเกิลเองว่าพูดคำว่า "AI" ไปทั้งหมด 121 ครั้ง แต่หลังจากสรุปแล้วก็ยังมีการเอ่ยคำว่า "AI" ด้วย




ภาพจาก Google

ยอดนิยมในตอนนี้

แท็กยอดนิยม

ข่าวที่เกี่ยวข้อง