Boston Dynamics จับมือ TRI ยกระดับหุ่นยนต์ฮิวแมนนอยด์ Atlas ด้วย AI อเนกประสงค์

บริษัท Boston Dynamics และสถาบันวิจัยโตโยต้า (Toyota Research Institute - TRI) กำลังพัฒนาหุ่นยนต์ฮิวแมนนอยด์ Atlas ภายใต้แนวทางใหม่ที่เน้นความสามารถอเนกประสงค์และคล่องแคล่วสูงสุด เป้าหมาย คือ การสร้างหุ่นยนต์ที่สามารถรับมือกับวัตถุหลากหลายประเภท ไม่ว่าจะเป็นของแข็ง ของอ่อน หนักหรือเบา ไปจนถึงการปรับท่าทางร่างกายเพื่อรักษาสมดุลและรับมือกับสถานการณ์ไม่คาดคิด
หัวใจสำคัญของโครงการคือการพัฒนา แบบจำลองพฤติกรรมขนาดใหญ่ (Large Behavior Model - LBM) ซึ่งเป็นนโยบายอิงภาษาแบบ end-to-end ช่วยให้ Atlas เข้าใจและปฏิบัติงานจากคำสั่งภาษาธรรมชาติได้โดยตรง
ความร่วมมือนี้ครอบคลุมระบบควบคุมระยะไกล (Teleoperation) ที่ใช้ VR และตัวควบคุมเชิงพยากรณ์ (MPC) กับการเรียนรู้ของเครื่อง ทำให้สามารถเก็บข้อมูลคุณภาพสูงจากทั้งฮาร์ดแวร์จริงและการจำลอง ก่อนนำมาฝึกอบรมเครือข่ายประสาทและทดสอบอย่างเป็นระบบ
หลักการทำงาน Boston Dynamics และ TRI
1. การครอบคลุมงานให้มากที่สุด ผ่านระบบ Teleoperation ที่ผสาน VR และ MPC ช่วยให้ Atlas แสดงพฤติกรรมตั้งแต่การหยิบสิ่งเล็กน้อยไปจนถึงการเคลื่อนไหวทั้งร่างกาย
2. การฝึกอบรมนโยบายทั่วไป ที่ไม่จำกัดเฉพาะงานเดี่ยว แต่สามารถสรุปผลจากคลังข้อมูลงานจำนวนมากและประยุกต์ใช้ข้ามรูปแบบการใช้งานได้
3. การสร้างโครงสร้างพื้นฐานที่รองรับการวนซ้ำรวดเร็ว โดยอาศัยทั้งการจำลองและการทดสอบบนฮาร์ดแวร์ เพื่อเปรียบเทียบนโยบายและพัฒนาสมรรถนะอย่างต่อเนื่อง
ความก้าวหน้าล่าสุดถูกนำเสนอผ่านงาน “Spot Workshop” ซึ่งแสดงให้เห็นว่า Atlas สามารถจัดการงานหลายขั้นตอนแบบต่อเนื่อง ตั้งแต่การยกขาตั้งจากรถเข็นไปวางบนชั้น การย้ายชิ้นส่วนลงถังขยะ ไปจนถึงการเคลียร์พื้นที่ทั้งหมด โดยนโยบายภาษาเดียวควบคุมทั้งกระบวนการแบบ end-to-end พร้อมทั้งตอบสนองต่อความผิดพลาด เช่น การหยิบพลาดหรือวัตถุตกพื้น
กระบวนการทำงานของหุ่นยนต์
1. รวบรวมข้อมูลพฤติกรรมที่เป็นรูปธรรมโดยใช้การควบคุมจากระยะไกลทั้งบนฮาร์ดแวร์หุ่นยนต์จริงและในการจำลอง
2. ประมวลผล ใส่คำอธิบายประกอบ และจัดการข้อมูลเพื่อให้เราสามารถรวมเข้าในขั้นตอนการเรียนรู้ของเครื่องได้อย่างง่ายดาย
3. การฝึกอบรมนโยบายเครือข่ายประสาทโดยใช้ข้อมูลทั้งหมด จากงานทั้งหมด
4. ประเมินนโยบายโดยใช้ชุดงานทดสอบ
กระบวนการทำงานทั้ง 4 ขั้นตอนนี้ เป็นแนวทางในการตัดสินใจว่าจะรวบรวมข้อมูลเพิ่มเติมใด และสถาปัตยกรรมเครือข่ายหรือกลยุทธ์ใดที่จะนำไปสู่ประสิทธิภาพการทำงานที่ดีขึ้น
ที่มาของภาพ Boston Dynamics
นอกจากนี้ Atlas ยังแสดงความสามารถใหม่ ๆ เช่น การผูกเชือก คลี่และพับผ้า ควบคุมยางรถยนต์หนัก 22 ปอนด์ ซึ่งล้วนเป็นงานที่ยากต่อการเขียนโปรแกรมแบบเดิม แต่ LBM ทำให้หุ่นยนต์เรียนรู้ได้จากเพียงการสาธิต กระบวนการนี้ยังเปิดโอกาสให้นักพัฒนาที่ไม่ใช่วิศวกรมืออาชีพสามารถสร้างพฤติกรรมใหม่ ๆ ให้ Atlas ได้ง่ายขึ้น
อีกหนึ่งคุณสมบัติเด่นคือการ เร่งความเร็วการทำงาน ได้ 1.5-2 เท่า โดยไม่กระทบคุณภาพการควบคุม ทั้งบนแพลตฟอร์ม Atlas และ Atlas MTS ซึ่งใช้ส่วนบนของร่างกายเป็นหลัก การใช้ Teleoperation ร่วมกับ VR ยังช่วยให้ผู้ควบคุมมองเห็นสิ่งแวดล้อมในมุมมองหุ่นยนต์แบบ 3 มิติ ทำให้สามารถควบคุมงานละเอียดและใช้สองมือได้อย่างเป็นธรรมชาติ
แอปพลิเคชันควบคุมระยะไกล VR เวอร์ชันแรกใช้ชุดหูฟัง ที่มาของภาพ Boston Dynamics
การฝึกควบคุมระยะไกล
การจำลอง (Simulation) เป็นอีกองค์ประกอบที่ช่วยให้การฝึกและการทดสอบรวดเร็วและประหยัดต้นทุน โดยจำลองฮาร์ดแวร์และซอฟต์แวร์ได้อย่างใกล้เคียงจริง ทำให้ทีมงานสามารถแบ่งปันโค้ด ข้อมูล และการทดสอบระหว่างโลกเสมือนกับหุ่นยนต์จริงได้อย่างราบรื่น
Boston Dynamics และ TRI ยืนยันว่าผลการทดลองยืนยันถึงศักยภาพของนโยบายอิงภาษาที่สามารถทำงานมัลติทาสก์และปรับตัวได้ดี แม้จะมีความก้าวหน้าแล้ว แต่ทีมงานยังคงมุ่งพัฒนาต่อไป ทั้งด้านการเพิ่มขอบเขตงาน ความยาก และคุณภาพของข้อมูล
รวมถึงการทดลองอัลกอริทึมใหม่ ๆ และการผสานแหล่งข้อมูลที่หลากหลาย เพื่อผลักดันให้หุ่นยนต์ฮิวแมนนอยด์ก้าวสู่การใช้งานจริงในระดับอุตสาหกรรมและระบบอัตโนมัติขนาดใหญ่
Tag
ยอดนิยมในตอนนี้
