Tesla เปิดตัวเครื่องซูเปอร์คอมพิวเตอร์ สร้างขึ้นมาเพื่อฝึก AI ระบบขับเคลื่อนอัตโนมัติโดยเฉพาะ
นงานสัมมนา 2021 Conference on Computer Vision and Pattern Recognition (CVPR) ที่ผ่านมา ทาง Andrej Karpathy หัวหน้าทีม AI ของบริษัท Tesla ได้ออกมาเปิดตัวซูเปอร์คอมพิวเตอร์ Dojo ที่ใช้อยู่ในบริษัทของ Tesla เอง ถูกออกแบบมาสำหรับใช้ฝึก AI ในระบบ Autopilot หรือระบบขับเคลื่อนอัตโนมัติ และถูกนำมาใช้ประมวลผลข้อมูลจากรถ Tesla ที่ปัจจุบันที่มีอยู่กว่า 1 ล้านคัน ให้สามารถประมวลได้ทันโดยเฉพาะ
ซูเปอร์คอมพิวเตอร์ Dojo ทำหน้าที่รวบรวมข้อมูลจากรถ Tesla ที่ใช้งานอยู่ โดยมันจะทำการรวบรวมข้อมูลที่ตัวรถคาดการณ์ว่าจะเกิดขึ้นทั้งหมด ส่งมาให้ยังศูนย์ข้อมูล เพื่อทำการบันทึกข้อผิดพลาดหรือการระบุที่ผิดพลาด ซึ่งทางวิศวกรของ Tesla จพนำข้อมูลเหล่านี้ไปสร้างเป็นระบบอบรมตัว AI ให้สามารถผ่านสถานการณ์ที่ยากและหลากหลายไปได้ ซึ่งนั่นทำให้รถ Tesla ต้องส่งข้อมูลประมาณ 1 ล้านคลิป คลิปละ 10 วินาที บันทึกที่ 36 เฟรมต่อวินาที รวมทั้งหมด 1.5 petabytes มาให้ศูนย์ข้อมูลเสมอ จากนั้นก็เอาข้อมูลไปให้ AI ฝึกจนไม่มีข้อผิดพลาด จึงส่งไปอัปเกรดที่ตัวรถต่อ
สเปคของ "ซูเปอร์คอมพิวเตอร์ Dojo"
- สมรรถนะ 1.8 ExaFLOPS หรือระดับเดียวกับซูเปอร์คอมพิวเตอร์อันดับที่ 5 ของโลกในปัจจุบัน (ยังไม่ถูกจัดอันดับอย่างเป็นทางการ)
- ใน 1 โหนดมี GPU ของ NVIDIA Ampere A100 รุ่นแรม 80GB อยู่ทั้งหมดจำนวน 8 ตัว โดยตัวซูเปอร์คอมพิวเตอร์มีจำนวนโหนดทั้งหมด 720 โหนด มี GPU รวมทั้งสิ้น 5,760 ตัว
- เหตุที่ต้องใช้ NVIDIA Ampere A100 เพราะเป็น GPU ที่ขับเคลื่อนโดย NVIDIA Ampere Architecture ทำให้ A100 มีประสิทธิภาพที่สูงกว่ารุ่นก่อนมากถึง 20 เท่า สามารถแบ่งพาร์ติชัน GPU ออกได้ 7 อินสแตนซ์ ทำให้สามารถปรับแต่งได้แบบไดนามิก ตามแต่การใช้งานที่เปลี่ยนไป
- พื้นที่ภายในเป็น NVME มีขนาดรวมทั้งหมด 10 PB
- สวิตช์ที่ใช้รองรับการส่งข้อมูล 640 Tbps
แหล่งที่มา blogs.nvidia.com