AI เตรียมบ้าคลั่ง ? เมื่อเปิดตัวชิป AI ที่เร็วที่สุดในโลก
AI ยังคงเป็นกระแสหลักที่อยู่ในความสนใจ และล่าสุดดูเหมือนว่าปัญญาประดิษฐ์อาจจะเก่งขึ้นอย่างก้าวกระโดด เพราะล่าสุดบริษัทพัฒนาคอมพิวเตอร์และปัญญาประดิษฐ์ (AI) สัญชาติอเมริกันอย่าง เซเรบราส ซิสเท็มส์ (Cerebras Systems) ได้เปิดตัวชิป AI ที่เร็วที่สุดในโลก ชื่อเวเฟอร์ สเกล เอนจิน 3 (Wafer Scale Engine 3 หรือ WSE-3) ซึ่งนำไปใช้ขับเคลื่อนซูเปอร์คอมพิวเตอร์ AI ที่ชื่อเซเรบราส ซีเอส 3 (Cerebras CS-3) โดยสามารถผลักดันศักยภาพให้มีความเร็วถึง 125 petaFLOPS (หน่วยวัดความเร็วของคอมพิวเตอร์ FLOPS ย่อมาจาก floating-point operations per second ส่วน peta คือคำอุปสรรค มีค่า 10 ยกกำลัง 15 หรือ พันล้านล้าน) และสามารถปรับขนาดได้จนถึงระดับที่สื่ออย่างนิวแอตลาส (NewAtlas) เรียกได้ว่า “บ้าคลั่ง”
ทั้งนี้ ก่อนที่ AI จะสามารถตอบคำถาม หรือสร้างวิดีโอเล็ก ๆ น้อย ๆ สักชิ้นได้ตามคำสั่ง มันต้องได้รับการฝึกจากชุดข้อมูลจำนวนมหาศาล ยกตัวอย่างเช่นคลิปวิดีโอแมวปลุกเจ้าของ ที่สร้างโดย AI ชื่อโซระ (Sora) ของโอเพ่นเอไอ (OpenAI) นั้นคาดว่าใช้พลังงานมากกว่า 100 ครัวเรือนในการฝึกเลยทีเดียว แต่ชิปใหม่และซูเปอร์คอมพิวเตอร์ที่ใช้ชิปใหม่นี้ จะมีประสิทธิภาพสูงขึ้นจนสามารถช่วยเร่งกระบวนการให้เสร็จเร็วขึ้น และนำไปสู่การลดการใช้พลังงานด้วย
ชิป WSE-3 แต่ละตัวมีขนาดประมาณกล่องพิซซ่า แต่สามารถบรรจุทรานซิสเตอร์จำนวน 4 ล้านล้านตัวได้ ให้ประสิทธิภาพดีขึ้นประมาณ 2 เท่าของรุ่นก่อนหน้าที่บริษัทพัฒนาคือ WSE-2 ซึ่งก่อนหน้านี้ก็เป็นเจ้าของสถิติโลกชิปคอมพิวเตอร์ที่เร็วที่สุดมาก่อนด้วย ในขณะเดียวกันชิป WSE-3 ก็ใช้ต้นทุนและใช้พลังงานเท่าเดิม เมื่อรวมสิ่งเหล่านี้เข้ากับการทำงานของซูเปอร์คอมพิวเตอร์ CS-3 มันสามารถลดขนาดการใช้พื้นที่ลงได้ จากห้องที่เต็มไปด้วยเซิร์ฟเวอร์ต่าง ๆ สามารถลดลงเหลือประมาณตู้เย็นขนาดเล็ก ๆ เท่านั้น
บริษัท Cerebras บอกว่า CS-3 ใช้งานหน่วยประมวลผลเฉพาะสำหรับ AI (AI Core) จำนวน 900,000 ตัว บนชิป SRAM 44 GB จึงทำให้สามารถสร้างความเร็วประสิทธิภาพงาน AI ได้สูงสุดถึง 125 petaFLOPS ตามทฤษฎีแล้ว นี่น่าจะเพียงพอที่จะติด 1 ใน 10 ซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลก แต่มันยังไม่ได้ทดสอบกับเกณฑ์มาตรฐานอื่น ๆ จึงยังไม่ได้รับการจัดอันดับ ปัจจุบันซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกคือ ฟรอนเทียร์ (Frontier) ตั้งอยู่ที่ศูนย์คอมพิวเตอร์ผู้นำโอ๊คริดจ์ สหรัฐอเมริกา ความเร็ว 1,194 petaFLOPS
ด้านหน่วยความจำภายนอกมี 3 ขนาดคือ 1.5TB, 12TB และ 1.2PB ทำให้ซูเปอร์คอมพิวเตอร์สามารถฝึกโมเดล AI ที่เกี่ยวข้องกับพารามิเตอร์ได้มากถึง 24 ล้านล้านพารามิเตอร์ เมื่อเปรียบเทียบแล้ว โมเดล AI ส่วนใหญ่ในปัจจุบันมีพารามิเตอร์ประมาณ 1 พันล้านพารามิเตอร์ ยกตัวอย่าง GPT-4 ของบริษัท OpenAI คาดว่ามีพารามิเตอร์ประมาณ 1.8 ล้านล้านพารามิเตอร์ ดังนั้น CS-3 จึงควรจะสามารถฝึกโมเดลที่มีพารามิเตอร์ 1 ล้านล้านพารามิเตอร์ได้อย่างง่ายดายมาก ๆ ซึ่งสิ่งที่ทำให้ CS-3 เป็นซูเปอร์คอมพิวเตอร์ที่ทรงพลังก็เพราะขับเคลื่อนด้วยชิป WSE-3 นี่เอง ทั้งนี้ CS-3 ถูกออกแบบมาให้สามารถปรับขนาดได้ สามารถรวมกลุ่มกันได้มากถึง 2048 ยูนิต เป็นซูเปอร์คอมพิวเตอร์เครื่องเดียวที่แทบจะหยั่งรู้ได้ สามารถรองรับ exaFLOPS ได้ถึง 256 ตัว เทียบกับปัจจุบันที่ซูเปอร์คอมพิวเตอร์ตัวเก่ง ๆ ของโลก สามารถรองรับได้ประมาณ 1 ตัวกว่า ๆ เท่านั้นเอง ดังนั้นจึงถือว่าทรงพลังมาก บริษัทอ้างว่าพลังดังกล่าวจะช่วยให้สามารถฝึกโมเดล Llama 70B ตั้งแต่เริ่มต้นได้เสร็จภายในเวลาเพียงวันเดียวเท่านั้น
การเกิดขึ้นของ WSE-3 ทำให้เรามองเห็นว่า AI นั้นมีการพัฒนาอย่างต่อเนื่องและเป็นการพัฒนาที่ก้าวกระโดด ชวนให้จินตนาการว่า AI ในอนาคตนั้นจะเป็นอย่างไร
ที่มาข้อมูล NewAtlas, Cerebras
ที่มารูปภาพ Cerebras