Tesla อัพเดตความคืบหน้าของ Dojo ซูเปอร์คอมพิวเตอร์ที่บริษัทออกแบบเองเพื่อเทรน AI ที่ใช้ในระบบขับขี่อัตโนมัติ และเปิดตัวต่อสาธารณะครั้งแรกช่วงกลางปี 2021
Tesla บอกว่าเมื่อขนาดของโมเดลใหญ่ขึ้นเรื่อยๆ จนไม่มีเครื่องขนาดใหญ่มากพอที่จะรัน ทางออกเดียวคือการสร้างเครื่องคอมพิวเตอร์ที่ใหญ่มากพอขึ้นมาเอง
ซูเปอร์คอมพิวเตอร์ Dojo ถูกออกแบบมาใหม่ทั้งหมด ภายใต้วิสัยทัศน์ว่าต้องเป็นตัวเร่งการประมวลผล (accelerator) ผืนใหญ่ผืนเดียว (single scalable compute plane) ใช้ชิปออกแบบเองที่เรียกว่า D1 นำมาต่อกับ I/O + Power + Cooling กลายเป็น Training Tile ซึ่งบอกว่ามีพลังเท่ากับจีพียู 6 ชุดเลยทีเดียว
เมื่อได้ Training Tile แล้วก็นำมาประกอบกันเป็น System Tray (ถาดวางหน่วยประมวลผลระบบ) ไปเชื่อมกับ Interface Processor สำหรับการเชื่อมต่อพอร์ตภายนอก กลายเป็นหน่วยที่เรียกว่า Host Interface
สุดท้ายเมื่อนำมาต่อเป็นตู้ cabinet หลายๆ ตู้จะได้หน่วยประมวลผลที่เรียกว่า ExaPod มีสมรรถนะ 1.1 ExaFLOP
การออกแบบ Dojo เน้นการอัดหน่วยประมวลผลที่มีความหนาแน่น (density) สูง จึงต้องคิดเรื่องระบบจ่ายไฟ และระบบระบายความร้อนใหม่ทั้งหมด ระบบจ่ายไฟนั้นใช้ไฟฟ้าถึง 2 เมกะวัตต์ และตอนทดสอบจ่ายไฟครั้งแรกนั้น เทศบาลเมืองถึงกับต้องโทรมาหาเลยทีเดียว
Tesla บอกว่าจะเริ่มทดสอบ ExaPod ตัวแรกในไตรมาส 1/2023 และวางแผนจะมีทั้งหมด 7 ExaPod
ที่มา - Electrek
Comments
เก่งมาก น่าจะซีพียู มาแข่งกับ อินเทลนะ
D1 เป็น accelerator ครับ อธิบายง่ายๆ คือมาแทน GPU
ซีพียูยังใช้ x86 แต่ไม่บอกว่าค่ายไหน