NVIDIA เปิดตัวเซิร์ฟเวอร์ DGX-2 สำหรับงาน deep learning โดยเฉพาะ โดยภายในเซิร์ฟเวอร์เป็นการ์ด Tesla V100 รุ่นแรม 32GB สูงสุด 16 ชุด เชื่อมต่อกันด้วย NVIDIA NVSwitch อัตราการส่งต่อข้อมูล 2.4TB/s
พลังประมวลผลรวมของ DGX-2 สูงกว่า 2 petaFLOPS (สำหรับงาน deep learning ที่ precision ต่ำ) แรมของชิปกราฟิกทั้ง 16 ชุดจะมองเป็น memory space เดียวกันรวม 512GB ตัวซีพียูหลักใช้ Xeon Platinum สองชุด หน่วยความจำหลัก 1.5TB และ NVMe SSD อีก 30TB
หน่วยความจำขนาดใหญ่เปิดทางให้สามารถฝึกโมเดลสำหรับภาพความละเอียดสูง เช่น ResNet-152 สำหรับภาพขนาดใหญ่ หรือโหลดโมเดล FAIRSeq lสำหรับการแปลภาษาขึ้นไปไว้บนหน่วยความจำทั้งหมด ทำให้ลดเวลาการฝึกโมเดลลงมาก โดยใช้เวลาเพียง 2 วัน จากเดิมใช้มากกว่านี้สิบเท่า
ราคาเครื่องละประมาณ 400,000 ดอลลาร์
Comments
จะมีใครซื้อมา mining crypto ไหมน้าาาาาาา? อยากเห็น benchmark ^^
deep learning เร็ว != crypto mining แรง ครับ
"Those who make peaceful revolution impossible will make violent revolution inevitable." JFK.
ถูกต้องครับ Tesla เอามาขุดยังช้ากว่า Geforce อีก
พวกสกุลที่ hash กินแรมเยอะๆ สาย equihash น่าจะได้เปรียบพอสมควรครับ แต่ไม่แน่ใจว่าพารามิเตอร์ตัวไหนตั้งไว้ให้กินแรมเยอะขนาดนั้น
lewcpe.com, @wasonliw
Ram เยอะขนาดนี้น่าจะเทรนโมเดลใหญ่ๆ โดย batch size เพิ่มขึ้นได้เยอะเลย (ResNeXt) แต่ก็คงตกไปอยู่กับบริษัทใหญ่ๆที่มีกำลังเงินอยู่ดี
อยากเอามาลองสตรีมเกมหมากฮอสจัง จะลื่นหัวแตกไหม 5555
ไม่แพง สำหรับบริษัทใหญ่ๆ 12 ล้านเอง