Tags:
Node Thumbnail

Meta เปิดตัวชิปเร่งการประมวลผล AI รุ่นแรกของบริษัท ใช้ชื่อว่า MTIA v1 ย่อมาจาก Meta Training and Inference Accelerator

Meta ให้เหตุผลว่างานประมวลผล AI ของบริษัทในปัจจุบัน โดยเฉพาะงานกลุ่ม recommendation ในบริการโซเชียลต่างๆ ไม่ได้เหมาะกับ GPU มากนัก จึงออกแบบชิป ASIC ขึ้นมาใหม่ให้สอดคล้องกับโมเดล recommendation ของบริษัทเอง และเน้นการปรับแต่งมาเพื่อ PyTorch ซึ่งเป็นไลบรารีประมวลผล AI ที่เกิดจาก Meta ด้วย

No Description

MTIA เป็นชิป ASICS แบบคัสตอมที่ Meta ออกแบบเองมาตั้งแต่ปี 2020 (แต่เพิ่งเปิดตัวต่อสาธารณะวันนี้) ใช้กระบวนการผลิต 7nm TSMC, สัญญาณนาฬิกา 800MHz, สมรรถนะ 102.4 TOPS (INT8) หรือ 51.2 TFLOPS (FP16) มีอัตราการใช้พลังงาน TDP 25W

ชิป MTIA ประกอบด้วยหน่วยย่อยเรียกว่า processing element (PE) จำนวนรวม 64 ตัว วางแบบตาราง 8x8 เชื่อมกันแบบ mesh network ยืดหยุ่นต่อการจัดกลุ่ม PE ต่องานแต่ละขนาด, PE แต่ละตัวมี 2 คอร์ เป็นชิปสถาปัตยกรรม RISC-V แบบคัสตอม โดย 1 คอร์จะมีส่วนขยายประมวลผลแบบเวกเตอร์ด้วย, PE แต่ละตัวมี SRAM ขนาดเล็ก 128KB สำหรับเก็บข้อมูลเรียกใช้งานรวดเร็ว

ในชิปยังมีแรม SRAM ขนาด 128MB แชร์กันระหว่าง PE ทุกตัว, แรมนอกชิปเป็น LPDDR5 ขนาดรวม 128GB

No Description

ชิป MTIA แต่ละตัวจะถูกนำมาติดตั้งบนบอร์ด M.2 เพื่อเสียบเข้ากับเซิร์ฟเวอร์ที่มีซีพียูหลักผ่าน PCIe Gen4 โดยตัวบอร์ด MTIA ใช้พลังงานเพียง 35W, เซิร์ฟเวอร์หนึ่งตัวมีชิป MTIA รวม 12 ตัว โดยเชื่อมต่อ MTIA ของแต่ละเครื่องโดยตรงได้ผ่านสวิตช์ PCIe เพื่อไม่ให้ทราฟฟิกต้องวิ่งผ่านซีพียูเสมอไป

No Description

ซอฟต์แวร์ของ MTIA ปรับแต่งมาเพื่อ PyTorch โดยเฉพาะ ทีมพัฒนาซอฟต์แวร์ได้สร้างตัวรันไทม์ของ PyTorch ที่รันบน MTIA เพื่อปรับแต่งประสิทธิภาพให้เหมาะสม และตอนนี้กำลังพัฒนาซอฟต์แวร์ของ MTIA ให้ทำงานร่วมกับ PyTorch 2.0 ที่เป็นการปรับปรุงครั้งใหญ่ด้วย

ผลการทดสอบชิป MTIA เทียบกับหน่วยประมวลผลแบบอื่นคือ NNPI accelerator และ GPU พบว่า MTIA มีประสิทธิภาพต่อพลังงาน (efficiency) ดีกว่าชิปทั้งสองแบบในโมเดลขนาดเล็กและขนาดกลาง แต่ถ้าเป็นโมเดลขนาดใหญ่ยังแพ้ GPU แบบดั้งเดิมอยู่ ซึ่งทีม MTIA บอกว่ารับทราบเรื่องนี้และจะหาวิธีปรับปรุงต่อไป

No Description

ที่มา - Meta AI Blog

Get latest news from Blognone

Comments

By: Mediumrare
AndroidWindows
on 19 May 2023 - 10:45 #1284943

MITA

MTIA

By: obtheair on 19 May 2023 - 11:18 #1284948 Reply to:1284943

"สัญญาณนาฬิกา 800Hz" >> 800MHz

By: IDCET
Contributor
on 19 May 2023 - 12:12 #1284961

งบประมาณกันทำชิบ AI น่าจะหมดไปกับ R&D เยอะเอาเรื่อง


ความล้มเหลว คือจุดเริ่มต้นสู่ความหายนะ มีผลกระทบมากกว่าแค่เสียเงิน เวลา อนาคต และทรัพยากรที่เสียไป - จงอย่าล้มเหลว

By: pote2639
ContributoriPhoneWindows PhoneWindows
on 19 May 2023 - 18:07 #1285014

ยังมีตังค์เหลืออีกหรอ นึกว่าถลุงกับ metaverse จนจะเดี้ยง