Tags:
Node Thumbnail

NVIDIA และเพื่อนร่วมวงการคือ Arm และ Intel ออกมานำเสนอฟอร์แมต 8-bit floating point (FP8) สำหรับคำนวณทศนิยมเพื่องาน Deep Learning ให้ประหยัดทรัพยากรการประมวลผลขึ้นกว่าเดิม

รูปแบบงานด้านกราฟิกและ AI จำเป็นต้องคำนวณทศนิยม (floating point) ที่เดิมทีมีความแม่นยำ 32-bit (FP32) แต่มีข้อเสียตรงที่ต้องใช้พลังและหน่วยความจำในการประมวลผลมาก ช่วงหลังเมื่อวงการ AI ต้องใช้โมเดลที่มีขนาดใหญ่ขึ้นเรื่อยๆ (เช่น GPT-3 หรือ PaLM) ใช้เวลาเทรนนานเป็นหลายสัปดาห์ จึงต้องขยับมาใช้ 16-bit (FP16) ที่สิ้นเปลืองพลังน้อยลงมาก แต่ความแม่นยำไม่ลดลงมากนัก เช่น bfloat16

ล่าสุด NVIDIA กับพวกจึงนำเสนอ FP8 ที่เป็นการตัดจำนวนทศนิยมลงไปอีกขั้น ลดกำแพงเรื่องทรัพยากรที่ต้องใช้เทรนโมเดลลง ข้อเสนอ FP8 เป็นการวางมาตรฐานกลางให้อุตสาหกรรมใช้งาน โดย FP8 แยกวิธีการเข้ารหัสข้อมูล (encoding) ออกเป็น 2 แบบคือ E4M3 และ E5M2 ที่มีจำนวนบิตสำหรับ exponent (E) และ mantissa (M) ไม่เท่ากัน สำหรับใช้งานคนละประเภทกัน

No Description

NVIDIA โชว์ผลการทดสอบโมเดล AI ต่างๆ เช่น GPT หรือ BERT ว่าการลดจาก FP16 เหลือ FP8 แทบไม่มีผลต่อความแม่นยำของโมเดลเลย

No Description

ฟอร์แมต FP8 ถูกนำมาใช้งานแล้วในจีพียูตัวใหม่ NVIDIA Hopper, Arm ระบุว่าจะเริ่มนำมาใช้กับสถาปัตยกรรม Armv9.5-A ในปี 2023 ส่วน Intel ระบุคร่าวๆ แค่ว่าจะรองรับในอนาคต ทั้งในซีพียู จีพียู และตัวเร่งประมวลผล Habana Gaudi

ที่มา - Whitepaper, NVIDIA, Arm

Get latest news from Blognone

Comments

By: gamoman
AndroidWindows
on 18 September 2022 - 19:09 #1262259

"NVIDIA กับพวก" อิอิ
EVGA : ข้าไม่ใช่พวกเอ็งละ ลาก่อย

By: xsparrowcutex on 19 September 2022 - 09:05 #1262289 Reply to:1262259

"September 2022 the company ended their relationship with Nvidia and thus stopped manufacturing graphics cards."

ตามนั้นเลยงับ

By: Hoo
AndroidWindows
on 18 September 2022 - 21:18 #1262263

ต้องรอ HW ใหม่ที่ support เช่น
cpu ใหม่ที่มีวงจร FP8 ในตัว
อาจมีการ simd เพื่อทำ fp8 พร้อมกัน 8ตัว (64bit) อะไรทำนองนี้ด้วยสินะ?

By: sapjunior
AndroidUbuntuWindows
on 18 September 2022 - 22:13 #1262266 Reply to:1262263

เป็นไปได้ครับ เหมือนตอนจาก series 2000 > 3000 เพิ่ม tf32 เข้ามา

By: langisser
In Love
on 19 September 2022 - 01:18 #1262273 Reply to:1262263

ผมละระแวงจริงๆ เวลา cpu เพิ่มวงจรเข้าไปใหม่ จะโดน hack มั้ยล่ะนั่น

By: Yone on 18 September 2022 - 22:37 #1262267

เย้

By: mr_tawan
ContributoriPhoneAndroidWindows
on 19 September 2022 - 00:40 #1262272
mr_tawan's picture

อันนี้เรียก quarter-precision ได้มั้ยครับ :D


  • 9tawan.net บล็อกส่วนตัวฮับ