Tags:
Node Thumbnail

ราคาคุ้น NVIDIA ทำนิวไฮ”, “หุ้น NVIDIA พุ่ง 200%”, “มูลค่า NVIDIA แซง Apple แล้ว” พาดหัวลักษณะนี้น่าจะเป็นที่ชาชินในช่วง 1-2 ปีที่ผ่านมา หลังกระแส AI บูมมากขึ้น

หลายๆ คนน่าจะรู้อยู่แล้วว่าปัจจัยที่ทำให้ NVIDIA ขึ้นมาสู่ระดับนี้ได้ คือการครองตลาด GPU ที่ถูกนำไปใช้ในการเทรน AI จนถึงขนาดที่ว่า บริษัทไอทีใหญ่ๆ หรือบริษัทวิจัยที่ต้องการ GPU ของ NVIDIA ไปใช้งาน มีแต่เงินอย่างเดียว ก็ใช่ว่าจะได้ของไป แต่ยังต้องรอคิวหลักหลายเดือน จนถึงปีเลยด้วยซ้ำไป

แต่คำถามคืออะไรที่ทำให้การ์ดจอ NVIDIA เข้าไปเป็นตัวเลือกหลัก (และอาจจะตัวเลือกเดียว) ของบริษัทที่ต้องการเทรน AI ทั้งที่คู่แข่ง GPU ใหญ่ๆ อย่าง AMD ก็มี? เป็นเพราะ GPU ของ NVIDIA ดีกว่าอย่างเดียวเหรอ? บทความนี้พาจะไขเหตุผลเบื้องลึกกว่านั้น

No Description

ทำไม GPU ถูกนำมาใช้เทรน AI

หากจะอธิบายอย่างง่าย ก็ต้องเข้าใจพื้นฐานการทำงานของ GPU ก่อนว่า GPU ถูกออกแบบมาให้รองรับการประมวลผลที่เรียกว่าการประมวลผลแบบขนาน (Parallel Computing) หรือสามารถรองรับการประมวลงาน 1 คำสั่ง (task) ที่แบ่งส่วนประมวลผลได้พร้อมๆ กันในเวลาเดียวกันได้รวดเร็วกว่า จากการที่มีจำนวนคอร์ประมวลผลมหาศาล หลักหลายพันคอร์ในปัจจุบัน

ตัวอย่างของงานที่แบ่งส่วนประมวลผลได้ คือการประมวลผลภาพกราฟิคบนคอมพิวเตอร์ GPU จะรับคำสั่งในการประมวลผลเฟรม 1 เฟรมจาก CPU (1 คำสั่ง) แต่ต้องประมวลผลจากชุดข้อมูลที่หลากหลายพร้อมๆ กัน ไม่ว่าเป็นโพลีกอน 3 มิติต่างๆ ในเฟรม แสงตกกระทบของแต่ละโพลีกอน การสะท้อนแสงของโพลีกอน เอามาเรียงเป็นแต่ละพิกเซลบนหน้าจอเป็นต้น

No Descriptionภาพจาก Lawrence Livermore National Laboratory

เปรียบเทียบกับกรณีของ CPU ที่ถูกออกแบบมาให้ประมวลผลได้ทีละงาน (Serial Computing) ต่อคอร์ประมวลผล แม้จะมีความพยายามในการพัฒนาให้ CPU รองรับการประมวลผลแบบขนานมากขึ้น เช่น เทคโนโลยี Hyper-Threading ของ Intel (1 คอร์มี 2 เธรด ประมวลผลได้ 2 งานพร้อมกัน) หรือการเพิ่มจำนวนคอร์ในซีพียูยุคใหม่ก็ตาม (แต่ก็แค่หลักสิบ) แต่ก็ยังถือว่ายังไม่เหมาะและช้ากว่าการประมวลผลแบบขนานบน GPU ได้อยู่ดี

No Description

ภาพจาก Lawrence Livermore National Laboratory

ขณะที่การเทรนโมเดล AI ไม่ว่าจะ Machine Learning หรือ Deep Learning ก็เป็นงานประเภท แบ่งส่วนประมวลผลได้ เลยเป็นสาเหตุ GPU ถูกนำมาใช้งาน

CUDA จุดเปลี่ยนที่ทำให้ NVIDIA ครองโลก AI

จุดเริ่มต้นของ NVIDIA ในปี 1993 คือ Jensen Huang ผู้ก่อตั้งและซีอีโอมองเห็นโอกาสว่าเกม กำลังกลายเป็นความท้าทายในแง่วิศวกรรมด้านการประมวลผล เลยตั้งบริษัทของตัวเองเพื่อพัฒนา GPU โดยเฉพาะ ซึ่งตัว GPU ของ NVIDIA ก็ได้รับความนิยมในตลาดมากขึ้นเรื่อยๆ

ในช่วงแรก งานด้านกราฟิคเป็นเวิร์คโหลดเดียวที่เหมาะสมกับการใช้ GPU แต่จุดเปลี่ยนคือการเกิดขึ้นของแนวคิด GPGPU (General-Purpose Graphics Processing Unit) ที่มองว่า ความสามารถในการประมวลผลขนานของ GPU มันสามารถนำไปใช้สำหรับเวิร์คโหลดอื่นๆ ได้ ทำให้ในช่วงปี 2006 NVIDIA เลยปล่อยซอฟต์แวร์ของตัวเองที่ชื่อว่า CUDA ออกมาให้นักพัฒนา

CUDA (Compute Unified Device Architecture) เป็นซอฟต์แวร์เฟรมเวิร์ค ที่เปิดให้นักพัฒนาสามารถเขียนเกมหรือแอป ให้สามารถจัดการเวิร์คโหลดและการประมวลผลของ GPU ได้โดยตรงและมีประสิทธิภาพมากขึ้นผ่าน API ซึ่งจุดประสงค์ของการปล่อย CUDA ออกมา ไม่ใช่แค่ต้องการให้นักพัฒนาเกม สามารถสั่งงาน GPU ได้อย่างมีประสิทธิภาพมากขึ้นแต่เพียงอย่างเดียว แต่ยังเปิดโอกาสให้นักพัฒนาแอปประเภทอื่นๆ สามารถเขียนแอปที่ดึงประสิทธิภาพของ GPU ออกมาได้มากขึ้นเช่นกัน ตามแนวคิดของ GPGPU

เมื่อ NVIDIA เป็นทั้งเจ้าของฮาร์ดแวร์ GPU และซอฟต์แวร์ CUDA การทำงานร่วมกันระหว่าง 2 เลเยอร์นี้เลยค่อนข้างแนบแน่น แม้ในตลาดช่วงแรกจะมีซอฟต์แวร์ที่เป็นโอเพนซอร์สอย่าง OpenCL มาเป็นตัวเลือกให้นักพัฒนา แต่ด้วยข้อได้เปรียบของการเป็นเจ้าของแพลตฟอร์ม ทำให้ NVIDIA ค่อนข้างกีดกันและไม่ซัพพอร์ตให้ OpenCL สามารถดึงประสิทธิภาพของ GPU ออกมาได้มากเท่า ส่งผลให้ CUDA ค่อนข้างได้รับความนิยมมากกว่า

No Description

อีกหนึ่งจุดเปลี่ยนที่สำคัญ ที่ทำให้ CUDA กลายเป็นมาตรฐานของโลก AI คือรายงานวิจัย “Large-scale Deep Unsupervised Learning using Graphics Processors” เมื่อปี 2009 โดยทีมวิจัยสแตนฟอร์ด มี Andrew Ng ร่วมทีม รายงานนี้แสดงให้เห็นว่าการใช้ GPU ที่มีราคาถูก (ในสมัยนั้น) คือการ์ด NVIDIA GeForce GTX 280 สามารถเร่งความเร็วในการฝึก AI แบบ Deep Learning ได้อย่างชัดเจน เป็นเหมือนใบเบิกทางสำหรับการฝึก AI ประสิทธิภาพสูง

เมื่อ NVIDIA มีแพลตฟอร์มที่แข็งแรงทั้งฮาร์ดแวร์และซอฟต์แวร์ ทำให้เมื่อมีงานวิจัย AI มากขึ้น นักวิจัย AI ก็เลยเลือก ที่จะใช้แพลตฟอร์มของ NVIDIA ในการเทรน AI ประกอบกับฝั่ง NVIDIA เองก็พัฒนา CUDA ให้ตอบโจทย์งานสายนี้อยู่ตลอด เช่นการออกไลบรารี cuDNN สำหรับ Deep Learning หรือ cuBLAS สำหรับการคำนวนพีชคณิตเชิงเส้น (linear algebra) เป็นต้น

No Description

ในอีกด้าน เหล่าซอฟต์แวร์เฟรมเวิร์คสำหรับ Deep Learning ที่ได้รับความนิยมอย่าง TensorFlow หรือ PyTorch ก็เขียนมารองรับ CUDA ได้แบบเนทีฟ ก็ยิ่งเป็นตะปูตอกฝาโลงให้ NVIDIA / CUDA ผูกขาดตลาดชิป AI ไปกลายๆ ไม่รวมแง่การตลาด NVIDIA เองก็มีความร่วมมือกับนักวิจัยหลายๆ แหล่ง เช่น U Berkeley หรือ Meta ในการปรับจูนโมเดล AI ให้ทำงานได้ดีขึ้นบน CUDA

ความพยายามล้มยักษ์ CUDA

ในอุตสาหกรรมเองก็มีความพยายามจะทลายกำแพงผูกขาดเรื่องนี้ของ NVIDIA เช่นกัน อย่าง AMD ก็มีการทำเฟรมเวิร์ค ROCm ขึ้นมาเพื่อทดแทน CUDA, Intel บวกกับพันธมิตร Arm, Google, Samsung, Qualcomm พยายามพัฒนา oneAPI มาสู้ หรือการพยายามผลักดันภาษาสำหรับเทรน AI ที่ใช้งานง่ายกว่า CUDA อย่างโครงการ Triton ของ OpenAI เป็นต้น

ปัญหาของเฟรมเวิร์คหรือภาษาเหล่านี้ อาจเป็นปัญหาเชิงไก่กับไข่ คือจำนวนผู้ใช้งานยังไม่เยอะ เพราะเครื่องมือหรือการซัพพอร์ตต่างๆ ยังไม่เท่า CUDA ที่เริ่มต้นมาก่อนและพัฒนามาตลอด มี ecosystem ที่แข็งแรงกว่า ไม่มีอะไรจูงใจให้ นักพัฒนา องค์กรหรือนักวิจัยเปลี่ยนซอฟต์แวร์หรือภาษาในการเทรน AI มากพอ เพราะการเปลี่ยนก็มีต้นทุน และเมื่อจำนวนคนใช้งานยังไม่เยอะ ก็ไม่มีการลงทุนเพื่อพัฒนาต่อยอดเครื่องมือเพิ่มเท่าไหร่นัก

ขณะที่โลก AI มีเทคโนโลยีและโมเดลใหม่ๆ ออกมาให้ทดลองอยู่ทุกวัน โค้ดที่นักวิจัยแชร์ออกมามักรองรับ CUDA เป็นหลัก การใช้งานเทคโนโลยีอื่นๆ อาจจะรองรับงานได้บางส่วน แต่มีปัญหากับหลายโครงการ หาชุมชนที่พบปัญหาและแนวทางแก้ไขได้ยากกว่า ขณะที่วงการวิ่งไปข้างหน้าอย่างรวดเร็ว ทุกคนจึงถูกกดดันให้อิงกับเทคโนโลยีที่มีการรองรับมากที่สุดเพื่อที่จะวิ่งตามให้ทัน

No Description

คนที่พอจะสรุปภาพรวมของตลาดอุตสาหกรรมนี้ได้ดีที่สุด น่าจะเป็น Raja Koduri ที่เคยเป็น Chief Architect ทั้งฝั่ง Intel และ Radeon (ฝ่ายกราฟิคของ AMD) ที่ต้องสู้รบกับ NVIDIA มาทั้งชีวิต เขาเล่าเอาไว้บน X ว่าตัวเขาเคยถูกทีมวิศวกรมองค้อน ตอนที่สั่งให้เปลี่ยนจากการใช้ GeForce ไปเป็นการ์ดจอตัวอื่น ซึ่งเป็นภาพสะท้อนว่า ต้นทุนเรื่องเวลาและต้นทุนของวิศวกร มันมีมูลค่ามากกว่าราคาของ GPU ไม่ว่าจะรุ่นไหนก็ตาม

Raja เล่าด้วยว่าสาเหตุหนึ่งที่ NVIDIA ครองตลาด (ในภาพรวม) คือการมีผลิตภัณฑ์ GPU ทั้งฝั่งเกมมิ่งและฝั่งดาต้าเซ็นเตอร์ ซึ่งมีสถาปัตยกรรมและ stack เดียวกัน ความเข้าถึงง่ายของ GPU เกมมิ่งที่วางขายทั่วโลก ในราคาไม่แพง เป็นประตูที่เปิดโอกาสให้นักพัฒนาตัวเล็กๆ สามารถซื้อมาทดลองใช้งาน ลองโค้ดดิ้งบนแพลตฟอร์มของ NVIDIA ได้ง่ายๆ

และทั้งหมดนี้ก็น่าจะเป็นภาพสะท้อนเบื้องหลังของกราฟหุ้น NVIDIA ที่พุ่งสูงขึ้นเรื่องๆ ในช่วง 1-2 ปีที่ผ่านมา จนแซง Microsoft, Apple, Amazon ที่ลอยลำมานาน ขึ้นมาเป็นบริษัทเทคที่มูลค่าสูงที่สุดในโลกได้

Get latest news from Blognone

Comments

By: zyzzyva
Blackberry
on 19 June 2024 - 18:23 #1314956

ผมไปเจอบทความนี้มาครับ ผู้อำนวยการอาวุโส สายงานวิจัย บริษัทหลักทรัพย์บัวหลวง บอกว่า "ยังมีหุ้นไทยที่เชื่อมโยงกับหุ้น Nvidia ของสหรัฐ แต่ยังไม่เปิดเผย" คำถามคือ หุ้นไทยที่ว่านั้น คือหุ้นของบริษัทอะไร
https://www.bangkokbiznews.com/finance/stock/1132193

By: Azymik on 19 June 2024 - 19:46 #1314966

รองรับการประมวลผลแบบขนาดมากขึ้น

รองรับการประมวลผลแบบขนานมากขึ้น

By: Mediumrare
AndroidWindows
on 20 June 2024 - 03:12 #1314981 Reply to:1314966

ใช้ในการเทรนด์ AI

ใช้ในการเทรน AI

By: big50000
AndroidSUSEUbuntu
on 23 June 2024 - 21:23 #1315250 Reply to:1314981
big50000's picture

+ เม้นนี้เพื่อท้วงอีกรอบ

By: dbpod
iPhoneUbuntuIn Love
on 19 June 2024 - 23:59 #1314974
dbpod's picture

`บริษัทที่คิดค้นเทคโนโลยี แต่ไม่ได้ผลิตเอง
เขามีวิธีการป้องกันอย่างไร? ไม่ให้บริษัทที่รับผลิต ขโมยเทคโนโลยี หรือแอบขายข้อมูลเทคโนโลยี

By: freeriod on 20 June 2024 - 04:50 #1314982 Reply to:1314974
freeriod's picture

เดานะ ตอนตั้งค่าบางอย่างให้คนในบริษัทไปกด เหมือนบริษัทรับผลิตน้ำหวานหรือซอสหรือยา ตอนใส่ส่วนผสม คนที่จ้างจะมากดสูตรใส่เอง หรือ เหมือนเซฟฝากของในธนาคาร แล้วบริษัท ที่รับจ้างคงเซ็นสัญญากันด้วย

By: lew
FounderJusci's WriterMEconomicsAndroid
on 20 June 2024 - 09:27 #1314996 Reply to:1314974
lew's picture

แบบเดียวกับเครื่องใช้ไฟฟ้าบ้านเราที่เป็นผู้รับจ้างผลิตจำนวนมากครับ

  1. บริษัทมีความน่าเชื่อถือพอ ไม่ใช่บริษัทไก่กาเพิ่งเปิดมาเมื่อวาน
  2. หลายครั้งคู่ค้ากันมีกระบวนการ audit ตามมาตรการที่วางไว้ มี external audit มาตรวจสอบว่ากระบวนการเข้าถึงข้อมูล กระบวนการเก็บ ทำตามที่ตกลงกันไว้จริงๆ

ในวงการไอทีก็มีอะไรแบบนี้ ผู้ให้บริการแอปพลิเคชั่นภายนอกให้บริการ ลูกค้าจ้าง audit ภายนอกมาไล่ดูทุกจุด ไล่ถึง access log ของ ระบบเลยว่าไม่มีการเข้าถึงมั่วๆ (ไม่มี log ไปโชว์นี่ยาวอีก)


lewcpe.com, @wasonliw

By: YongZ on 20 June 2024 - 11:46 #1315014 Reply to:1314974

นอกจากสิทธิบัตรแล้วยังมีเรื่องสถาปัตซอฟต์แวร์ รู้วิธีทำไอโฟนแต่ไม่มีOSก็ขายไม่ได้

By: dbpod
iPhoneUbuntuIn Love
on 20 June 2024 - 21:25 #1315064 Reply to:1314974
dbpod's picture

ขอบคุณทุกคนคับ

By: tom789
Windows Phone
on 20 June 2024 - 12:04 #1315017

ตอนคริปโตมาแรง ก้ทำการ์ดจอ ขุดโดนเฉพาะ พอมา เอไอ ก็ดี จับตลาดได้ดีมาก

By: Be1con
ContributorWindows PhoneWindowsIn Love
on 21 June 2024 - 15:05 #1315143
Be1con's picture

ความเข้าถึงง่ายของ GPU เกมมิ่งที่วางขายทั่วโลก ในราคาไม่แพง เป็นประตูที่เปิดโอกาสให้นักพัฒนาตัวเล็กๆ สามารถซื้อมาทดลองใช้งาน ลองโค้ดดิ้งบนแพลตฟอร์มของ NVIDIA ได้ง่ายๆ

นึกถึงคลิปนี้เลยครับ...


Coder | Designer | Thinker | Blogger

By: Mr.EYE on 22 June 2024 - 16:14 #1315208

โดนแซงหมดแล้ว ขึ้นที่ 1 ปุ๊บก็โหมข่าวกันยกใหญ่ตอนนี้ตกแล้ว 555

By: jdavil on 23 June 2024 - 22:46 #1315253

แว๊บแรกน่าซื้อหุ้น .