ที่งาน NVIDIA GTC 2025 ตอนนี้ทาง NVIDIA เปิดตัวเครื่องเดสก์ทอปสองรุ่นที่ใช้ชิป Grace CPU Supership ออกมาสองรุ่น ได้แก่
ก่อนหน้านี้ NVIDIA มักแบ่งกลุ่มลูกค้าไว้ด้วยปริมาณหน่วยความจำที่ให้มา การที่รอบนี้ยอมใส่แรมขนาดใหญ่ในเครื่องเดสก์ทอปก็น่าจะเกิดจากการแข่งขันกับบริษัทอื่น เช่น แอปเปิลที่เริ่มชูธงการรัน AI ขนาดใหญ่ แต่ตอนนี้เครื่องทั้งสองรุ่นก็ยังไม่เปิดเผยราคา แม้ตัว Project DIGITS เคยระบุว่าเริ่มต้นที่ 3,000 ดอลลาร์
ที่มา - NVIDIA
ตอนนี้ผู้ผลิตที่ประกาศจะขาย DGX Spark และ DGX Station ก็เริ่มเปิดตัวสินค้ากันแล้ว
Introducing ASUS Ascent GX10: An AI supercomputer featuring NVIDIA GB10 Grace Blackwell Superchip and 128GB of coherent unified system memory for AI developers and data scientists to build and innovate on the latest AI reasoning models at their fingertips @NVIDIAGTC 25 pic.twitter.com/P7LNwUmDwT
— ASUS (@ASUS) March 18, 2025
Comments
run llama 405B แบบ local ได้เลย
ต้องย่อหน่อยครับ FP8 น่าจะได้
แต่อัดเต็มนี่ราคาไม่กล้าคิด จะหยุดที่ 7 หลักอยู่ไหม
lewcpe.com, @wasonliw
run local ส่วนใหญ่ก็ quantized กัน Q6, Q4 กันอยู่แล้วแหละครับ แต่ถ้าโมเดลทั่วไปนี่คงได้ full precision เลยแหละมั้ง ผมว่าคงไม่ข้าม 7 หลัก แต่น่าจะ 9xx 55555
ผลการตอบมันโอเคอยู่มั้ยฮ่ะ หรือแตกต่างเยอะมั้ย เห็น Q6,4 ใจบ่ดี 5555
มือใหม่!! ใหม่จริงๆนะ
ไม่คิดไรมากแค่อยากได้คน pin pong ไอเดียกันไปมา Q4 โอเคอยู่ครับ แต่ถ้าอยากให้มันตอบเป็น formatt อะไรบางอย่างหรือทำ tools call จะหลุดๆหน่อย เอาที่ precision เยอะสุดเท่าที่เป็นไปได้ดีกว่า (มไป openrouter เลย เพราะทำ code execution agent ตัวเล็กคือ code ออกมาแล้ว runtime error เยอะสุดๆ)
OpenRouter ก็มี provider ย่อกันนะครับ DeepSeek R1 นี่มีทั้ง FP4 และ FP8 ไม่แน่ใจว่ามีทางจำกัดเฉพาะตัวเต็มไหม
lewcpe.com, @wasonliw
ใส่ได้ครับ ตั้งค่า json provider->quantization->fp16
ทุกอย่างเป็นสีทองหมด
เช่นเดียวกับกำไรบริษัท....
แต่ DGX Spark ผมเดินดูงาน ASUS ขาวล้วนเลยครับ ส่วน Dell ดำเลย
lewcpe.com, @wasonliw
memory เหมือนแยก cpu ,gpu นึกว่าจะเป็น unified
เอ๊ะ แล้วถ้างั้น
and 128GB of coherent unified system memory
ในทวีตของ Asus นี่หมายถึง unified อะไรกับอะไรนะฮะ