อินเทลเปิดตัวชุดคำสั่งส่วนขยายใหม่ของซีพียูสถาปัตยกรรม x86 สองชุด ได้แก่
Intel APX เป็นการขยายจำนวนรีจิสเตอร์สำหรับงานทั่วไป (general-purpose registers หรือ GPR) ในซีพียู จากเดิม 16 ตัวเป็น 32 ตัว เพื่อให้คอมไพเลอร์สั่งเก็บข้อมูลในรีจิสเตอร์ได้เยอะขึ้น ผลคือจำนวนครั้งในการ load-store ข้อมูลในคอมไพเลอร์ลดลง ประสิทธิภาพเพิ่มขึ้น ตัวเลขของอินเทลคือเพิ่มขึ้น 10%
Intel AVX10 เป็นชุดคำสั่งสำหรับการคำนวณแบบเวกเตอร์ที่พัฒนาต่อจาก AVX-512 (ออกในปี 2016) โดยเป็นซูเปอร์เซ็ตของ AVX-512 คือมีคำสั่งเดิมทั้งหมด เพิ่มฟีเจอร์ใหม่ และสามารถทำงานได้ทั้งคอร์ใหญ่ (P-core) และคอร์เล็ก (E-core) ต่างไปจาก AVX-512 เดิมที่ทำงานได้เฉพาะบน P-core เท่านั้น
AVX10 จะทำงานที่รีจิสเตอร์เวกเตอร์ขนาด 256 บิตเป็นหลัก แต่มีโหมดเข้ากันได้กับรีจิสเตอร์ขนาด 512 บิตเดิม (บน Xeon) ได้ด้วย การมาถึงของ AVX10 เท่ากับว่าซีพียูของอินเทลทุกตัวจะรองรับ AVX10 ทั้งหมด ไม่มีแยกรุ่นเล็กใหญ่อีกแล้ว
อินเทลจะออก AVX10 Version 1 (AVX10.1) มาให้ก่อนบน Xeon เวอร์ชันหน้า Granite Rapids โดยยังรองรับเฉพาะรีจิสเตอร์ 512 บิตเดิมเท่านั้น จากนั้นจะออก AVX10 Version 2 (AVX10.2) ที่รองรับรีจิสเตอร์ 256 บิตด้วยในภายหลัง
Comments
สอบถามหน่อยครับ มีใครใช้ AVX บน Core i ที่ขายทั่วไปให้ Consumer มาใช้ในการทำงานจริงในชีวิตประจำวันบ้างครับ? (ที่ไม่ใช่เอามา benchmark หรือ burn เพื่อทดสอบ stability, temp, tdp)
matlab
พวก lib interference AI ง่ายๆ หลายตัว (object detection, image classification) พวกนี้ใช้เยอะเลยนะครับ เพราะไม่ต้องการ require GPU ถ้าแอปมีฟีเจอร์พวกนี้ก็ได้ใช้ไม่รู้ตัว
lewcpe.com, @wasonliw
Math library ต่างๆที่เป็น based ในหลายโปรแกรม/เกม เช่นพวก BLAS ATLAS LAPACK หรือ scientific library อย่างเช่น numpy opencv หรือพวก Deep Learning Inference Engine ต่างๆ (onnxruntime, openvino) ใช้ทั้งนั้นครับโดยที่เราไม่รู้ตัว
Torvalds: angry noises
สาปส่ง AVX-512
Intel: อะ AVX10 เล็กลงครึ่งนึง😆
AVX10 นี่ดู ๆ ไปก็เหมือนที่ AMD ทำกับ AVX-512 หรือเปล่า (คือใช้รีจิสเตอร์ 256 bit กับชุดคำสั่งสำหรับ 512bit)