แอปเปิลเปิดตัวซีพียู Apple A18 มาใช้งานใน iPhone 16 ทำให้ iPhone รุ่นมาตรฐานได้อัพเกรตชิปทีเดียวสองรุ่น โดย A18 ใช้เทคโนโลยีการผลิตแบบ 3 นาโนเมตรรุ่นอัพเกรด
แอปเปิลระบุเป้าหมายของการออกแบบ A18 ให้รันปัญญาประดิษฐ์ได้เต็มที่ ทำให้ต้องออกแบบระบบเชื่อมต่อหน่วยความจำให้ประสิทธิภาพสูงขึ้น 17% เทียบกับ A16 (ที่ใช้ใน iPhone รุ่นมาตรฐานก่อนนี้) ประสิทธิภาพ CPU เพิ่มขึ้น 30% GPU เพิ่มขึ้น 40% โดยเฉพาะประสิทธิภาพระยะยาว (sustained) ก็เพิ่มขึ้น 30% เช่นกันทำให้มีผลต่อการเล่นเกมมาก
ส่วนกราฟิกของ A18 รองรับการเรนเดอร์แบบ ray tracing ในตัวทำให้สามารถรันเกมระดับ AAA จำนวนมากได้ โดยจะมีเกม Honor of Kings: World เล่นได้ปีหน้า
SangRyol Ryu นักวิจัยจาก McAfee’s Mobile Research รายงานถึงมัลแวร์ในโทรศัพท์แอนดรอยด์ที่เรียกว่ากลุ่ม SpyAgent มุ่งเป้าชาวเกาหลีใต้ และกระจายไปถึงสหราชอาณาจักร กำลังพยายามอัพโหลดภาพขึ้นไปยังเซิร์ฟเวอร์ดพื่อ่านข้อความในภาพ
ตัวแอปนั้นไม่ต่างจากมัลแวร์ปกติที่สามารถส่งข้อมูลเครื่อง, ดูด SMS กลับเซิร์ฟเวอร์, และอ่านข้อมูลติดต่อ โดยมีพฤติกรรมพิเศษคือมันพยายามอัพโหลดภาพในเครื่องกลับเซิร์ฟเวอร์ด้วย
Ryu แฮกเข้าเซิร์ฟเวอร์ควบคุมของมัลแวร์ตัวนี้ได้สำเร็จ และพบว่าหน้าจอใช้ค้นหาค่า seed ของกระเป๋าเงินคริปโตเป็นหลัก เมื่อได้ภาพมาแล้วก็พยายามทำ OCR อ่านข้อความในภาพเพื่อดึงข้อความออกมา
Panasonic Energy ประกาศว่าการปรับปรุงโรงงานที่เมือง Wakayama สำเร็จแล้ว และเตรียมเดินสายการผลิตแบตเตอรี่ 4680 สำหรับรถยนต์เมื่อการทดสอบสายการผลิตเสร็จสิ้น
แบตเตอรี่ 4680 นั้นเปิดตัวโดย Tesla มาตั้งแต่ปี 2020 โดยเป็นความหวังว่าจะเป็นแบตเตอรี่มาตรฐานสำหรับรถไฟฟ้าในอนาคต เพราะความจุสูงกว่าแบตเตอรี่เดิมๆ ถึง 5 เท่าตัว แต่กระบวนการเปิดสายการผลิตจริงก็ใช้เวลายาวนาน ประกอบกับความสัมพันธ์ของ Panansonic และ Tesla ก็ขึ้นๆ ลงๆ เรื่อยมา
NTT และ Chunghwa Telecom ประกาศความสำเร็จในการเชื่อมต่อเครือข่ายแสง IOWN APN (Innovative Optical and Wireless Network All-Photonics Network) ข้ามประเทศจากญี่ปุ่นสู่ไต้หวัน ทำให้ latency ไปกลับระยะทาง 2,893 กิโลเมตร ใช้เวลาเพียง 33.84ms เท่านั้น
การเชื่อมต่อนี้เชื่อมระหว่างอาคารสำนักงานใหญ่ Chunghwa Telecom ในไทเป กับศูนย์วิจัย NTT Musashino ทำแบนวิดท์ได้ 100Gbps
รัฐบาลโจ ไบเดนออกเอกสารแนวทางการพัฒนาความปลอดภัยอินเทอร์เน็ต วางแนวทางบีบให้ผู้ให้บริการอินเทอร์เน็ต้องเปิดใช้งาน RPKI ที่เป็นกระบวนการยืนยันความถูกต้องของเส้นทางอินเทอร์เน็ต
Resource Public Key Infrastructure (RPKI) เป็นกระบวนการยืนยันว่า ISP ที่ประกาศเส้นทางไปยังเน็ตเวิร์คต่างๆ นั้นมีสิทธิ์ประกาศจริง ไม่ได้ประกาศมั่วๆ ออกมาเพื่อดึงทราฟิกของเน็ตเวิร์คอื่นให้ผ่านตัวเอง ที่ผ่านมาบริการสำคัญๆ หลายตัวถูกดึงทราฟิกจากการคอนฟิก RPKI ผิดจนใช้งานไม่ได้ทั่วโลกมาแล้วหลายครั้ง
ทีมวิศวกรจาก IBM และ Meta รายงานถึงการทดลองเปลี่ยนเคอร์เนลการรัน LLM ใน PyTorch จากเดิมที่ใช้ CUDA เป็นหลัก มาเป็นภาษา Triton ของ OpenAI โดยพบว่าประสิทธิภาพเริ่มใกล้เคียงกับ CUDA
OpenAI เปิดตัวโครงการ Triton มาตั้งแต่ปี 2021 โดยมุ่งจะพัฒนาภาษาที่ทำให้โปรแกรมเมอร์เขียนโปรแกรมโดยตรงบนชิปกราฟิกได้ง่ายขึ้น นอกจากการถอด CUDA แล้วยังต้องเลือกเอนจิน Flash Attention มาแทน cuDNN Flash Attention เพื่อรันโมเดล LLM พบว่า AMD Flash Attention ทำงานได้ครบถ้วนทุกโหมด
Vinted แพลตฟอร์มขายเสื้อผ้ามือสองออนไลน์รายงานถึงกระบวนการย้ายระบบค้นข้อมูล หลังจากใช้งาน Elasticsearch มาตั้งแต่ปี 2015 แม้จะใช้งานได้ดีมาหลายปีแต่ก็พบว่าถึงข้อจำกัดแล้ว ทำให้ตัดสินใจย้ายไปยัง Vespa ระบบค้นหาแบบโอเพนซอร์สอีกตัวหนี่ง โดยกระบวนการกินเวลานานเกือบหนึ่งปี
DeepMind เปิดตัวปัญญาประดิษฐ์ AlphaProteo ที่สามารถออกแบบโปรตีนยาเพื่อให้ไปจับ (binding) กับโปรตีนที่ต้องการได้อย่างรวดเร็ว พร้อมกับโชว์ว่าสามารถออกแบบโปรตีนเพื่อจับกับโปรตีนไวรัสหรือโปรตีนก่อโรคต่างๆ ได้อย่างหลากหลาย
นอกจากความเร็วในการออกแบบโปรตีนแล้ว ทีมงานยังพบว่าโปรตีนที่ออกแบบได้มีความสามารถจับโปรตีนเป้าหมายได้ดีกว่าโปรตีนเดิมๆ ที่เคยมีการออกแบบกันมาก เช่น BHRF1 โปรตีนของไวรัสก่อมะเร็งสามารถจับในหลอดทดลองได้ถึง 88% ขณะที่ความแน่นในการจับก็แน่นกว่าโปรตีนที่เคยออกแบบกันมาด้วย
Thomas Roche นักวิจัยจาก NinjaLab รายงานช่องโหว่ EUCLEAK ช่องโหว่ของชิปความปลอดภัย (secure element) Infineon SLE78 ที่ใช้งานในกุญแจ YubiKey 5
ช่องโหว่อยู่ที่ กระบวนการเซ็นลายเซ็น ECDSA ที่สามารถสังเกตระยะเวลาตอบกลับเพื่อตรวจสอบถึงค่ากุญแจภายในได้ แม้ว่าจะมีมาตรการสุ่มหยุดทำงานเป็นช่วงๆ แต่ Roche ก็สามารถตรวจพบการหยุดประมวลผลอย่างจงใจได้ไม่ยาก ทำให้แฮกเกอร์ที่มีกุญแจในมือสามารถยิงขอลายเซ็นไปเรื่อยๆ นับล้านครั้ง จนกู้คืนกุญแจออกมาได้
ผลกระทบจากช่องโหว่นี้นอกจากกุญแจ YubiKey แล้ว ชิปรักษาความปลอดภัยที่ใช้ชิป SLE78 ทั้งหมดก็กระทบไปด้วย เช่น สมาร์ตการ์ดในกลุ่ม JavaCard บางรุ่น, ชิป TPM, HSM เก็บกุญแจในเซิร์ฟเวอร์ต่างๆ, หรือชิปรักษาความปลอดภัยในอุปกรณ์ IoT
ธนาคาร OCBC ในสิงคโปร์เปิดบริการ OCBC MyOwn Account ให้บริการเด็กอายุ 7-15 ปี เพื่อให้สามารถจ่ายเงินผ่านการสแกนหรือบัตรเดบิตได้
บัญชีธนาคารเป็นชื่อเด็กเหมือนบัญชีปกติ แต่จากเดิมที่ตัวเด็กจะเปิดบัญชีออนไลน์และทำบัตรเดบิตได้ต้องมีอายุ 16 ปีขึ้นไป บริการใหม่นี้จะเปิดให้ผู้ปกครองอนุญาตให้เด็กทำธุรกรรมอิเล็กทรอนิกส์ทั้งการสแกนจ่ายผ่าน QR และการจ่ายผ่านบัตรได้ด้วย โดยที่ฝั่งผู้ปกครองจะมีความสามารถดูรายการธุรกรรมทั้งหมด, จำกัดวงเงิน, ได้รับแจ้งเตือนเมื่อเด็กจ่ายเงิน, และสามารถรีเซ็ตรหัสบัตรหรือแจ้งบัตรหายได้จากฝั่งผู้ปกครองเอง
อินเทลเปิดตัวซีพียู Intel Core Ultra 200V ชื่อรหัส Lunar Lake ซีพียูสำหรับโน้ตบุ๊กบางเบา โดยชูฟีเจอร์สำคัญด้านกราฟิกและปัญญประดิษฐ์ โดยรวมพลังประมวลผลทั้งระบบมีพลังประมวลผล 120 TOPS
ส่วนสำคัญของ Core Ultra 200V คือส่วนกราฟิก Xe2 จำนวน 8 คอร์ รองรับจอภาพ 4K สามจอพร้อมกัน และชุดคำสั่ง Intel Xe Matrix Extensions (Intel XMX) สำหรับการใช้ส่วนกราฟิกมาเร่งความเร็วปัญญาประดิษฐ์ ได้พลังประมวลผล 67 TOPS ขณะที่ตัวซีพียูนั้น P-core พลังประมวลผสูงมีกำลังประมวลผลมากขึ้น 15% แต่ E-core ที่ใช้ในช่วงประหยัดพลังงานนั้นมีพลังประมวลผลสูงขึ้นมาก ลดการสลับไปใช้ P-core
สำนักข่าว Bloomberg อ้างแหล่งข่าวไม่เปิดเผยตัวตน ระบุว่าทางการจีนกำลังพยายามกดดันรัฐบาลญี่ปุ่นไม่ให้สั่งแบนการส่งออกเครื่องจักรและวัสดุผลิตชิปไปยังจีน ไม่เช่นนั้นจะตอบโต้ด้วยการตัดวัสถุดิบสำหรับอุตสาหกรรมยานยนต์ของญี่ปุ่นเพื่อตอบโต้
รัฐบาลสหรัฐฯ พยายามกดดันทั้งรัฐบาลญี่ปุ่นและเนเธอร์แลนด์ ให้หยุดส่งออกเครื่องจักรผลิตชิปไปยังจีนมาต่อเนื่อง ทำให้จนตอนนี้อุตสาหกรรมเซมิคอนดักเตอร์ของจีนยังไม่สามารถสั่งซื้อเครื่องจักรเทคโนโลยี EUV ได้ แม้จะสามารถสั่งซื้อเครื่อง DUV ได้ก่อนหน้านี้ แต่แรงกดดันก็มากขึ้นเรื่อยๆ จนไม่สามารถส่งออกแม้แต่อะไหล่สำหรับเครื่องที่ขายไปแล้วในช่วงหลัง
ทีมวิจัยจาก Ecole Polytechnique Federale de Lausanne (EPFL) ประกาศความสำเร็จในการพัฒนาชิปรันโมเดลปัญญาประดิษฐ์ขนาดเล็กที่จะเปิดทางให้เชื่อมสัญญาณจากสมองเข้าไปยังชิปเพื่อถอดรหัสข้อมูลออกมาได้โดยตรง ใช้ชื่อว่า miniaturized BMI (MiBMI)
MiBMI เป็นชิปขนาดเล็กรรับอินพุต 192 ช่อง ภายในชิปมีตัว neural decoder จำนวน 31 ชุด มีความสามารถในการรันโมเดลจดจำลายมือได้ความแม่นยำสูง 91.3% แต่ยังไม่ได้ทดสอบถึงระดับเชื่อมต่อกับสมองมนุษย์จริง แต่ทีมงานก็ทดสอบถอดรหัสสมองหนูว่ากำลังได้ยินเสียงอะไร โดยจำแนกเสียง 6 ชนิด ได้ความแม่นยำ 87%
Cloudflare รายงานถึงการอัพเกรด Ruleset Engine ที่ก่อนหน้านี้ไม่มีความสามารถในการทำ pattern matching แบบ globbing ทำให้การเขียนกฎต่างๆ ทำได้จำกัดมาก แม้จะมีฟีเจอร์อื่นๆ เพิ่มเข้ามา สุดท้ายต้องสร้างไลบรารีของตัวเองในชื่อ wildcard
การทำ pattern matching แบบ globbing มีการใช้งานเป็นวงกว้าง เช่น การแสดงไฟล์ตามเฉพาะนามสกุล .jpg เท่านั้น แต่การใช้งานของ Ruleset Engine จะซับซ้อนกว่าการตรวจว่าข้อความตรงกับ pattern ที่ระบุหรือไม่ เพราะต้องนำข้อความที่ match มาแปลง เช่น การ redirect ไปยังเซิร์ฟเวอร์อื่นๆ โดยใช้ URL เดิม
ธนาคารแห่งประเทศไทยและสมาคมธนาคารรายงานถึงความคืบหน้าในการแลกเปลี่ยนข้อมูลบัญชีม้าระหว่างธนาคาร Central Fraud Registry (CFR) ว่าเริ่มเปิดใช้งานเมื่อวันที่ 1 สิงหาคมที่ผ่านมา และจนถึงตอนนี้มีรายชื่อในฐานข้อมูล CFR รวม 15,000 รายชื่อแล้ว โดยนับรวมรายชื่อที่ถูกรายงานเข้ามาตั้งแต่ปลายปี 2023 โดยจำนวนบัญชีที่เกี่ยวข้องกับการรายงานโดยตรง 34,000 บัญชี และน่าจะมีบัญชีที่ถูกจำกัดการใช้งานมากกว่านั้น
มาตรการใหม่นี้ทำให้บุคคลที่มีชื่ออยู่ในฐานข้อมูล CFR จะถูกระงับการใช้บริการผ่านช่องทางอิเล็กทรอนิกส์ทั้งหมด ทุกธนาคาร จากเดิมที่มีการระงับเฉพาะบัญชีที่เกี่ยวข้องกับเส้นทางที่ถูกใช้เป็นบัญชีม้าเท่านั้น และหลังนั้นจะถูกจำกัดสิทธิ์ในการเปิดบัญชีใหม่ต้องมีการพิสูจน์ข้อเท็จจริงเพิ่มเติม
NASA ประกาศกำหนดการณ์นำยาน Boeing Starliner กลับโลกโดยไร้ผู้โดยสารในช่วงเช้าวันที่ 7 กันยายนตามเวลาประเทศไทย และใช้เวลาประมาณ 6 ชั่วโมงก่อนจะลงสู่โลก
NASA ระบุว่าเริ่มรู้ว่ามีปัญหาการควบคุมตั้งแต่ระหว่างการเข้าเทียบสถานีอวกาศนานาชาติ จึงตัดสินใจให้นักบินทั้งสองคนกลับโลกด้วยยาน SpaceX แทน
ทางนาซ่าจะถ่ายทอดสดทั้งการถอนยานออกจากสถานีอวกาศนานาชาติและการกลับสู่โลก
ที่มา - NASA
โครงการย่อย DRM ส่งแพตช์อัพเดตเข้าโครงการลินุกซ์หลักเพื่อเตรียมรวมเป็นลินุกซ์ 6.12 โดยรอบนี้มีความพิเศษคือเพิ่มตัวเลือกแสดงหน้าจอแครชเป็น QR ได้
Elastic Inc. ประกาศเปลี่ยนไลเซนส์โครงการ Elasticsearch กลับมาเป็น AGPL หลังจากเคยใช้ Apache 2.0 แล้วเปลี่ยนเป็น SSPL เมื่อปี 2021 เพื่อป้องกันไม่ให้ใครนำ Elasticsearch ไปให้บริการคลาวด์
แกนกลางของการเปลี่ยนไลเซนส์ไปมาคือความขัดแย้งระหว่าง Elastic Inc. และ AWS นี่นำ Elasticsearch ไปให้บริการ หลังจากที่ Elastic เปลี่ยนไลเซนส์ ทาง AWS ก็แยกโครงการเป็น OpenSearch และแยกสายออกจากกัน ทาง Elastic แถลงว่าภายหลัง AWS ยอมเปลี่ยนชื่อทำให้ตลาดไม่สับสนแล้ว และตอนนี้ทั้งสองบริษัทก็เป็นพันธมิตรที่ดีต่อกัน
Wedson Almeida Filho หนึ่งในผู้ดูแลโครงการย่อย Rust for Linux ประกาศถอนตัวจากโครงการหลังดูแลโครงการนี้มา 4 ปีเต็ม ระบุเหตุผลว่าเบื่อที่จะต้องมาตอบโต้เรื่องที่ไม่ใช่เรื่องเทคนิค
Filho แนบลิงก์ถึงสาเหตุที่เขาลาออกเป็นวิดีโองานสัมมนา Linux Storage Filesystem ที่ Kent Overstreet บรรยายถึงข้อเสนอของการรองรับ Rust ใน API ของ filesystem แต่ช่วงถามตอบก็มีการโต้แย้งกันว่า C/C++ ยังคงเป็นภาษาหลักแล้วทำไม Overstreet ยังคงพยายามยัดเยียด Rust เข้ามา (LWN เขียนสรุปเหตุการณ์ไว้) โดย Filho ยืนยันว่าไม่ได้ยัดเยียดให้ใครใช้ Rust
กูเกิลประกาศความร่วมมือกับ OpenStax โครงการหนังสือเรียนฟรีของมหาวิทยาลัย Rice ทำให้ผู้ใช้สามารถถามคำถามต่างๆ จาก Gemini โดยระบุว่าต้องการข้อมูลจาก OpenStax ได้
ตอนนี้ OpenStax มีหนังสือเรียนกว่า 70 วิชา ตั้งแต่มัธยมไปจนถึงระดับมหาวิทยาลัย
กูเกิลเปิดประกาศความร่วมมือนี้โดยพยายามแสดงว่า Gemini ใช้สำหรับการเรียนได้ เช่น การสร้าง Gems สำหรับสอนบทเรียน หรือการสรุปเนื้อหาด้วยการอัพโหลดเอกสารทั้งเล่มลงไปใน Gemini
OpenStax ยังจำกัดเฉพาะผู้ใช้ Gemini ในสหรัฐฯ ที่อายุเกิน 18 ปี และต้องเมนชั่น @OpenStax โดยตรง อย่างไรก็ดี การถาม OpenStax ก็ยังได้คำตอบจากแหล่งอื่นๆ เข้ามาด้วย ไม่ได้จำกัดตายตัว
DeepMind นำเสนอโมเดล GameNGen เกมเอนจินที่จำลองเกมได้สมจริงเหมือนการเล่นเกมจริงๆ แต่ภายในเป็นโมเดลสร้างภาพ Stable Diffusion ถูกฝึกด้วยภาพเกมและการคอนโทรลต่างๆ
โมเดลนี้อาศัยการสร้าง Agent ที่เล่นเกมจริงแล้วเก็บภาพที่ได้และการกระทำของผู้เล่นในเกม (เดิน ยิง วิ่ง) ไว้ต่อเนื่อง จากนั้นนำภาพและการกระทำมาฝึก generative model ให้ทำนายเฟรมต่อไปจากเฟรมเริ่มต้น ทำให้สุดท้ายได้โมเดลที่แทนเกมเอนจินได้ สามารถควบคุมและเล่นได้จริง ตัวโมเดลมีความสามารถในการนับพลังหรือจำนวนกระสุน ทีมงานพบว่าระหว่างการฝึก จำเป็นต้องแทรกภาพขยะเข้าไประหว่างทางด้วย เพื่อให้โมเดลทำงานได้นิ่งขึ้น
Nascent Information Technology Employees Senate (NITES) กลุ่มเรียกร้องสิทธิแรงงานไอทีในอินเดียออกมาร้องต่อสื่อและรัฐบาลอินเดียถึงพฤติกรรมของบริษัท Infosys ที่ตอบรับใบสมัครพนักงาน แต่กลับบังคับให้เข้าเทรนแบบไม่ได้รับเงินเดือนไปเรื่อยๆ
ทาง NITES ระบุว่า Infosys เริ่มพฤติกรรมแบบนี้ตั้งแต่ปี 2022 โดยจะรับสมัครงานและบอกผู้ที่ผ่านว่าต้องเข้าเทรนออนไลน์ก่อน แต่เมื่อฝึกผ่านแล้วก็แจ้งผู้สมัครว่าต้องเทรนในออฟฟิศโดยไม่ได้รับเงินเดือนต่อไปอีก หากใครไม่ยอมรับก็จะถือว่าเป็นการถอนใบสมัคร
กูเกิลเปิดตัว Gemini Flash 8B โมเดลแบบปิดที่ภายในเป็นโมเดลขนาดเล็กมากเพียง 8B เท่านั้น แต่ยังได้ความสามารถหลักคล้ายกับโมเดลเต็ม เช่น multimodal รองรับทั้งเสียงและภาพ, รองรับอินพุตถึง 1 ล้านโทเค็น
ที่จริงแล้ว Flash-8B ถูกเปิดเผยในรายงานของ Gemini 1.5 ตั้งแต่กลางปีที่ผ่านมา แต่ระบุเพียงว่ากำลังอยู่ระหว่างการพัฒนา โดยคะแนนที่เปิดเผยออกมานั้นแสดงให้เห็นว่าคะแนนทดสอบลดลงจาก Gemini 1.5 Flash ค่อนข้างชัดเจน หากเทียบกับ Llama 3.1 8B ก็ยังถือว่าคะแนนแย่กว่าในการทดสอบส่วนใหญ่ แต่ฟีเจอร์ multimodal และ context window ก็ทำให้มีแนวทางการใช้งานที่หลากหลาย ผมทดลองแปลงเสียงภาษาไทยเป็นข้อความด้วย Gemini Flash-8B ก็ใช้งานได้ค่อนข้างแม่นยำ
ไมโครซอฟท์ประกาศยกโครงการ Mono ให้กับโครงการ WineHQ ที่พยายามทำให้แอปพลิเคชั่นวินโดวส์สามารถรันได้ทุกที่
Mono เริ่มโครงการมาตั้งแต่ปี 2001 โดยพยายามอิมพลีเมนต์ .NET ที่ตอนนั้นยังเป็นโครงการปิดของไมโครซอฟท์ให้เป็นโครงการโอเพนซอร์ส สามารถใช้งานได้ทุกที่ แต่ในช่วงหลังตัวโครงการ .NET เองก็ปรับมาเป็นโครงการโอเพนซอร์สแล้ว โดยไมโครซอฟท์เข้าซื้อ Xamarin ผู้พัฒนาหลักของ Mono ตั้งแต่ปี 2016 และปัจจุบันโครงการ .NET ก็มี mono runtime อยู่ในตัวโครงการ
หลังจากนี้โค้ดหลักจะถูกย้ายไปยัง GitLab ของ WineHQ ส่วนโค้ดที่เดิมบน GitHub จะถูกเก็บไว้ก่อน และไบนารีต่างๆ จะคงให้ดาวน์โหลดไปอีกอย่างน้อยสี่ปี
Cerebras บริษัทชิปปัญญาประดิษฐ์ เปิดบริการ Cerebras Inference รันโมเดล Llama 3.1 ที่ความเร็วสูง โดยสามารถรัน Llama 3.1 70B ที่ 450 token/s ขณะที่ Llama 3.1 8B ได้ถึง 1,800 token ต่อวินาที นับว่าเป็นบริการที่ความเร็วสูงที่สุดในโลกในตอนนี้ จากเดิมที่ Groq ทำได้ที่ 750 token/s
จุดขายของ Cerebras คือชิป Wafer Scale Engine ที่ใส่ SRAM ความเร็วสูง 44GB อยู่บนตัวชิป เชื่อมต่อกับหน่วยประมวลผลที่แบนวิดท์รวมสูงถึง 21 Petabytes/s เทียบกับชิป NVIDIA H100 ที่แม้แบนวิดท์จะสูงแล้วแต่ก็ได้เพียง 3.3 Terabytes/s แนวทางนี้มีความจำเป็นสำหรับการรันโมเดลให้มีความเร็วเนื่องจากข้อมูลแต่ละ token จะต้องผ่านโมเดลทั้งหมด เช่นโมเดล 70B การรันโมเดลให้ได้ 1000 token/s จะต้องการแบนวิดท์ถึง 140 Terabytes/s