กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่
กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น
นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น
Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน
AWS ประกาศปรับนโยบายคิดเงินค่า S3 API หลังจากเกิดเหตุคิดเงินค่า bucket เปล่ากับลูกค้าถึงวันละ 50,000 บาท โดยจะยกเลิกการคิดเงินกรณีที่ตอบกลับแบบ redirect (HTTP 3XX) หรือแสดงความผิดพลาด (HTTP 4xx) จากนอกเน็ตเวิร์คของลูกค้าเอง แต่หากเรียกจากเครื่องภายในเองแล้วได้ error เองก็ยังคิดเงินต่อไป รวมถึงกรณีที่ใช้ S3 โฮสต์เว็บ และตั้ง custom error หรือ custom redirect ก็จะคิดเงินด้วย
สำหรับการตอบกลับแบบที่ผิดพลาดจากฝั่ง S3 (HTTP 5XX) นั้นทาง AWS ไม่เคยคิดเงินอยู่แล้ว ส่วนการตอบกลับปกติ HTTP 200 นั้นคิดเงินแทบทุกกรณี
เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว
tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน
update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว
ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง
OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก
เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า
Wikimedia Foundation ผู้ให้บริการ Wikipedia ทดสอบปลั๊กอินเบราว์เซอร์ Citation Needed เป็นการตรวจสอบข้อมูลในเว็บด้วยการค้นหาข้อมูลในวิกิมาอ้างอิง โดยใช้ ChatGPT มาอ่านข้อความและหน้าเว็บอ้างอิงว่าเนื้อหาสนับสนุนกันหรือไม่
ปลั๊กอินเบราว์เซอร์ตัวนี้รับอินพุตโดยให้ผู้ใช้เลือกข้อความในเว็บใดๆ จากนั้นจะอาศัย ChatGPT ในการสร้างคำค้นหา และค้นหาหน้าวิกิด้วย API ของ Wikipedia เอง สุดท้ายจะใช้ ChatGPT ในการแยกประโยคที่เกี่ยวข้องและสรุปออกมาว่าเป็นเนื้อหาที่ผู้ใช้เลือกมานั้นสอดคล้องกับข้อความในหน้าวิกิหรือไม่
01.AI บริษัทปัญญาประดิษฐ์ที่ก่อตั้งโดย Kai-Fu Lee เปิดตัวโมเดล Yi เวอร์ชั่น 1.5 โดยชูประเด็นว่าโมเดลขนาด 9B นั้นสามารถทำคะแนนทดสอบชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันได้ทั้งหมด (แม้่ว่านับจริงๆ Yi 9B จะใหญ่กว่าคนอื่นพอสมควรก็ตาม)
ทีมงาน 01.AI ระบุว่า Yi ฝึกด้วยชุดข้อมูลคุณภาพสูงขนาดใหญ่มากถึงห้าแสนล้านโทเค็น แล้วฝึกต่อด้วยตัวอย่างอีกสามล้านชุด
Kai-Fu Lee ให้สัมภาษณ์กับ The Japan Times ว่าที่ผ่านมาตลาดแชตบอตในจีนยังไม่ดีพอใช้งาน ต่างจาก ChatGPT ที่เปิดตัวมาก็มีประโยชน์ใช้งานได้เลย และทาง 01.AI ก็เปิดตัว Wanzhi ผู้ช่วยปัญญาประดิษฐ์ที่ช่วยผู้ใช้ได้แบบเดียวกับ Microsoft Copilot แล้ว
Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง
IBM ปล่อยโมเดลปัญญาประดิษฐ์ Granite ที่ฝึกจากฐานข้อมูลโค้ด 116 ภาษา โดยโมเดลมี 4 ขนาดได้แก่ 3B, 8B, 20B, และ 34B แยกรุ่นพื้นฐานและรุ่นรับคำสั่ง (instruct) โดยเฉพาะรุ่น 8B นั้นความสามารถในการเขียนโปรแกรมเหนือกว่าโมเดลขนาดเดียวกันค่อนข้างมาก
กระบวนการฝึกโมเดลเวอร์ชั่น 34B นั้นพิเศษกว่าเวอร์ชั่นอื่นๆ เพราะอาศัยการ upscaling โดยนำโมเดล 20B ที่มี 52 ชั้นสองเวอร์ชั่น มาถอดฝั่ง output 8 ชั้น และ input ของอีกโมเดลหนึ่ง 8 ชั้น แล้วนำมาต่อกันเป็น 34B ข้อมูลที่ใช้ฝึกนั้นมีตั้งแต่ GitHub Code Clean, StarCoderData, และโค้ดอื่นๆ รวมถึง
Google DeepMind เปิดตัวโมเดลปัญญาประดิษฐ์ AlphaFold 3 ที่เป็นปัญญาประดิษฐ์สำหรับการทำนายโครงสร้างของโมเลกุล หลังจากเปิดตัว AlphaFold 2 มาตั้งแต่ปี 2020 และใช้สร้างฐานข้อมูลโครงสร้างโปรตีนเมื่อปี 2022 เปิดให้นักวิจัยเข้าใช้งานได้ฟรี
ทาง DeepMind ระบุว่าจนถึงตอนนี้งานวิจัยที่อ้างอิงกลับมายัง AlphaFold มีจำนวนมากกว่า 20,000 รายงานวิจัย และถูกใช้ในการออกแบบวัคซีนมาลาเรีย, มะเร็ง, ตลอดจนการออกแบบเอนไซม์
กูเกิลปล่อยโมเดล TimesFM โมเดลปัญญาประดิษฐ์พื้นฐาน (foundational model) สำหรับการทำนายข้อมูลตัวเลขโดยเฉพาะ เช่น เมื่อผู้ใช้ให้ตัวเลขเบื้องต้น แล้วโมเดลสามารถทำนายค่าต่อไปได้โดยไม่ต้องฝึกจากข้อมูลก่อนหน้า
กระบวนการฝึกโมเดลนี้ กูเกิลอาศัยข้อมูลในโลกความเป็นจริงรวมกว่าแสนล้านชุด เช่น Google Trends หรือสถิติการเข้าชม Wikipedia พร้อมกับข้อมูลสังเคราะห์ที่เป็นโมเดลทางคณิตศาสตร์หรือฟิสิกส์พื้นฐาน
TIOBE รายงานลำดับความนิยมภาษาโปรแกรมรอบเดือนพฤษภาคม 2024 โดยมีความเปลี่ยนแปลงไม่มากนักยกเว้นภาษา Fortran ที่ขึ้นมาอยู่อันดับ 10 นับเป็นครั้งแรกในรอบ 20 ปีที่ภาษานี้กลับมาอยู่ Top 10
หลังจาก OpenAI ตกลงซื้อข้อมูลจาก Stack Overflow นำข้อมูลไปฝึกปัญญาประดิษฐ์ ผู้ใช้บางส่วนก็แสดงความไม่พอใจ ผู้ใช้ชื่อบัญชี benui ก็พยายามลบคำตอบของตัวเอง แต่กลับถูกล็อกบัญชี
benui ระบุว่าตอนแรกเขาพยายามลบคำตอบแต่ก็พบว่า Stack Overflow ล็อกไม่ให้ลบคำตอบที่ถูกยอมรับแล้วและมีโหวตจำนวนมาก เขาจึงพยายามแก้คำตอบเพื่อประท้วงแต่ผู้ดูแลเว็บก็แก้คำตอบกลับภายในเวลาไม่นาน และล็อกบัญชีของเขาเป็นเวลา 7 วัน
ไม่แน่ชัดว่าตอนนี้มีผู้ใช้พยายามลบหรือแก้คำตอบเพื่อประท้วงมากน้อยเพียงใด แต่ benui ยืนยันว่าจะพยายามขอลบข้อมูลด้วยกระบวนการ GDPR ต่อไป
Go เวอร์ชั่น 1.22 เปลี่ยนโครงสร้างภายในของไลบรารี math/rand เป็นเวอร์ชั่น 2 โดยแกนกลางสำคัญคือการเปลี่ยนอัลกอริทึมจากเดิมที่เคยเป็น linear-feedback shift register แบบง่ายๆ ทำงานได้เร็ว มาเป็นตัวสร้างเลขสุ่มแบบ PCG และ ChaCha8 หลายเดือนหลังปรับปรุงทีมงานก็ออกมาอธิบายแนวคิดเบื้องหลัง
กูเกิลเปิดตัว Google Pixel 8a โทรศัพท์รุ่นกลาง ที่สเปคใกล้เคียงกับ Pixel 8 อย่างมากเพราะใช้ชิปรุ่นเดียวกันและแรมเท่ากัน โดยประกาศใส่ Gemini Nano ตั้งแต่แรก แต่ราคาเปิดตัวถูกกว่า 200 ดอลลาร์ (Pixel 8 ราคาตั้ง 699 ดอลลาร์ Pixel 8a ราคา 499 ดอลลาร์) ตวามแตกต่างของสองรุ่น ได้แก่
กระทรวงยุติธรรมสหรัฐฯ ออกหมายจับ Dimitry Yuryevich Khoroshev (Дмитрий Юрьевич Хорошев) หรือชื่อบัญชี LockBitSupp อายุ 31 ปีจากรัสเซีย ข้อหาเป็นผู้พัฒนาและดำเนินการมัลแวร์เรียกค่าไถ่ LockBit มัลแวร์ที่ประสบความสำเร็จอันดับต้นๆ ได้เงินค่าไถ่รวมกว่า 500 ล้านดอลลาร์สหรัฐฯ โดยตัว Khoroshev เองได้เงินเข้ากระเป๋ากว่า 100 ล้านดอลลาร์สหรัฐฯ
LockBit เป็นมัลแวร์เพื่อการบริการกับตัวแทน (ransomware-as-a-service - RaaS) โดยเครือข่ายของ LockBit จะพยายามหาทางนำมัลแวร์ไปติดตั้งในเครื่องของเหยื่อด้วยวิธีต่างๆ เมื่อแพร่มัลแวร์ได้สำเร็จทาง LockBit จะเป็นคนข่มขู่และเจรจากับเหยื่อ โดยแบ่งค่าไถ่ 80% ให้ผู้กระจายมัลแวร์และทาง LockBit คิดค่าธรรมเนียม 20% (ถูกกว่า App Store 🤔)
หลังจากเหตุการณ์คนร้ายส่งโค้ดมุ่งร้ายเข้าโครงการ XZ โดยคนร้ายแฝงตัวเป็นนักพัฒนาไปช่วยส่งโค้ดเล็กๆ น้อยสร้างความไว้วางใจให้กับผู้ดูแลโครงการเพื่อให้ยกสิทธิ์ส่งโค้ดให้คนร้าย ทาง OpenSSF และ OpenJS ก็ออกมาเตือนว่ามีคนร้ายใช้วิธีการแบบนี้กับโครงการอื่นๆ เหมือนกัน
รูปแบบการโจมตีเหมือนกับที่คนร้ายทำกับโครงการ XZ อย่างมาก ได้แก่ส่งโค้ดเข้ามาเล็กๆ น้อยๆ แม้จะดูเป็นมิตรแต่ก็พยายามเร่งให้โค้ดได้เข้าโครงการเร็วๆ จากนั้นจะมีบัญชีอื่นๆ ช่วยกันโวยวายว่าโค้ดเข้าโครงการช้า โดยโค้ดที่ส่งเข้ามามักจะอ่านยาก, มีไบนารีเป็นก้อนถูกส่งเข้ามาด้วย, หรือบางครั้งก็พยายามเปลี่ยนกระบวนการคอมไพล์โครงการ
Stack Overflow เปิด API ให้บริษัทปัญญาประดิษฐ์ดูดข้อมูลไปใช้ตั้งแต่ต้นปีที่ผ่านมาโดยมีลูกค้ารายแรกคือกูเกิล ตอนนี้ OpenAI ก็ประกาศใช้บริการนี้เหมือนกัน
ประกาศครั้งนี้มีประเด็นเพิ่มเติม คือทาง Stack Overflow จะใช้บริการของ OpenAI มาสร้าง OverflowAI สำหรับช่วยตอบคำถามภายในองค์กรเอง
ทาง Stack Overflow ระบุว่าจะเริ่มเห็นผลของการแลกเปลี่ยนครั้งนี้ภายในกลางปี 2024 นี้ โดยไม่ระบุว่าเป็นอะไร ความเป็นไปได้มีหลากหลาย เช่น ChatGPT อาจจะอ้างอิงกระทู้ใน Stack Overflow โดยตรง, มีโมเดลรุ่นใหม่ที่ฝึกจากชุดข้อมูล Stack Overflow, หรืออาจจะเป็นฝั่ง Stack Overflow ปล่อยบริการ OverflowAI ออกมาก่อน
Figma รายงานถึงกระบวนการย้ายโค้ดของตัวเอง จากเดิมที่ใช้ภาษา Skew ที่เริ่มใช้งานมาตั้งแต่เริ่มต้นบริษัท (ปล่อยเวอร์ชั่นแรกๆ ปี 2016 เหมือนกัน) โดยเงื่อนไขสำคัญคือการใช้ภาษา Skew เพื่อคอมไพล์โค้ดกลางไปใช้งานได้ทั้งเว็บและโทรศัพท์มือถือ โดยตอนนั้นภาษา TypeScript ยังซัพพอร์ตกันไม่มากนัก ทำให้ใช้ Skew เรื่อยมา แต่สุดท้ายก็พบว่าสร้างความลำบากเพราะใช้งานโค้ดหรือเครื่องมือภายนอกไม่ได้ ตลอดจนเสียเวลาฝึกพนักงานใหม่
ทาง Figma ระบุสาเหตุที่เปลี่ยนใจมาใช้ TypeScript ช้าเพราะ Skew เองมีกระบวนการออปติไมซ์ประสิทธิภาพดี ก่อนหน้านี้เคยทดสอบใช้ TypeScript แทน Skew แล้วพบว่าประสิทธิภาพใน Safari กลับลดลงเท่าตัว ซึ่งยอมรับไม่ได้เพราะ iOS ใช้ได้เฉพาะ Safari เท่านั้น
Backblaze บริษัทคลาวด์สตอเรจที่เปิดเผยข้อมูลความน่าเชื่อถือของดิสก์ที่นำมาใช้งานเปิดเผยรายงานรอบล่าสุด โดยรอบนี้เน้นไปที่ดิสก์ที่มีความจุขนาดใหญ่กว่า 12TB เนื่องจากเป็นกลุ่มที่บริษัทกำลังนำมาเปลี่ยนทดแทนดิสก์เดิมไปเรื่อยๆ
ทาง Backblaze เทียบความทนทานของดิสก์ขนาดใหญ่ 3 ความจุ คือ 12TB, 14TB, และ 16TB โดยยกเว้น 22TB เนื่องจากมีเฉพาะ Western Digital รุ่นเดียว
วันนี้ธนาคารบริการออนไลน์ของธนาคาร DBS ในสิงคโปร์ล่มไปตั้งแต่ช่วง 5 โมงเย็นตามเวลาประเทศไทย และแก้ไขจนกลับมาได้ในเวลา 3 ชั่วโมง โดยปัญหาครั้งนี้เกิดขึ้นหลังจากแบงค์ชาติสิงคโปร์ (MAS) เพิ่งปลดคำสั่งล็อกฟีเจอร์ระบบเพื่อให้ธนาคารแก้ปัญหาเสถียรภาพระบบก่อน
นอกจากระบบของ DBS เองแล้ว ระบบของธนาคารไปรษณีย์สิงคโปร์ หรือ POSB ที่ DBS เป็นคนให้บริการก็ล่มไปพร้อมกัน ทางธนาคารขอให้ลูกค้าใช้บัตรเครดิตหรือเดบิต ตลอดจนถอนเงินจาก ATM ไปก่อน
ลูกค้า DBS เข้าไปแสดงความไม่พอใจรูปแบบต่างๆ เช่นพาดพิงถึงซีอีโอธนาคารที่ได้รับค่าจ้างปีที่ผ่านมากว่า 10 ล้านดอลลาร์สิงคโปร์ แม้จะลดลงถึง 27% แล้ว
Maciej Pocwierz วิศวกรซอฟต์แวร์รายงานถึงเหตุที่เขาถูกคิดเงินค่าใช้งาน S3 ที่เขาสร้างขึ้นโดยไม่ได้ใส่ไฟล์อะไรลงไปถึงวันละ 1,300 ดอลลาร์หรือประมาณ 50,000 บาท ล่าสุด Jeff Barr ผู้บริหาร AWS ออกมาระบุว่าจะแก้ปัญหานี้
D. Richard Hipp ผู้สร้าง SQLite ไปออกรายการ The Stack Overflow Podcast เล่าถึงช่วงเริ่มต้นของโครงการ โดยระบุว่าเขาสร้าง sqlite เพราะไปรับงานแล้วมีปัญหาว่าฐานข้อมูล Informix ไม่รันตอนเครื่องบูต ทำให้แอปมีปัญหาแม้เขาจะไม่ได้เป็นคนรับผิดชอบฐานข้อมูลก็ตาม สุดท้ายจึงตัดสินใจสร้างฐานข้อมูลเพื่อใช้งานในโครงการของตัวเองเพราะคิดว่าไม่น่ายากมาก โดยตอนนั้นเขาไม่เคยเรียนวิชาฐานข้อมูลมาก่อน เพียงแค่ใช้ฐานข้อมูลเวลารับทำงานโปรเจคต่างๆ เท่านั้น
แบงค์ชาติสิงคโปร์ (MAS) ปรับมาตรการลงโทษธนาคาร DBS ที่ถูกสั่งล็อกระบบเพื่อให้แก้ปัญหาธนาคารออนไลน์ล่มเมื่อต้นปี 2023 โดยหลังจากนี้จะอนุญาตให้ DBS ปรับระบบและการทำธุรกิจได้ตามปกติ
มาตรการล็อกระบบที่ผ่านมาทำให้ DBS แทบเพิ่มฟีเจอร์อะไรไม่ได้ นอกจากการแก้ให้ระบบเสถียรขึ้นเท่านั้น และยังห้ามไม่ให้ลดสาขาหรือตู้เอทีเอ็มอีกด้วย