ไมโครซอฟท์ประกาศรองรับ โปรโตคอล Agent2Agent (A2A) ของกูเกิล ที่ออกแบบมาให้ AI agent หลายๆ ตัวคุยกันเองได้
กูเกิลเปิดตัว A2A ในเดือนเมษายน โดยมีผู้สนับสนุนเป็นบริษัทไอทีใหญ่ๆ จำนวนมาก แต่ในบรรดาบริษัทยักษ์ใหญ่ในวงการ generative AI มีไมโครซอฟท์เป็นรายแรกที่ขยับตัวก่อน ประกาศสนับสนุน A2A แล้ว โดยไมโครซอฟท์ให้เหตุผลว่าเป็นไปตามนโยบายการสนับสนุนมาตรฐานเปิด ดังที่ก่อนหน้านี้เข้าไปช่วยพัฒนา Model Context Protocol (MCP) ของ Anthropic มาแล้ว
ไมโครซอฟท์จะรองรับ A2A ในบริการ Azure AI Foundry และ Copilot Studio ในเร็วๆ นี้
Gogolook บริษัท TrustTech ผู้พัฒนาแอปพลิเคชัน Whoscall เปิดตัวฟีเจอร์ใหม่ “คอนเทนต์เช็กเกอร์ Content Checker” ตรวจสอบข้อความหลอกลวงในรูปภาพได้ ไม่ว่าจะเป็นข้อความทาง SMS หรือคอนเทนต์บนโซเชียลมีเดีย โดยใช้ Whoscall AI วิเคราะห์ภาพ และแจ้งผลทันที
Whoscall ใช้ AI และฐานข้อมูลที่แพลตฟอร์มมีอยู่ เช่น หมายเลขโทรศัพท์ ข้อความ SMS เว็บไซต์ ข้อมูลสาธารณะ และรายงานจากผู้ใช้งาน เพื่อวิเคราะห์ ตรวจสอบ และเปรียบเทียบเนื้อหาในภาพที่ผู้ใช้อัปโหลด กับความเสี่ยงในการหลอกลวงเท่านั้น ไม่มีการนำข้อมูลไปใช้ในส่วนอื่น ๆ แต่อย่างใด
โดยขั้นตอนการใช้งาน มีดังนี้:
รายงานของสหประชาชาติพบว่า คนส่วนใหญ่ในประเทศกำลังพัฒนาคาดหวังว่า AI จะช่วยเพิ่มประสิทธิภาพการผลิตภายในปีหน้า โดย 70% ของประชากรในประเทศที่มีคะแนนการพัฒนาของมนุษย์ต่ำถึงปานกลางเชื่อว่า AI จะช่วยเพิ่มประโยชน์ในด้านต่าง ๆ เช่น การศึกษา การดูแลสุขภาพ และการทำงาน
อย่างไรก็ตาม ยังมีแนวโน้มที่น่ากังวล นั่นก็คือการพัฒนาของมนุษย์ทั่วโลกกำลังชะลอตัวลง โดยมีอัตราการเติบโตต่ำสุดตั้งแต่ปี 1990 จากภาวะสงคราม ความตึงเครียดทางการค้า วิกฤตหนี้ และผลกระทบที่ยังคงอยู่จากการระบาดของโควิด-19 ซึ่งทำให้ช่องว่างระหว่างประเทศที่ร่ำรวยและยากจน ยังขยายตัวต่อเนื่องเป็นเวลา 4 ปี
อุตสาหกรรมดาต้าเซ็นเตอร์ของสหรัฐฯ เตือนว่าการที่รัฐบาล Trump ปราบปรามพลังงานหมุนเวียนอย่างเข้มงวด กำลังขัดขวางการเติบโตของกลุ่มดาต้าเซ็นเตอร์ และทำให้สหรัฐฯ เสี่ยงเสียตำแหน่งผู้นำ AI ระดับโลกให้กับจีนได้
จีนออกมาตรการเชิงรุกในการส่งเสริม และปรับปรุงโครงข่ายไฟฟ้าให้ทันสมัย และการจ่ายพลังงานที่มีประสิทธิภาพ ซึ่งตรงข้ามกับสหรัฐฯ ที่ระงับการพัฒนาพลังงานสะอาดบนที่ดินของรัฐบาลกลาง หยุดการปล่อยเงินกู้สำหรับพลังงานสะอาด และยกเลิกโครงการสำคัญ เช่น โครงการพลังงานลมของ Equinor มูลค่า 5 พันล้านดอลลาร์ฯ
AWS เผยรายงานผลการศึกษา Gen AI Adoption Index โดยสำรวจเจ้าหน้าที่ฝ่ายไอทีระดับอาวุโสที่มีอำนาจตัดสินใจ 3,739 คน ใน 9 ประเทศ ได้แก่ อเมริกา บราซิล แคนาดา ฝรั่งเศส เยอรมนี อินเดีย ญี่ปุ่น เกาหลีใต้ และสหราชอาณาจักร ครอบคลุมอุตสาหกรรมการเงิน, สื่อสาร, การผลิต และค้าปลีก เกี่ยวกับการตัดสินใจลงทุนด้าน Genarative AI
ประเด็นสำคัญจากรายงานนี้ได้แก่
ผลการศึกษา Oxford พบว่า AI มีแนวโน้มที่จะวินิจฉัยโรคผิดพลาด และมักประเมินความรุนแรงของอาการต่ำกว่าความเป็นจริง แทนที่จะให้คำปรึกษาได้ดีแบบวิธีเดิม ๆ เช่น ค้นหาผ่านอินเทอร์เน็ต หรือใช้วิจารณญาณส่วนตัว
แม้ผลสำรวจโดย Fierce Healthcare พบว่า 1 ใน 6 ของคนอเมริกาหันมาใช้แชทบอท AI วินิจฉัยโรค และขอคำปรึกษาด้านสุขภาพอย่างน้อยเดือนละครั้ง เพื่อแก้ปัญหาค่ารักษาพยาบาลที่เพิ่มสูงขึ้น และต้องรอคิวนาน
นักวิจัย Oxford บอกว่าปัญหานี้ดูเหมือนจะเกิดจากช่องว่างในการสื่อสาร นั่นก็คือผู้ใช้มักไม่รู้ว่าควรให้ข้อมูลอะไรกับแชทบอท และคำตอบที่ได้ก็มักจะผสมระหว่างคำแนะนำที่ถูกต้องและผิดพลาด ทำให้ตีความได้ยาก
Open WebUI โครงการหน้าจอแชตยอดนิยมในโลกโอเพนซอร์ส ประกาศเปลี่ยนไลเซนส์จากเดิมใช้ BSD-3 ที่ให้อิสระอย่างมาก มาเป็น BSD-3 เวอร์ชั่นดัดแปลงที่บังคับห้ามลบแบรนด์ออกจากเว็บ
มีข้อมูลเพิ่มเติมหลังจาก OpenAI ประกาศแผนการปรับโครงสร้างบริษัท โดยไม่ได้เปลี่ยนให้ส่วนธุรกิจแสวงหากำไรหรือ For-Profit มีอำนาจควบคุมธุรกิจเริ่มต้นตอนก่อตั้งที่ไม่แสวงหากำไร (Non-Profit) ตามที่มีข่าวก่อนหน้า แต่ใช้วิธีเปลี่ยนแปลงส่วน For-Profit เป็นบริษัท PBC (Public Benefit Corporation) ที่สร้างกำไรเพื่อประโยชน์ของสาธารณะแทน
ถึงตรงนี้ก็อาจมีคำถามว่าแล้วการเปลี่ยนเป็น PBC ต่างกับรูปแบบ For-Profit เดิมอย่างไร
OpenAI ประกาศความคืบหน้าของแผนปรับโครงสร้างบริษัท โดยให้ส่วนไม่แสวงหากำไร (Non-Profit) ที่เป็นส่วนหลักของบริษัทตั้งแต่วันก่อตั้งยังคงอยู่ และมีอำนาจสูงสุดในบริษัทต่อไป ส่วนธุรกิจที่แสวงหากำไร (For-Profit) ซึ่งก่อตั้งเป็นบริษัทลูกของ Non-Profit ตั้งแต่ปี 2019 จะแปลงสภาพเป็นบริษัทที่มุ่งเน้นกำไรเพื่อประโยชน์ของสาธารณะ (Public Benefit Corporation - PBC) โดยมี Non-Profit เป็นผู้ถือหุ้นรายใหญ่ที่สุด และมีอำนาจควบคุมบริษัทมากที่สุดเหมือนเดิม
ผู้พิพากษา Vince Chhabria แห่งศาลชั้นต้นรัฐบาลกลางสหรัฐฯ (US District Court) แสดงความเห็นระหว่างขั้นตอนการไต่สวน คดี Meta นำข้อมูลหนังสือไปฝึกปัญญาประดิษฐ์ ว่า เขาไม่เข้าใจว่าทำไมการใช้งานของ Meta จะเป็นการใช้งานเป็นธรรมได้อย่างไร
การใช้งานที่เป็นธรรม (fair use) เป็นแนวทางการใช้งานอย่างจำกัดที่เปิดให้ผู้อื่นสามารถนำงานที่มีลิขสิทธิ์ไปใช้งานต่อได้โดยไม่ต้องจ่ายค่าลิขสิทธิ์ เช่น การวิจารณ์หนังสือหรือภาพยนตร์, การใช้งานเพื่อการวิจัย, หรือการรายงานข่าว
ทีมวิจัยจากมหาวิทยาลัยชิคาโกและมหาวิทยาลัยโคเปนเฮเกน รายงานถึงการสำรวจผลกระทบของปัญญาประดิษฐ์อย่าง ChatGPT ต่อการทำงาน 11 อาชีพ รวมครอบคลุมคนทำงานถึง 25,000 คน นายจ้าง 7,000 แห่ง พบว่าปัญญาประดิษฐ์ช่วยประหยัดเวลาทำงานรวม 2.8% หรือประมาณสัปดาห์ละชั่วโมง แต่กลับสร้างงานใหม่ๆ เพิ่มขึ้น ทำให้โดยรวมแล้วมีผลต่อผลิตภาพรวมไม่สูงนัก
ผลสำรวจระบุว่าการใช้ปัญญาประดิษฐ์ประหยัดเวลาทำงานได้ 2.8% หรือประมาณสัปดาห์ละชั่วโมง ต่างจากผลสำรวจอื่นที่เคยออกมาก่อนหน้านี้ที่ระบุว่าปัญญาประดิษฐ์ช่วยประหยัดเวลาถึง 15% เหตุผลหนึ่งคือการสำรวจรอบนี้ครอบคลุมงานหลายประเภทกว่า ไม่ได้จำกัดเฉพาะงานที่เหมาะกับปัญญาประดิษฐ์
Kevin Systrom ผู้ร่วมก่อตั้ง Instagram เข้าร่วมงานสัมมนา StartupGrind เรื่องการสร้างสตาร์ทอัปและสเกลธุรกิจ โดยมีเนื้อหาช่วงหนึ่งพูดถึงการเกิดขึ้นของแพลตฟอร์มแชทบอต AI จำนวนมากที่กำลังเติบโต
Systrom บอกว่าหลายบริษัทใช้เทคนิคเพิ่ม Engagement ผู้ใช้งานแชทบอต โดยให้ข้อมูลเพียงบางส่วนหรือสร้างคำถามปิดท้ายบทสนทนา เพื่อให้ผู้ใช้งานถามต่อไปเรื่อย ๆ แทนที่จะให้คำตอบที่ตรงต้องการไปเลย ซึ่งเป็นประโยชน์กับผู้ใช้งานมากกว่า เขาบอกว่าเทคนิคแบบนี้พบได้จากบริษัทโซเชียลมีเดีย
Anthropic เปิดตัววิธีการเชื่อมต่อแอปหรือเครื่องมือของนักพัฒนาเข้ากับปัญญาประดิษฐ์ Claude แบบใหม่ เรียกรวมวิธีการนี้ว่า Integrations ซึ่งเป็นการขยายความสามารถของโปรโตคอล MCP ให้รองรับทั้งการเชื่อมต่อระหว่างเซิร์ฟเวอร์กับเว็บหรือแอปบนเดสก์ท็อปเพิ่มเติม
ในเบื้องต้นบริการที่รองรับ Integrations ได้แก่ Jira, Confluence, Zapier, Cloudflare, Intercom, Asana, Square, Sentry, PayPal, Linear และ Plaid โดยจะมีบริการเพิ่มเติมในอนาคตอีกเช่น Stripe และ GitLab
ประโยชน์ที่ได้เพิ่มจากการเชื่อมต่อนี้ ทำให้ Claude เข้าใจบริบทมากขึ้นทั้งจากประวัติข้อมูล สถานะปัจจุบันของงาน ไปจนถึงชุดความรู้ที่มีเฉพาะในองค์กร จึงทำงานได้อย่างเข้าใจผู้ใช้งานมากยิ่งขึ้น
มีประเด็นเพิ่มเติมในการแถลงผลประกอบการของ Meta ไตรมาสล่าสุด ซีอีโอ Mark Zuckerberg ได้พูดถึงปัญญาประดิษฐ์ที่บริษัทพัฒนาในหลายรูปแบบ ว่าตอนนี้ AI เข้ามาเปลี่ยนหลายอย่างรอบตัว บริษัทจึงเพิ่มการลงทุนส่วนนี้มากขึ้น โดยเน้นไปที่ 5 หัวข้อที่มองเห็นโอกาสใหญ่ ซึ่งอาจไม่ได้สำเร็จไปทั้งหมดในแง่ผลตอบแทนการลงทุน แต่เชื่อว่าเป็นแนวทางที่เหมาะสม
AWS มีบริการแชทบ็อทชื่อ Amazon Q ที่มีเวอร์ชันย่อย Amazon Q Developer ช่วยทำงานเขียนโค้ด และถูกนำมาใช้งานจริงกับโปรแกรมเมอร์ของ Amazon เอง
ล่าสุด Amazon Q เปิดตัวฟีเจอร์ Agentic ยกระดับความสามารถเหมือนเป็นคู่หูโปรแกรมเมอร์ช่วยเขียนโค้ดได้มากกว่าเดิม แบบเดียวกับที่ GitHub Copilot เปิดตัวฟีเจอร์ Agentic ในเดือนกุมภาพันธ์
Amazon Q Developer สามารถเชื่อมกับ IDE โดยตรง (ช่วงแรก โหมด Agentic ยังรองรับเฉพาะ VS Code) ผู้ใช้สามารถเขียนพร็อมต์สั่งงานให้ Q อ่านไฟล์ทั้งหมดจาก repository แล้วสร้างซอฟต์แวร์ตามที่ต้องการได้
นักพัฒนาชื่อ Joel Z ประสบความสำเร็จในการนำโมเดล Gemini 2.5 Pro มาเล่นเกม Pokemon Blue จนจบเกมได้สำเร็จ ถือเป็นอีกหมุดหมายสำคัญของการนำโมเดล LLM มาใช้เล่นวิดีโอเกม
โครงการนำ LLM มาเล่นเกม Pokemon เริ่มจากโครงการ Claude Plays Pokemon ที่นำโมเดล Claude ของ Anthropic มาเล่นเกม Pokemon Red ของเครื่อง Game Boy โดยให้ Claude อ่านภาพและข้อความบนหน้าจอและควบคุมเกมโดยลำพัง ไม่ต้องมีมนุษย์เข้าช่วย และ Claude ไม่มีความรู้เรื่องเกม Pokemon มาก่อน (นอกเหนือจากคลังข้อมูลปกติของ Claude ที่อาจมีเรื่อง Pokemon บ้าง) แล้วถ่ายทอดให้สาธารณชนดูผ่าน Twitch อย่างไรก็ตาม แม้ Claude พอเล่นเกมได้แต่ยังไม่ประสบความสำเร็จในการเล่นเกมให้จบ
Suno ผู้ให้บริการปัญญาประดิษฐ์สร้างเพลง เปิดตัวโมเดลเวอร์ชั่น 4.5 ที่สามารถสร้างเพลงตามประเภทอย่างละเอียด เช่น punk rock, jazz house เพื่อให้ระบุประเภทเพลงที่ตรงความต้องการ
การรับคำบรรยายอย่างละเอียดทำให้ผู้ใช้สามารถบรรยายถึงเสียงที่อยากได้ บรรยายเสียงเครื่องดนตรีแต่ละชิ้น และโทนการบรรเลงเพลง พร้อมกับระบบช่วยขยายพรอมพ์เพื่อขยายความให้ชัดเจน เปิดให้ผู้ใช้ปรับพรอมพ์ก่อนใช้งาน
ตัวโมเดลรองรับการสร้างเพลงยาวสูงสุด 8 นาที
ที่มา - Suno
กูเกิลเตรียมเพิ่มบริษัทแชทบอต AI Gemini ให้กับผู้ใช้งานเด็กที่อายุต่ำกว่า 13 ปี ซึ่งมีบัญชีผู้ปกครองดูแลอยู่ผ่าน Family Link ในสัปดาห์หน้า โดยกูเกิลส่งอีเมลแจ้งการเพิ่มบริการนี้ไปยังผู้ปกครองของเด็ก
ตัวแทนของกูเกิลให้ข้อมูลเพิ่มเติมว่า Gemini เวอร์ชันสำหรับเด็กได้กำหนดเงื่อนไขเพิ่มเติม เพื่อป้องกันไม่ให้เด็กได้รับเนื้อหาที่ไม่เหมาะสม รวมทั้งบอกว่าข้อมูลที่เด็กใช้งานจะไม่ถูกรวบรวมเพื่อฝึกฝน AI ต่อ
ข้อมูลนี้มาจาก Mark Gurman แห่ง Bloomberg คนเดิม เขาอ้างแหล่งข่าวในแอปเปิลว่าบริษัทได้ร่วมมือกับ Anthropic เพื่อนำโมเดลปัญญาประดิษฐ์ Claude มาเสริมการทำงานใน Xcode ในการช่วยเขียนโค้ด ซึ่งความร่วมมือนี้ไม่มีการประกาศเป็นทางการ
อย่างไรก็ตามแอปเปิลนำ Claude มาใช้กับ Xcode เฉพาะภายในบริษัทเท่านั้น และยังไม่มีแผนนำความสามารถนี้มาให้นักพัฒนาทั่วไปใช้งาน ข้อมูลจึงอาจสรุปไม่ได้ว่าแอปเปิลมองหาพันธมิตรใหม่สำหรับโมเดล AI นอกจาก OpenAI หรือ Google แต่บอกได้ว่าแอปเปิลก็นำ AI มาช่วยเพิ่มประสิทธิภาพการพัฒนาซอฟต์แวร์เช่นกัน
แอปเปิลเปิดตัว Xcode ที่มีผู้ช่วย AI ตั้งแต่ปีที่แล้ว แต่ฟีเจอร์ Swift Assist ก็ยังไม่มีให้ใช้งาน
Pinterest ประกาศแผนจัดการเนื้อหาบนแพลตฟอร์มที่สร้างขึ้นจาก Generative AI โดยใช้เครื่องมือติดป้ายกำกับคอนเทนต์ประเภทดังกล่าวว่าเป็น Gen AI อัตโนมัติ มีผลทั่วโลกแล้วตั้งแต่วันนี้ ซึ่ง Pinterest ได้ทดสอบมาตั้งแต่เดือนมีนาคม
เมื่อผู้ใช้งานคลิกดูคอนเทนต์ที่ถูกสร้างจาก AI จะปรากฏข้อความว่า AI modified ที่มุมล่างซ้าย ซึ่งเป็นการติดป้ายกำกับอัตโนมัติทั้งใช้ข้อมูลจาก metadata หรือจากการตรวจสอบด้วยระบบของ Pinterest โดยมีระบบแจ้งรายงานสำหรับครีเอเตอร์หากพวกเขาพบว่าถูกระบบติดป้ายกำกับไม่ถูกต้อง
ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็กตัวใหม่ในซีรีส์ Phi-4 เป็นโมเดลแบบให้เหตุผล (reasoning) จำนวน 3 ตัว 3 ขนาดคือ
Amazon เปิดตัวโมเดลภาษารุ่นใหญ่ที่สุด Amazon Nova Premier ใหญ่กว่า Nova Pro รุ่นก่อนหน้านี้ มีขนาด context window 1 ล้านโทเคน (Pro 3 แสนโทเคน) สามารถทำงานที่ซับซ้อนสูง รวมถึงใช้เป็นโมเดลแม่ไปสอนโมเดลอื่นทำ distillation ได้ด้วย
Nova Premier มีความสามารถสูงกว่า Nova Pro ในทุกเบนช์มาร์ค โดย Amazon บอกว่ามันถือว่าเป็นโมเดลกลุ่ม non-reasoning ที่เก่งที่สุดในวงการตอนนี้ สามารถทำงาน agent ประสานงานกันได้ และยังมีจุดเด่นที่ราคาค่ารันบน Amazon Bedrock ถูกกว่าโมเดลคู่แข่งระดับเดียวกัน (ราคาอินพุต 0.0025 ดอลลาร์ต่อ 1 พันโทเคน, ราคาเอาท์พุต 0.0125 ดอลลาร์ต่อ 1 พันโทเคน)
ยังมีประเด็นเพิ่มเติมในช่วงแถลงผลประกอบการของ Meta ไตรมาสที่ผ่านมา โดยซีอีโอ Mark Zuckerberg พูดถึงการเติบโตและโอกาสของบริการแชทบอตปัญญาประดิษฐ์ Meta ซึ่งมีผู้ใช้งานมากกว่า 1 พันล้านบัญชี และบริษัทเพิ่งออกแอปแยกสำหรับใช้งาน Meta AI โดยเฉพาะ
Zuckerberg พูดถึงการแสดงโฆษณาบน Meta AI ว่าทำได้ทั้งการแนะนำสินค้าผ่านแชทบอต หรือแสดงโฆษณาโดยตรง เขายังสนใจเพิ่มตัวเลือกสมัครใช้งาน Meta AI แบบพรีเมียม ที่จ่ายเงินเพื่อให้เข้าถึงฟีเจอร์สูงกว่า หรือเข้าถึงทรัพยากรประมวลผลมากขึ้น แนวทางเดียวกับผู้ให้บริการแชทบอต AI รายอื่น
กูเกิลเพิ่มความสามารถให้แชทบอต Gemini สามารถแก้ไขรูปภาพได้ตาม prompt ที่กำหนด รองรับทั้งรูปภาพที่สร้างขึ้นจาก AI และรูปภาพที่ผู้ใช้งานอัปโหลดเข้ามา ซึ่งฟีเจอร์นี้กูเกิลทดสอบไปก่อนหน้าแล้วในแพลตฟอร์ม AI Studio สำหรับนักพัฒนา
กูเกิลบอกว่าผู้ใช้งานสามารถป้อนคำสั่ง เช่น ลบหรือเปลี่ยนฉากหลัง, เพิ่มวัตถุในรูป หรือองค์ประกอบอื่นที่ต้องการ โดยฟีเจอร์นี้เริ่มทยอยอัปเดตให้ผู้ใช้ Gemini ตั้งแต่วันนี้เป็นต้นไป รองรับมากกว่า 45 ภาษา และในหลายประเทศทั่วโลกภายในไม่กี่สัปดาห์ข้างหน้า
กูเกิลบอกว่าความสามารถแก้ไขรูปภาพนี้สามารถทำงานแบบทีละขั้น ทำให้ลงรายละเอียดปลีกย่อยในการแก้ไขได้ดี รูปภาพทั้งหมดที่สร้างขึ้นจะถูกฝังลายน้ำ SynthID ตามมาตรฐานรูปที่ถูกสร้างจาก AI
MiMo มีขนาด 7B พารามิเตอร์ ผลการทดสอบหัวข้อ AIME 2024-2025 และ LiveCodeBench v5 ทำคะแนนได้สูงกว่า o1-mini และ QwQ-32B-Preview
โมเดลชุดแรกที่ Xiaomi เผยแพร่ได้แก่ MiMo-7B-Base
เป็นโมเดลพื้นฐาน, MiMo-7B-RL-Zero
ที่ถูกฝึกฝนแบบ Reinforce จากโมเดลพื้นฐาน, MiMo-7B-SFT
ที่ถูกฝึกแบบ Supervised และ MiMo-7B-RL
ที่ถูกฝึกจากโมเดล SFT ดูรายละเอียดได้ที่ GitHub และ Hugging Face