Meta อัปเดตแนวทางแสดงป้ายกำกับคอนเทนต์ที่สร้างจาก AI บน Facebook และ Instagram อีกครั้ง โดยป้ายกำกับ "AI info" จะถูกแสดงเฉพาะคอนเทนต์ที่สร้างขึ้นจาก AI หรือมีข้อมูลกำกับตามมาตรฐานที่ตรวจจับได้ หรือผู้ใช้งานระบุเองว่าสร้างจาก AI กรณีคอนเทนต์นั้นถูกแก้ไขหรือปรับแต่งด้วยเครื่องมือ AI ป้ายกำกับ AI info จะย้ายไปอยู่ในเมนูของโพสต์นั้น ซึ่งต้องกดไปดูเพิ่มเติม
Salesforce เปิดตัว Agentforce ชุดเครื่องมือสร้างเอเจนต์ปัญญาประดิษฐ์ ที่สามารถทำตัวเป็นพนักงานเสมือน ช่วยเหลือในการทำงานบางประเภทได้ ทั้งงานวิเคราะห์ข้อมูล ตัดสินใจ ตอบคำถามลูกค้า ประเมินหรือให้คำแนะนำฝ่ายขาย ปรับปรุงแคมเปญการตลาด ฯลฯ ซึ่งองค์กรสามารถสร้าง ปรับแต่ง และดีพลอยเอเจนต์ได้ตามลักษณะงานที่ต้องการ
Salesforce ให้ข้อมูลการสำรวจจากองค์กร พบว่าเวลาของพนักงาน 41% เป็นงานที่มีความซ้ำและสร้างผลกระทบน้อย ซึ่งพนักงานกลุ่มนี้ 65% ก็เชื่อว่า Generative AI สามารถช่วยลดเวลางานที่ทำซ้ำของพวกเขาได้ เพื่อให้โฟกัสกับงานเชิงกลยุทธ์ได้มากขึ้น
กูเกิลเริ่มทยอยปล่อย Gemini Live บริการแชทบอทโต้ตอบด้วยเสียงแบบเรียลไทม์ ให้กับผู้ใช้ Android ทั่วไป หลังปล่อยให้ผู้สมัครแพ็กเกจเสียเงิน Gemini Advanced ตั้งแต่เดือนที่แล้ว
ประกาศของกูเกิลระบุแค่ว่ายังรองรับเฉพาะภาษาอังกฤษ และต้องใช้ผ่านแแอพ Gemini บน Android เท่านั้น แต่ไม่ได้ให้รายละเอียดว่าผู้ใช้แบบฟรีได้จะใช้งานโมเดล Gemini 1.5 Pro ที่เก่งกว่าเวอร์ชันฟรีด้วยหรือไม่
ที่มา - 9to5google
Mistral AI เปิดตัวโมเดล Pixtral 12B ซึ่งเป็นโมเดลข้อมูลผสมผสานตัวแรกของบริษัท พัฒนาต่อยอดจากโมเดลตัวหนังสือ Nemo 12B เป็นโมเดลขนาดพารามิเตอร์ 12B ขนาดของไฟล์ประมาณ 24GB
Pixtral 12B สามารถทำงานได้เหมือนโมเดลข้อมูลผสมผสานอื่น เช่น การจำแนกรายละเอียดในภาพ หรือการนับวัตถุในภาพ เป็นต้น
ดูรายละเอียดเพิ่มเติมได้ที่ GitHub หรือ Hugging Face ภายใต้สัญญา Apache 2.0
กูเกิลประกาศเพิ่มความสามารถใหม่ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 ซึ่งปัจจุบันสามารถใช้งานในไทยได้ด้วย โดยฟีเจอร์ใหม่มีชื่อว่า Audio Overview
ถ้าอธิบายแบบให้เห็นภาพง่ายที่สุด Audio Overview จะทำการแปลงเนื้อหาในเอกสารของผู้ใช้งาน ให้เป็นรายการพอดคาสต์ที่มีผู้ดำเนินรายการสองคน ... โดยจะสร้างเสียงขึ้นเป็นสองผู้ดำเนินรายการด้วย AI แล้วทั้งคู่จะสนทนาบนเนื้อหาต้นฉบับ สรุป และเชื่อมต่อข้อมูลต่าง ๆ ในนั้น ผู้ใช้งานยังสามารถดาวน์โหลดไฟล์เสียงนี้ออกมาได้ด้วย
การใช้งานทำได้โดยเปิด Notebook แล้วเลือก Generate เพื่อสร้างเสียง Audio Overview
Adobe เป็นบริการรายล่าสุดที่เปิดตัวเครื่องมือปัญญาประดิษฐ์สร้างวิดีโอจากอินพุทข้อความ (Text-to-Video) ในชื่อ Adobe Firefly Video Model ซึ่งมาเสริมกับบริการ AI ก่อนหน้านี้ทั้งการสร้างรูปภาพ งานออกแบบ และไฟล์เวกเตอร์ ให้กับลูกค้า Creative Cloud, Experience Cloud และ Adobe Express
Adobe Firefly Video Model รองรับการสร้างคลิปวิดีโอสั้นจากอินพุทแบบข้อความ ที่สามารถกำหนดรายละเอียดเช่น มุมกล้อง การถ่ายภาพ การซูม เพื่อปรับแต่งให้ได้วิดีโอตามต้องการ นอกจากนี้ยังรองรับการสร้างวิดีโอเคลื่อนไหว ทั้งเพื่อการใช้สร้างวิดีโอแบบ B-Roll หรือการทำให้วัตถุในภาพขยับได้แบบสั้น ๆ สามารถนำไปปรับใช้ในงานอนิเมชัน ใส่เอฟเฟกต์ หรือทำวิดีโอแทรกในฟุตเทจที่ต้องการ
Audible แพลตฟอร์มหนังสือเสียงรายใหญ่ที่สุดในโลก เปิดฟีเจอร์ใหม่ให้นักพากย์หนังสือ (narrator) นำเสียงของตัวเองไปฝึก AI สร้างเสียงอ่านหนังสือเล่มต่อๆ ไปโดยไม่ต้องอ่านเอง แต่เจ้าของเสียงยังคงควบคุมการรับงานได้
ESPN ถูกวิจารณ์หลังจากบทความสรุปการแข่งขันฟุตบอลหญิงระหว่าง San Diego และ North Carolina ไม่พูดถึง Alex Morgan นักเตะหญิงมืออาชีพที่เล่นนัดนี้เป็นเกมสุดท้ายเลย
Alex Morgan ลงเล่นในเกมนี้ 15 นาที และเป็นผู้เตะลูกโทษ แต่สรุปเกมของ ESPN Generative AI Services บอกเพียงว่าเกมจบที่คะแนนเท่าใด ใครทำประตูบ้าง โดยไม่ได้พูดถึงความสำคัญของเกมนี้ว่าเป็นเกมสุดท้ายของ Alex Morgan นักฟุตบอลหญิงที่เคยได้เหรียญทองโอลิมปิกเลย
ESPN เพิ่งเปิดตัวบริการสรุปการแข่งขันนี้เมื่อสัปดาห์ที่ผ่านมา โดยระบุว่าทุกบทความจะยังคงมีบรรณาธิการเป็นมนุษย์คอยตรวจสอบบทสรุปอยู่ ตอนนี้ยังคงใช้กับฟุตบอล Premier Lacrosse League (PLL) และ National Women’s Soccer League (NWSL) เท่านั้น
แอปเปิลประกาศแผนอัปเดตฟีเจอร์ปัญญาประดิษฐ์ Apple Intelligence ให้กับผู้ใช้งาน iPhone, iPad และ Mac โดยจะอัปเดตในระบบปฏิบัติการตั้งแต่เดือนตุลาคมเป็นต้นไปใน iOS 18.1, iPadOS 18.1 และ macOS Sequoia 15.1 โดยจะทยอยเพิ่มความสามารถในอัปเดตถัดไป
Apple Intelligence จะเริ่มต้นรองรับการใช้งานเฉพาะภาษาอังกฤษแบบอเมริกัน จากนั้นจะเพิ่มเติมรองรับภาษาอังกฤษแบบออสเตรเลีย, แคนาดา, นิวซีแลนด์, แอฟริกาใต้ และสหราชอาณาจักร ในเดือนธันวาคม ส่วนแผนการรองรับภาษาอื่นจะมีเพิ่มเติมในปีหน้า ได้แก่ ภาษาจีน, ภาษาฝรั่งเศส, ภาษาญี่ปุ่น และภาษาสเปน
The Wall Street Journal อ้างแหล่งข่าวที่เกี่ยวข้องบอกว่า xAI บริษัทปัญญาประดิษฐ์ของ Elon Musk มีการหารือกับ Tesla เพื่อเปิดให้ Tesla เข้าถึงเทคโนโลยีปัญญาประดิษฐ์และทรัพยากรบริษัท แลกกับส่วนแบ่งรายได้จากฝั่ง Tesla ซึ่งอาจมองว่าเป็นกรณีความขัดแย้งทางผลประโยชน์ของ Musk คล้ายข่าวโยกจีพียูหรือดึงตัวพนักงานก่อนหน้านี้
รายงานบอกว่าภายใต้ข้อตกลงนี้ Tesla จะนำโมเดลของ xAI มาใช้กับระบบช่วยขับรถยนต์อัตโนมัติ ฟีเจอร์เสริมอย่างระบบสั่งงานด้วยเสียง ไปจนถึงมีส่วนร่วมในการพัฒนาหุ่นยนต์ Optimus
ทีมวิศวกรจาก IBM และ Meta รายงานถึงการทดลองเปลี่ยนเคอร์เนลการรัน LLM ใน PyTorch จากเดิมที่ใช้ CUDA เป็นหลัก มาเป็นภาษา Triton ของ OpenAI โดยพบว่าประสิทธิภาพเริ่มใกล้เคียงกับ CUDA
OpenAI เปิดตัวโครงการ Triton มาตั้งแต่ปี 2021 โดยมุ่งจะพัฒนาภาษาที่ทำให้โปรแกรมเมอร์เขียนโปรแกรมโดยตรงบนชิปกราฟิกได้ง่ายขึ้น นอกจากการถอด CUDA แล้วยังต้องเลือกเอนจิน Flash Attention มาแทน cuDNN Flash Attention เพื่อรันโมเดล LLM พบว่า AMD Flash Attention ทำงานได้ครบถ้วนทุกโหมด
โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดลทุกตัวในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B
สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้
Replit บริษัทเจ้าของ IDE ผ่านเบราว์เซอร์ ที่ช่วงหลังหันมาเอาดีเรื่อง AI ช่วยเขียนโค้ด และก่อนหน้านี้เพิ่งเปิดตัว Code Repair การใช้โมเดลภาษา LLM ช่วยแก้บั๊กในโค้ด ล่าสุดเปิดตัว Replit Agent บริการ AI ช่วยเสกแอพ แค่พิมพ์สั่งว่าต้องการอะไรใน prompt แล้วจะได้แอพสำเร็จรูปออกมาเลย
Amjad Masad ซีอีโอของ Replit เดโมการสร้างแอพแผนที่แบบง่ายๆ ด้วยการพิมพ์สั่งใน prompt ของ Replit IDE เพียงแค่ว่า
Create an app that shows a map of local landmarks based on my location. Use Wikipedia to fetch the landmarks.
DeepMind เปิดตัวปัญญาประดิษฐ์ AlphaProteo ที่สามารถออกแบบโปรตีนยาเพื่อให้ไปจับ (binding) กับโปรตีนที่ต้องการได้อย่างรวดเร็ว พร้อมกับโชว์ว่าสามารถออกแบบโปรตีนเพื่อจับกับโปรตีนไวรัสหรือโปรตีนก่อโรคต่างๆ ได้อย่างหลากหลาย
นอกจากความเร็วในการออกแบบโปรตีนแล้ว ทีมงานยังพบว่าโปรตีนที่ออกแบบได้มีความสามารถจับโปรตีนเป้าหมายได้ดีกว่าโปรตีนเดิมๆ ที่เคยมีการออกแบบกันมาก เช่น BHRF1 โปรตีนของไวรัสก่อมะเร็งสามารถจับในหลอดทดลองได้ถึง 88% ขณะที่ความแน่นในการจับก็แน่นกว่าโปรตีนที่เคยออกแบบกันมาด้วย
OpenAI เปิดเผยว่าปัจจุบันบริษัทมีลูกค้า ChatGPT แบบเสียเงินของภาคธุรกิจแล้วรวมมากกว่า 1 ล้านบัญชี ซึ่งคิดรวมทั้ง ChatGPT Enterprise, Team และ Edu ของกลุ่มสถาบันการศึกษา ตัวเลขนี้เพิ่มขึ้นจาก 6 แสนบัญชี เมื่อเดือนเมษายน
ผู้ใช้งานทั้งสามกลุ่มแพ็คเกจมากกว่าครึ่งหนึ่งมาจากนอกสหรัฐอเมริกา โดยในสามประเทศที่มีผู้สมัครใช้งานจำนวนมากได้แก่ เยอรมนี ญี่ปุ่น และสหราชอาณาจักร ส่วนหมวดธุรกิจนั้นมีความหลากหลาย ทั้งมหาวิทยาลัย บริษัทยา อีคอมเมิร์ซ ไปจนถึงธนาคาร
YouTube ประกาศปรับปรุงระบบ โดยมีเป้าหมายเพื่อปกป้องผลงานของศิลปินและครีเอเตอร์ในแพลตฟอร์ม จากกระแสที่เข้ามาของ AI ซึ่งมีการสร้างคอนเทนต์ที่พัฒนาจากต้นฉบับกันมากขึ้น
โดย YouTube ได้เพิ่มความสามารถของระบบตรวจจับคอนเทนต์ละเมิดลิขสิทธิ์หรือ Content ID ซึ่งเพิ่มการตรวจจับรูปแบบเสียงร้อง AI ที่ดัดแปลงจากเสียงต้นฉบับ นอกจากนี้ยังสามารถตรวจจับการนำใบหน้าศิลปิน-นักแสดงมาทำคอนเทนต์ได้ด้วย ทั้งหมดจะเริ่มทดสอบใช้งานช่วงต้นปีหน้า
กูเกิลประกาศเปลี่ยนชื่อ TensorFlow Lite (TF Lite) รันไทม์สำหรับรันโมเดล AI บนอุปกรณ์พกพา มาเป็นชื่อใหม่ LiteRT (RT = Runtime)
เหตุผลที่เปลี่ยนเป็นเพราะ TensorFlow Lite พัฒนาตัวเองไปไกลมากกว่า TensorFlow โดยรองรับโมเดลที่พัฒนาด้วยเฟรมเวิร์คยี่ห้ออื่นๆ เช่น PyTorch, JAX, Keras ด้วย รองรับโมเดลหลายรูปแบบทั้ง ML, LLM, diffusion ทำให้การมีคำว่า TensorFlow แปะอยู่ในชื่อจึงชวนให้สับสน ว่าตกลงแล้วใช้กับโมเดลค่ายไหนได้บ้าง
ชื่อใหม่ LiteRT สืบทอดคำว่า Lite ของเดิมต่อ และต้องการแสดงให้เห็นว่าเป็นรันไทม์ขนาดเบา (lite) เอาไว้รันงาน on-device AI บนอุปกรณ์พกพาได้หลากหลาย
Safe Superintelligence หรือ SSI สตาร์ทอัปปัญญาประดิษฐ์ที่ก่อตั้งโดย Ilya Sutskever อดีตหัวหน้านักวิทยาศาสตร์และผู้ร่วมก่อตั้ง OpenAI ประกาศรับเงินลงทุนมากกว่า 1,000 ล้านดอลลาร์ จากกลุ่มนักลงทุนได้แก่ NFDG (กองทุนโดย Nat Friedman และ Daniel Gross ซีอีโอ SSI), a16z, Sequoia, DST Global และ SV Angel
SSI ไม่ได้เปิดเผยมูลค่ากิจการจากการรับเงินลงทุนรอบนี้ แต่แหล่งข่าวที่เกี่ยวข้องบอกกับ Reuters ว่ามูลค่ากิจการ SSI ตอนนี้อยู่ที่ 5,000 ล้านดอลลาร์
Anthropic เปิดตัวแพ็คเกจใช้งานโมเดลปัญญาประดิษฐ์ Claude แบบใหม่สำหรับลูกค้าองค์กร Claude Enterprise มีจุดเด่นในการรองรับชุดความรู้สำหรับองค์กร ขยายขนาดอินพุทที่รองรับ (context windows) เป็น 500K เชื่อมต่อกับ GitHub จึงรองรับงานเขียนโค้ดด้วย และมีฟังก์ชันพื้นฐานความปลอดภัยสำหรับองค์กรเช่น SSO, ระบบจัดการสิทธิ, ระบบแอดมิน ฯลฯ
Anthropic บอกว่ามีลูกค้าที่ร่วมทดสอบ Claude Enterprise แล้วก่อนหน้านี้ เช่น GitLab และ Midjourney
Claude Enterprise ไม่ได้เปิดเผยราคาแพ็คเกจใช้งาน องค์กรที่สนใจต้องติดต่อกับฝ่ายขายของ Anthropic เท่านั้น
ที่มา: Anthropic
Sakana AI บริษัทพัฒนาและวิจัยปัญญาประดิษฐ์จากญี่ปุ่น ซึ่งก่อตั้งโดยสองอดีตนักวิจัยจากกูเกิล ประกาศรับเงินลงทุนซีรีส์ A รวมมากกว่า 100 ล้านดอลลาร์ โดยมีนักลงทุนหลักได้แก่ New Enterprise Associates, Khosla Ventures, Lux Capital และมี NVIDIA ร่วมลงทุนด้วย มูลค่ากิจการไม่มีการเปิดเผยเป็นทางการ
งานวิจัยของ Sakana AI ใช้การพัฒนาโมเดลแบบอิงธรรมชาติการเรียนรู้ของมนุษย์ โดยการรวมโมเดลที่มีความสามารถเฉพาะทางเข้าด้วยกันเหมือนการสะสมความรู้ แล้วให้วิวัฒนาการความรู้ความสามารถเพิ่มขึ้น
ในความร่วมมือกับ NVIDIA นี้ Sakana AI บอกว่าบริษัทได้ทั้งการเข้าถึงเทคโนโลยีจีพียูสำหรับการพัฒนา สนับสนุนการตั้งศูนย์ข้อมูลเพื่อการประมวลผลในญี่ปุ่น รวมถึงช่วยส่งเสริมชุมชนนักพัฒนา AI ในญี่ปุ่น
Anthropic ประกาศเปิดใช้งานฟีเจอร์ Artifacts ในแชทบอท Claude อย่างเป็นทางการ หลังจากเปิดทดสอบมาตั้งแต่เดือนมิถุนายนตอนเปิดตัว Claude 3.5
Artifacts เป็นหน้าต่างที่เปิดมาด้านข่างของแชทบอท Claude เพื่อแสดงโค้ด รูปภาพ ตาราง แผนผัง ฯลฯ ที่สร้างด้วย Claude เพื่อให้ผู้ใช้เห็นภาพมากขึ้นว่า AI ช่วยสร้างอะไรขึ้นมา อีกทั้งยังสามารถแก้ไขโค้ดหรือข้อมูลในหน้าต่างนั้นได้แบบเรียลไทม์ ซึ่ง Anthropic บอกว่าเป็นการพัฒนาวิธีการสื่อสารกับ AI จากเดิมที่เป็นแค่การสนทนาโต้ตอบกัน ไปสู่การทำงานร่วมกัน (collaborative work environment) และในอนาคตจะขยายไปยังการทำงานร่วมกันภายในองค์กรด้วย
ทีมวิจัยจาก Ecole Polytechnique Federale de Lausanne (EPFL) ประกาศความสำเร็จในการพัฒนาชิปรันโมเดลปัญญาประดิษฐ์ขนาดเล็กที่จะเปิดทางให้เชื่อมสัญญาณจากสมองเข้าไปยังชิปเพื่อถอดรหัสข้อมูลออกมาได้โดยตรง ใช้ชื่อว่า miniaturized BMI (MiBMI)
MiBMI เป็นชิปขนาดเล็กรรับอินพุต 192 ช่อง ภายในชิปมีตัว neural decoder จำนวน 31 ชุด มีความสามารถในการรันโมเดลจดจำลายมือได้ความแม่นยำสูง 91.3% แต่ยังไม่ได้ทดสอบถึงระดับเชื่อมต่อกับสมองมนุษย์จริง แต่ทีมงานก็ทดสอบถอดรหัสสมองหนูว่ากำลังได้ยินเสียงอะไร โดยจำแนกเสียง 6 ชนิด ได้ความแม่นยำ 87%
สำนักข่าว Reuters อ้างแหล่งข่าวที่เกี่ยวข้องบอกว่า Amazon มีแผนเปิดตัวระบบผู้ช่วยอัจฉริยะ Alexa เวอร์ชันอัปเกรดใหญ่ในเดือนตุลาคมนี้ เพื่อให้ทันก่อนเทศกาลวันหยุดปลายปี ซึ่ง Alexa ใหม่นี้จะใช้ Claude โมเดลปัญญาประดิษฐ์ของ Anthropic ที่ Amazon ไปร่วมลงทุนเป็นแกนหลักในการทำงาน
ก่อนหน้านี้มีรายงานเรื่องการออก Alexa แบบใหม่ที่ใช้ AI ช่วยในการทำงาน แต่ลูกค้าอาจต้องจ่ายเงินเพิ่ม ซึ่งมีรายงานในเวลาต่อมาว่าการพัฒนาเลื่อนออกไปจากแผนเดิม เนื่องจาก Amazon ตัดสินใจไม่ยกเครื่อง Alexa เดิม
AMD เผยผลเบนช์มาร์ค MLPerf ของจีพียู Instinct MI300X เป็นครั้งแรก ประสิทธิภาพใกล้เคียงกับ NVIDIA H100 รุ่นยอดนิยม
Meta เผยยอดดาวน์โหลดโมเดลภาษาขนาดใหญ่ตระกูล Llama ทะลุ 350 ล้านครั้ง (นับเฉพาะบน Hugging Face) และมีโมเดลเวอร์ชันพัฒนาต่อยอดมากกว่า 60,000 ตัวบน Hugging Face
Llama ถือเป็นโมเดลภาษาขนาดใหญ่ที่เป็นโอเพนซอร์สเกือบ 100% (มีเงื่อนไขการใช้งานจำกัดเฉพาะบริษัทไอทีและคลาวด์รายใหญ่เท่านั้น) เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2023 และใช้เวลา 18 เดือน พัฒนาตัวเองกลายมาเป็นโมเดลยอดนิยม