กูเกิลเปิดตัว Gemini 2.0 Flash รุ่นทดสอบ เป็นโมเดลแรกในกลุ่ม Gemini 2.0 ที่น่าจะเปิดตัวตามกันออกมา โดยความสามารถสำคัญคือการตอบคำถามด้วย ภาพ, ข้อความ, และเสียง โดยไม่ต้องใช้โมเดลอื่นๆ มาสร้างภาพให้
ผลทดสอบของ Gemini 2.0 Flash ดีขึ้นในการทดสอบสำคัญๆ หลายส่วนโดยเฉพาะการทดสอบการเขียนโค้ด, คณิตศาสตร์, และความรู้ทั่วไป สามารถทำคะแนนได้ดีกว่า Gemini 1.5 Pro เสียอีก อย่างไรก็ดีคะแนนบางส่วนแย่ลงกว่า Gemini 1.5 Flash บ้าง เช่น คะแนนทดสอบการแปลเสียงเป็นข้อความ หรือการทำความเข้าใจข้อมูลขนาดยาว แต่คะแนนก็ลดลงไม่มากนัก สำหรับนักพัฒนา Gemini 2.0 สามารถค้นกูเกิล, รันโค้ด, และเรียกฟังก์ชั่นภายนอกได้ในตัว
กูเกิลทดสอบความสามารถชอง Gemini 2.0 ด้วย โครงการสาธิตต่างๆ ได้แก่
OpenAI ประกาศว่า Canvas อินเทอร์เฟซสำหรับการใช้งาน ChatGPT ที่ช่วยเพิ่มประสิทธิภาพการทำงาน โดยเฉพาะกับการให้ ChatGPT ช่วยเขียนบทความหรือแก้ไขโค้ด เปิดให้ผู้ใช้งานทุกคนรวมทั้งแบบฟรีใช้งานได้แล้ว จากก่อนหน้านี้จำกัดเฉพาะลูกค้าเสียเงิน
Canvas ใน ChatGPT เปิดให้ใช้งานผ่านเว็บไซต์บนโมเดล GPT-4o ทำให้ผู้ใช้งานไม่ต้องเลือกโมเดลที่ต้องการแบบเวอร์ชันที่ทดสอบก่อนหน้านี้ และรองรับการเรียกใช้โมเดล GPTs ที่คัสตอมได้ด้วย
ในการสาธิต ChatGPT ได้รองรับการจัดการโค้ดได้ดีขึ้น เช่น เมื่อผู้ใช้งานคัดลอกวางโค้ด Python ในกล่องแชท ระบบจะเรียก Canvas ขึ้นมาให้อัตโนมัติเนื่องจากเหมาะกับการใช้งานจัดการโค้ด ที่แก้ไขเป็นจุดที่สนใจมากกว่า
Automattic บริษัทแม่ของ WordPress ประกาศซื้อกิจการ WPAI สตาร์ทอัปที่พัฒนาโซลูชัน AI บน WordPress โดยดีลนี้ไม่มีการเปิดเผยมูลค่า
WPAI มีเครื่องมือหลายอย่างได้แก่ CodeWP สำหรับสร้างปลั๊กอิน WordPress ด้วย AI, AgentWP ผู้ช่วย AI สำหรับสร้างเว็บไซต์ WordPress และ WP Chat แชทบอตถามตอบปัญหา WordPress
ทีมงานผู้ก่อตั้ง WPAI จะเข้าร่วมงานกับ Automattic ในส่วนพัฒนาฟีเจอร์ AI ขณะที่เครื่องมือ CodeWP และ AgentWP จะยุติการใช้งาน เพราะจะถูกนำไปรวมเป็นส่วนหนึ่งของ WordPress ตามข้อตกลงในการขายกิจการ
ที่มา: TechCrunch
Reddit เปิดตัว Reddit Answers บริการคุณถาม-บอทตอบด้วยพลัง AI ช่วยสรุปและค้นหากระทู้เก่าให้อย่างสะดวก
AI ของ Reddit จะไปค้นคลังกระทู้เก่าๆ มาสรุปคำตอบที่เหมาะสมให้กับคำถามของเรา และลิงก์ไปยังกระทู้ต้นทางเพื่ออ่านเนื้อหาฉบับเต็ม
Reddit บอกว่าบริการตัวนี้เป็น AI-powered search ซึ่งเป็นหนึ่งในวิสัยทัศน์ของบริษัทที่ต้องการปรับปรุงระบบค้นหา ตอนนี้ยังใช้งานได้เฉพาะภาษาอังกฤษ และเปิดให้ใช้เฉพาะลูกค้าบางกลุ่มในสหรัฐอเมริกา
ที่มา - Reddit
OpenAI เปิดตัว Sora ปัญญาประดิษฐ์สร้างวิดีโออย่างเป็นทางการ หลังจากสาธิตการทำงานตั้งแต่ต้นปีที่ผ่านมา พร้อมกับเปิดความสามารถนอกเหนือจากการใส่พรอมพ์เป็นข้อความเพื่อสร้างวิดีโอ ได้แก่
Clem Delangue ซีอีโอและผู้ร่วมก่อตั้ง Hugging Face โพสต์คาดการณ์สิ่งที่จะเกิดขึ้นในวงการปัญญาประดิษฐ์ปีหน้า 2025 ทั้งหมด 6 ข้อ รายละเอียดดังนี้
X เพิ่มเครื่องมือสร้างรูปภาพด้วย AI Grok ตัวใหม่ในชื่อ Aurora โดยมีผู้ใช้งานบางคนที่พบตัวเลือกโมเดลนี้ในหัวข้อของ Grok วิธีการใช้งานก็เหมือนโมเดล AI สร้างรูปภาพอื่น ที่สามารถป้อน Prompt ระบุรายละเอียดที่ต้องการได้
xAI ผู้พัฒนาปัญญาประดิษฐ์ Grok ซึ่งใช้งานใน X ไม่ได้เผยแพร่รายละเอียดมากนักว่า Aurora พัฒนาและเทรนจากข้อมูลใด แต่มีข้อสังเกตว่าสามารถป้อน Prompt ให้สร้างรูปภาพซึ่งโมเดลอื่นมักปฏิเสธ เช่น คาแรกเตอร์มีลิขสิทธิ์ หรือภาพคล้ายบุคคลให้ออกมาสมจริงได้ ซึ่ง Elon Musk ก็โพสต์ตอบข้อความใน X ว่าตอนนี้สถานะยังเป็นเบต้า ที่จะมีการปรับปรุงอย่างรวดเร็ว
Perplexity ประกาศทำข้อตกลงร่วมกับบริษัทสื่ออีก 15 ราย เพื่อรองรับเนื้อหาที่แสดงในผลการค้นหาอย่างถูกต้อง รวมทั้งบริษัทสื่อเหล่านี้ก็ได้ส่วนแบ่งจากโฆษณาที่แสดงในผลค้นหาด้วย ผ่านโครงการ Perplexity Publishers’ Program
บริษัทสื่อที่ Perplexity ประกาศการเข้าร่วมในรอบนี้ เช่น ADWEEK, DPReview, Independent, Los Angeles Times, MediaLab, RTL เป็นต้น ก่อนหน้านี้ Perplexity ได้ทำข้อตกลงกับบริษัทสื่อไปบางแห่งแล้วเช่น TIME และ Fortune
เมื่อเดือนตุลาคม Wall Street Journal และ New York Post ได้ฟ้อง Perplexity โดยให้เหตุผลว่าแพลตฟอร์มนำเนื้อหาไปใช้โดยไม่ได้รับอนุญาต
มูลนิธิ VinFuture ที่ก่อตั้งโดยกลุ่ม Vingroup มอบรางวัลประจำปี VinFuture Grand Prize ให้แก่ผู้บุกเบิกวงการปัญญาประดิษฐ์ 5 คน ได้แก่ Yoshua Bengio, Geoffrey E. Hinton, Jensen Huang, Yann LeCun, และ Fei-Feil Li แม้ว่ารางวัลนี้จะเป็นของมูลนิธิเอกชนแต่งานมอบรางวัลก็มอบโดย Pham Minh Chinh นายกรัฐมนตรี และพิธีมอบรางวัลก็ถ่ายทอดสดออกช่อง VTV1 ของรัฐบาล
รางวัลแบ่งออกเป็นสามหัวข้อ ได้แก่
Financial Times อ้างแหล่งข่าวที่เกี่ยวข้องใน OpenAI บอกว่าบริษัทกำลังหารือเพื่อแก้ไขข้อความ ที่ระบุในเงื่อนไขขององค์กรส่วนที่เกี่ยวข้องกับปัญญาประดิษฐ์ที่มีความสามารถรอบด้านหรือ AGI (Artificial General Intelligence) สาเหตุหลักเพื่อเปิดโอกาสสำหรับนักลงทุนในอนาคตได้มากขึ้น
เรื่องนี้ต้องย้อนไปที่รายงานของ The New York Times เมื่อเดือนตุลาคม ซึ่งระบุว่าข้อตกลงของ OpenAI กับ Microsoft บอกว่าหากบริษัทบรรลุเป้าหมายองค์กร สามารถพัฒนา AGI ออกมาได้เมื่อใด Microsoft จะถูกตัดการเข้าถึงทรัพยากรทั้งหมดของ OpenAI ทันที เพื่อความปลอดภัยว่าไม่มีใครสามารถเข้าถึงสิ่งนี้ได้ โดยนิยาม AGI คือระบบอัตโนมัติขั้นสูง ที่สามารถทำงานได้เหนือกว่ามนุษย์ และสร้างงานมีมูลค่า
Palantir บริษัทพัฒนาซอฟต์แวร์วิเคราะห์ข้อมูล ประกาศความร่วมมือกับ Anduril Industries บริษัทเทคโนโลยีการทหาร จัดตั้งหน่วยงานเพื่อส่งเสริมให้รัฐบาลสหรัฐอเมริกาเป็นผู้นำด้านปัญญาประดิษฐ์ เป้าหมายคือการพัฒนาโครงสร้างพื้นฐานเทคโนโลยีในทุกระดับ ให้หน่วยงานรัฐบาลตลอดจนภาคเอกชนที่เกี่ยวข้อง สามารถเปลี่ยนผ่านสู่ AI รองรับด้านความมั่นคงของประเทศ
หน่วยงานที่มาจาก Palantir และ Anduril นี้ จะโฟกัสที่สองปัญหาใหญ่ซึ่งทำให้การใช้ AI ในงานความมั่นคงยังมีข้อจำกัด (1) ข้อมูลที่หน่วยงานรัฐมี ยังไม่ถูกจัดเก็บในรูปแบบที่เหมาะกับการฝึกฝน AI ทำให้ขาดโอกาสหลายอย่าง (2) การประมวลผลข้อมูลในสเกลที่หน่วยงานต่าง ๆ สามารถนำมาใช้งานต่อได้ โดยคงความปลอดภัยของข้อมูลไว้
Meta เปิดตัวโมเดล Llama 3.3 ที่อัพเดตต่อเนื่องจาก Llama 3.2 ในเดือนกันยายน โดยยังมีเฉพาะโมเดลข้อความล้วน (multilingual แถมรองรับภาษาไทย) ในขณะที่ Llama 3.2 มีโมเดลข้อความ+ภาพ (multimodal) ให้ใช้งานด้วย
ไมโครซอฟท์เปิดให้ทดสอบ Copilot Vision บริการ AI ที่คุยแล้วเข้าใจความหมายของรูปภาพ นับจากเปิดตัวครั้งแรกในเดือนตุลาคม
ตัวอย่างการใช้งานที่ชัดเจนที่สุดคือ ใช้ Copilot Vision ช่วยหาข้อมูลหรือคำตอบจากสิ่งที่ปรากฏบนหน้าจอ เสมือนว่ามีเพื่อนอีกคนมานั่งท่องเว็บคู่ไปกับเรา และพูดคุยกับเราด้วยเสียงไปด้วยกัน ตัวอย่างที่ไมโครซอฟท์นำมาโชว์มีทั้งการช่วยวางแผนเที่ยว เป็นเพื่อนคู่คิดตอนเลือกซื้อของ และช่วยเล่นเกมบนหน้าเว็บ เป็นต้น
iPhone ในจีน ซึ่งเป็นตลาดที่สำคัญของแอปเปิล ยังไม่สามารถเปิดให้ใช้งานได้ เพราะต้องได้รับการอนุมัติจากหน่วยงานในประเทศ และยังถูกท้าทายจากคู่แข่งที่เป็นสมาร์ทโฟนของจีนซึ่งต่างมีฟังก์ชัน AI ให้ใช้งาน ดูจะเป็นอุปสรรคที่ยากขึ้นไปอีก
DeepMind เปิดตัวโมเดล Genie 2 โมเดลที่ต้องการเพียงภาพนิ่งภาพเดียวก็สามารถสร้างเกมที่สามารถควบคุมด้วยคีย์บอร์ดและเมาส์ได้ทันที
ก่อนหน้านี้ DeepMind เคยเปิดโมเดล GameNGen สำหรับการสร้างเกม และ Genie ที่สร้างเกมได้จำกัดมาก่อนแล้ว
ความพิเศษของ Genie 2 คือ เมื่อใส่ภาพเข้าไปแล้วรันโมเดลโดยใส่อินพุตควบคุมตัวละคร Genie 2 จะรับรู้ว่าตัวละครหลักที่ต้องควบคุมคือตัวใด เช่น หากมีหุ่นยนต์ในป่าก็จะควบคุมหุ่นยนต์ไม่ใช่ต้นไม้ ตัวโมเดลมีความสามารถในการจำสภาพแวดล้อมที่เคยสร้างเอาไว้ประมาณหนึ่งนาที และยังสามารถจำลองฟิสิกส์ เช่น ลูกโป่งระเบิด, ควันไฟ, หรือแรงโน้มถ่วง
DeepMind เปิดตัวโมเดลพยากรณ์อากาศตัวใหม่ชื่อ GenCast ซึ่งพัฒนาขึ้นจากโมเดล GraphCast ของปี 2023
GenCast เป็นโมเดลตระกูล generative ตามชื่อโมเดล ใช้อัลกอริทึมแบบ diffusion ที่เราคุ้นเคยกันในโมเดลสร้างภาพ-เสียง-วิดีโอ สามารถพยากรณ์อากาศระดับละเอียด (0.25° ของละติจูดและลองจิจูด ประมาณ 28x28 ตารางกิโลเมตร) ได้ล่วงหน้า 15 วัน (GraphCast ได้ 10 วัน) ได้แม่นยำกว่าโมเดล ENS ของศูนย์พยากรณ์อากาศยุโรป (European Centre for Medium-Range Weather Forecasts หรือ ECMWF) ซึ่งเป็นโมเดลที่ดีที่สุดในปัจจุบัน
OpenAI ประกาศจัดงานแถลงข่าวเปิดตัว "ของใหม่" ซึ่งบอกว่ามีตั้งแต่ฟีเจอร์เล็ก ๆ ไปจนถึงผลิตภัณฑ์ใหม่ที่สำคัญ โดยจะไลฟ์สตรีมเพื่อนำเสนอหรือสาธิตของใหม่เหล่านี้ ทุกวันแบบต่อเนื่องรวม 12 วัน ซึ่งจะมีทั้งหมด 12 ไลฟ์
Sam Altman ซีอีโอ OpenAI บอกว่าไลฟ์วันแรกไม่ต้องรอกันนานเพราะจะเริ่มในเวลา 10:00น. วันที่ 5 ธันวาคม ตามเวลาแปซิฟิก (01:00น. วันที่ 6 ธันวาคม ตามเวลาในไทย) จากนั้นจะมีไลฟ์แบบนี้ต่อเนื่องทุกวัน 12 วัน
Fortune รายงานข้อมูลจากแหล่งข่าวใน Meta บอกว่าถึงแม้ Meta จะมีโมเดล AI แบบโอเพนซอร์ส Llama ที่พยายามผลักดันอยู่ แต่เครื่องมือช่วยเขียนโค้ดที่ใช้ภายในบริษัทชื่อ Metamate ก็เสริมการทำงานด้วยโมเดล AI จากหลายค่ายซึ่งรวมทั้ง GPT-4 ของ OpenAI และ Llama ของ Meta เอง
รายงานบอกว่า Metamate เป็นเครื่องมือช่วยเขียนโค้ดคล้าย GitHub CoPilot ที่สามารถส่งคำถามและใช้ AI ช่วยหาคำตอบ ซึ่ง Metamate จะเลือกจากทั้ง Llama หรือ GPT-4
True IDC และ Gulf ลงนามบันทึกข้อตกลงกับสยามเอไอคลาวด์ ในการพัฒนาระบบนิเวศ AI ในประเทศไทย ทั้งการสร้างโมเดล AI และการสร้างบริการ AI ต่อไปในอนาคต
Siam.AI Cloud เป็น NVIDIA Cloud Partner รายแรกในประเทศไทย ที่กำลังวางโครงสร้างพื้นฐานเซิร์ฟเวอร์ NVIDIA GPU ที่ช่วยเร่งความเร็วในการฝึกโมเดลปัญญาประดิษฐ์ โดยใช้เซิร์ฟเวอร์ประมวลผลชั้นสูงมีความหนาแน่นพลังประมวลผลสูงมาก หล่อเย็นด้วยน้ำ สามารถใช้งานได้ทั้งการฝึกโมเดล Generative AI, LLM, และรันโมเดลปัญญาประดิษฐ์อื่นๆ
ทาง Gulf นั้นระบุว่าบริษัท GSA DC ที่ Gulf ถือหุ้น 40% ได้ลงนามให้บริการศูนย์ข้อมูลกับทาง Siam.AI และกำลังอยู่ระหว่างการเจรจากับ Gulf Edge เพื่อพัฒนาบริการ AI ด้านต่างๆ ต่อไป
ภายในงาน AI Vision for Thailand ที่จัดโดย Siam AI วันนี้ Jensen Huang ซีอีโอและผู้ก่อตั้ง NVIDIA ขึ้นเวทีภายใน แสดงวิสัยทัศน์ว่า AI จะกลายเป็นโครงสร้างพื้นฐานของอุตสาหกรรมในประเทศยุคถัดไป เหมือนกับพลังงาน (น้ำมัน) หรือโครงข่ายสัญญาณโทรศัพท์ (เทเลคอม) ในยุคก่อนหน้า แต่ AI เป็นแพลตฟอร์มใหม่ที่ทุกคนเริ่มได้พร้อมกัน
ซีอีโอ NVIDIA บอกด้วยว่า ปัจจุบันมีแค่ 20 ชาติเท่านั้นที่เคยสร้าง AI ของตัวเอง ไทยหากจะมี AI ของตัวเองจริงๆ ก็ต้องลงทุนวางโครงสร้างพื้นฐานของ AI ก่อน โดยตอนนี้มี Siam AI เป็นรายแรก หลังจากนั้นก็ต้องลงทุนแพลตฟอร์มซอฟต์แวร์ ซึ่ง NVIDIA มีให้พร้อม ไม่ต้องเริ่มจากศูนย์
Benoit Dupin ผู้อำนวยการอาวุโสด้าน Machine Learning และ AI ของแอปเปิล ร่วมเวทีในงาน AWS re:Invent ซึ่งจัดในช่วงสัปดาห์นี้ที่ลาสเวกัส เพื่อเล่ารายละเอียดว่าแอปเปิลในฐานะลูกค้า นำบริการคลาวด์ของ AWS มาใช้กับงานปัญญาประดิษฐ์อย่างไร ซึ่งถือเป็นเหตุการณ์ที่ไม่ค่อยเห็นจากแอปเปิล
Dupin บอกว่าแอปเปิลใช้งาน AWS มานานกว่าสิบปีแล้วในหลายบริการทั้ง Siri, Apple Maps และ Apple Music บริษัทยังใช้ชิป Inferentia และ Graviton สำหรับบริการค้นหาข้อมูล ซึ่งการใช้ชิปของ AWS ทำให้ได้ประสิทธิผลเพิ่มขึ้น 40% นอกจากนี้แอปเปิลยังอาจใช้ชิป Trainium2 สำหรับงานพรีเทรนโมเดลของตนเเอง สะท้อนว่าทางเลือกชิปของ AWS นั้นดีทั้งผลลัพธ์และต้นทุน
Amazon เปิดตัวชุดโมเดลปัญญาประดิษฐ์ Amazon Nova ในชุดมีโมเดลถึง 6 ตัวมีความสามารถต่างกันไป
Google Cloud ประกาศเริ่มนำโมเดลปัญญาประดิษฐ์สร้างวิดีโอ Veo มาให้บริการ นับเป็นคลาวด์รายใหญ่รายแรกที่มีบริการสร้างวิดีโอ แต่ยังเป็นบริการวงปิดอยู่
Veo สามารถสร้างวิดีโอได้จากภาพและจากข้อความ ดังนั้นเราจึงสามารถสร้างภาพต้นแบบจากโมเดล Imagen ก่อนแล้วค่อยทำเป็นภาพเคลื่อนไหวก็ได้ ตอนนี้ยังเป็นบริการวงปิดเฉพาะผู้ได้รับอนุญาต โดยกูเกิลระบุว่า Agoda นั้นใช้เครื่องมือ AI ทั้ง Veo, Gemini, และ Imagen ช่วยทำโฆษณาเพื่อลดระยะเวลาการสร้างงานแล้ว
ศูนย์ข้อมูลสารสนเทศและโครงข่ายอินเทอร์เน็ตแห่งชาติจีน หรือ CNNIC ออกรายงานเกี่ยวกับการใช้งานปัญญาประดิษฐ์สร้างเนื้อหาหรือ Generative AI ในจีน มีจำนวนผู้ใช้งาน ณ เดือนมิถุนายน 2024 เพิ่มขึ้นเป็น 230 ล้านคน หรือคิดเป็น 1 ใน 6 ของประชากรทั้งประเทศ
บริการที่ได้รับความนิยมมากที่สุดคือ Ernie Bot ของ Baidu มีส่วนแบ่งตลาด 11.5% ตามด้วย ChatGPT และ Gemini ที่ 7% และ 3.8% ซึ่งน่าสนใจว่า CNNIC รายงานข้อมูลนี้ แม้ทั้งสองบริการแชทบอต จะไม่สามารถใช้งานได้อย่างเป็นทางการที่นั่น
วัตถุประสงค์หลักในการใช้งาน GenAI ของผู้ใช้งานในจีน 2 ใน 3 บอกว่า เพื่อเป็นระบบถาม-ตอบ ในสิ่งต่าง ๆ ที่สนใจ ขณะที่อีก 1 ใบ 3 บอกว่าใช้ GenAI เป็นผู้ช่วยทำงานต่าง ๆ เช่น บันทึกการประชุม, สรุปเอกสาร
The Independent รายงานว่า ผู้ใช้งานบางคนพบว่า ไม่สามารถทำให้ ChatGPT เขียนชื่อบางชื่อได้ เช่น David Mayer เมื่อป้อนคำสั่งไป ChatGPT จะตอบกลับว่า “ไม่สามารถให้คำตอบได้”
มีผู้ใช้หลายคนพยายามหว่านล้อมให้ ChatGPT พูดถึงชื่อดังกล่าวด้วยหลายวิธี เช่น ให้เขียนชื่อที่ย่อด้วย DM แต่ออกเสียงคล้าย David Layer ไปจนถึงเปลี่ยนชื่อผู้ใช้เป็น David Mayer แล้วให้ ChatGPT บอกชื่อผู้ใช้ แต่ไม่มีวิธีไหนสำเร็จ
ล่าสุด Blognone ได้ลองทดสอบบ้าง และพบว่าตอนนี้ ChatGPT พูดถึงชื่อนี้ได้แล้ว แต่ก็ยังมีอีกหลายชื่อตามที่ The Independent รายงาน เช่น David Faber, Brian Hoods, Jonathan Turley และ Jonathan Zittrain ที่ ChatGPT ยังพูดถึงไม่ได้