Large Language Model

Tags:
Node Thumbnail

Mozilla Innovation Project เปิดโครงการ llamafile โครงการแพ็กโมเดลปัญญาประดิษฐ์สำเร็จรูป ทำให้รันโมเดลต่างๆ ได้โดยง่าย เป็นไฟล์ไบนารีไฟล์เดียวก็รันได้เลย

ก่อนหน้านี้มีโครงการจำนวนมากที่พยายามนำโมเดล LLM มารันบนเดสก์ทอปอยู่แล้ว เช่น โครงการ llama.cpp แต่ก็ยังต้องอาศัยการคอนฟิกพอสมควร llamafile ทำให้การใช้งานสะดวกขึ้นอีกขั้น โดยอาศัยโครงการ Cosmopolitan Libc มาแพ็กไฟล์ต่างๆ เข้าด้วยกันให้รันได้ทุกที่

ตอนนี้มีโมเดลที่รองรับแล้ว ได้แก่ LLaVA 1.5, Mistral 7B, Mixtral 8x7B, และ WizardCoder-Python 13B

Tags:
Node Thumbnail

Google DeepMind เผยแพร่งานวิจัยในวารสาร Nature ถึงขั้นตอนการค้นหาวิธีแก้ปัญหาด้านคณิตศาสตร์และวิทยาการคอมพิวเตอร์แบบใหม่ เรียกชื่อว่า FunSearch ซึ่งมาจากคำว่า Function+Search มีจุดเด่นคือพื้นฐานทำงานเป็น AI แบบ LLM ที่ถูกเทรนมาก่อน แล้วหาวิธีแก้ปัญหาร่วมกับโค้ดคอมพิวเตอร์ ที่ทำหน้าที่ตรวจสอบความถูกต้องอีกหนึ่งชั้น เพื่อป้องกันการให้คำตอบที่ผิด

ผลลัพธ์ที่ได้คือฟังก์ชัน ในรูปแบบโค้ดคอมพิวเตอร์ แต่มาพร้อมกับวิธีคิดรูปแบบใหม่ ๆ จากกระบวนการของ LLM

ตัวอย่างที่งานวิจัยนี้นำเสนอคือใช้ FunSearch หาอัลกอริทึมของปัญหาการบรรจุกล่องสินค้าในปริมาตรที่กำหนดหรือ Bin Packing Problem

Tags:
Node Thumbnail

สหภาพยุโรปเตรียมออกกฎหมายควบคุมปัญญาประดิษฐ์หลังรัฐสภายุโรป (European Parliament) บรรลุข้อตกลงกับคณะมนตรียุโรป (European Council) ว่าจะผ่านกฎหมายควบคุมปัญญาประดิษฐ์ โดยกฎหมายนี้ควบคุมการใช้งานตามระดับความเสี่ยง โดยแบ่งเป็น 3 ระดับ ได้แก่

Tags:
Node Thumbnail

Mozilla เปิดตัวโครงการใหม่เป็นเครื่องมือสำหรับสร้างเว็บไซต์ด้วย AI มีชื่อว่า Solo เน้นเจาะกลุ่มฟรีแลนซ์ และผู้ประกอบการธุรกิจแบบคนเดียวที่เรียกว่า Solopreneur ทำให้ลดเวลาและขั้นตอนการทำงานได้หลายอย่าง หากต้องการมีเว็บไซต์ธุรกิจ-บริการของตนเอง

Mozilla บอกว่าที่ต้องใช้ AI เพราะแม้ขั้นตอนการสร้างเว็บไซต์ตอนนี้จะง่ายขึ้น มีเทมเพลต มีเครื่องมือคัดรูปภาพ ช่วยเขียนเนื้อหา แต่ทั้งหมดก็ต้องใช้เวลาและไม่ได้ง่ายสำหรับทุกคน Mozilla ยังอ้างผลสำรวจพบว่า Solopreneur ส่วนใหญ่ต้องมีพาร์ตเนอร์ที่เก่งด้านเทคโนโลยีมาคอยช่วยจัดการงานด้านนี้เพิ่ม

Tags:
Node Thumbnail

กูเกิลเปิดให้นักพัฒนาใช้งานโมเดลปัญญาประดิษฐ์ Gemini Pro รุ่นกลางที่ใช้งานใน Bard ตั้งแต่สัปดาห์ที่แล้ว โดยนักพัฒนาสามารถใช้งานได้ฟรีทุกคนในช่วงทดสอบ จำกัดเพียงแค่ห้ามคิวรีเกิน 60 ครั้งต่อนาทีเท่านั้น

โมเดลที่ปล่อยให้ใช้งาน มีทั้ง Gemini Pro ตัวปกติรองรับเฉพาะข้อความ รองรับ context ขนาด 32K และ Gemini Pro Vision ใส่ภาพประกอบได้ด้วย ความพิเศษของ Gemini Pro ที่ปล่อยให้ใช้งานผ่าน API คือมันรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ รวมทั้งหมด 38 ภาษา

SDK ที่ปล่อยออกมานั้นเปิดให้นักพัฒนาสามารถใช้งานแบบ Generate Content ที่สร้างข้อความต่อจากข้อความที่ผู้ใช้ใส่ลงไป หรือแบบ Chat ที่เป็นการพูดคุยต่อๆ กัน โดยยังไม่มี API แบบ Agent แบบเดียวกับ Assistant API ของ OpenAI

Tags:
Node Thumbnail

ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็ก (small language model หรือ SLM) ชื่อ Phi-2 ขนาด 2.7 พันล้านพารามิเตอร์ ให้ลูกค้าใช้งานบน Azure AI Studio

Phi-2 เป็นผลงานพัฒนาของทีม Machine Learning Foundations ภายใต้ Microsoft Research ตัวมันเองเป็นโมเดลแบบ Transformer เทรนบนข้อมูลขนาด 1.4T token บนเครื่อง NVIDIA A100 GPU จำนวน 96 ตัว ใช้เวลาเทรน 14 วัน ถือเป็นโมเดลที่สร้างโดยคนของไมโครซอฟท์เอง ไม่ต้องพึ่งพาฝั่ง OpenAI

ไมโครซอฟท์เปิดตัว Phi-2 ครั้งแรกในงาน Ignite เมื่อเดือนที่แล้ว จุดเด่นของมันคือเป็นโมเดลขนาด 2.7B ที่มีประสิทธิภาพใกล้เคียงหรือเหนือกว่าโมเดลขนาดที่ใหญ่กว่ามัน 25 เท่า

Tags:
Topics: 
Node Thumbnail

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเปิดตัวโมเดลรุ่นใหม่ในชื่อ Mixtral 8x7B เป็นโมเดลที่อาศัยสถาปัตยกรรม mixture-of-experts (MoE) ผสมเอาท์พุตระหว่างโมเดลย่อยๆ ภายใน

ขนาดโมเดลรวม 46.7 พันล้านพารามิเตอร์ แต่ระหว่างรันจริง โมเดลจะเรียกใช้โมเดลที่เหมาะสมเพียง 2 ตัวจาก 8 ตัว จากนั้นจะเลือกเอาท์พุตแต่ละโทเค็นจากสอง 2 ตัวนั้นมาใช้งาน ทำให้เวลารันจริงจะใช้พลังประมวลผลเครื่องเท่ากับโมเดลขนาด 12.9 พันล้านพารามิเตอร์เท่านั้น

แนวทาง MoE ทำให้ Mixtral มีคะแนนทดสอบชุดทดสอบต่างๆ ใกล้เคียง GPT-3.5 แม้ขนาดโมเดลและพลังประมวลผลที่ใช้รันจะน้อยกว่ามาก คะแนนทดสอบหลายชุดดีกว่า LLaMA 2 มากแม้จะเทียบกับโมเดลขนาด 70B ก็ตาม

Tags:
Node Thumbnail

Jeff Dean หัวหน้านักวิทยาศาสตร์ของกูเกิล และหัวหน้าทีม (ร่วม) ของ Gemini โพสต์อธิบายที่มาของชื่อ Gemini ว่ามาจากคำว่า "ฝาแฝด" ในภาษาละติน

เหตุผลที่กูเกิลเลือกใช้ชื่อนี้เป็นเพราะต้องการสะท้อนผลงานของ Google DeepMind ที่เกิดจากการรวมทีม Google Brain และ DeepMind เข้าด้วยกัน ก่อนหน้านี้กูเกิลมีทีม AI หลักสองทีม ต่างคนต่างทำโมเดล LLM แยกจากกัน คือ Google Brain (PaLM/PaLM2) และ DeepMind (โมเดลชื่อ Chinchilla) แต่ภายหลังกูเกิลตัดสินใจจับมารวมกัน พัฒนาโมเดลร่วมกัน และช่วยให้ดึงทรัพยากรส่วนอื่นของกูเกิลมาช่วยงานได้อีกมาก

Tags:
Node Thumbnail

กูเกิลเปิดบริการ NotebookLM แอพจดโน้ตพลัง AI สำหรับผู้ใช้ทั่วไป แต่ยังจำกัดประเทศเฉพาะในสหรัฐอเมริกาเท่านั้น

NotebookLM หรือชื่อเดิม Project Tailwind เป็นโครงการทดลอง (experimental) ที่กูเกิลโชว์ครั้งแรกในงาน Google I/O 2023 มันเป็นแอพจดโน้ตที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) มาช่วยสรุปเนื้อหาจากเอกสาร (เช่น PDF) ที่เราอัพโหลดขึ้นไป เมื่อ LLM เรียนรู้จากเอกสารก็จะกลายเป็นผู้เชี่ยวชาญในเรื่องนั้น ที่สามารถตอบคำถามหรือร่างเนื้อหาจากเอกสารให้เราได้

กูเกิลยังปรับปรุงโมเดล LLM มาเป็น Gemini Pro ที่มีความสามารถมากขึ้น และเพิ่มฟีเจอร์การเซฟคำตอบของ NotebookLM เก็บไว้ใช้งานภายหลังได้

Tags:
Node Thumbnail

Anthropic ผู้พัฒนา Claude ปัญญาประดิษฐ์สำคัญที่ชูจุดแข็งว่าสามารถรับอินพุตขนาดใหญ่ รายงานถึงผลการทดสอบการถามตอบเอกสารขนาดใหญ่ว่ามักได้ผลไม่ค่อยดีนัก โดยเฉพาะในกรณีที่ข้อความที่ใช้ตอบคำถามนั้นล้อมด้วยเรื่องที่ไม่เกี่ยวข้องกันนัก

รายงานระบุว่า Claude 2.1 นั้นถูกฝึกให้เลี่ยงการตอบคำถามหากไม่มีข้อความสนับสนุนคำตอบมากพอ แนวทางนี้มีเพื่อลดการตอบคำถามอย่างผิดๆ ทีมงานทดสอบโดยการถามคำถามถึงประโยคหนึ่งที่อยู่ในข้อความยาวๆ ที่พูดเรื่องเดียวกัน จากนั้นนำข้อความชุดนี้ไปผสมกับเอกสารอื่นจนเต็ม context 200k แล้วสลับตำแหน่งไปมา พบว่า Claude สามารถตอบคำถามได้เสมอไม่ว่าข้อความที่ใช้ตอบคำถามจะอยู่ตำแหน่งใดๆ แม้ประสิทธิภาพจะดีขึ้นเล็กน้อยหากข้อความอยู่ส่วนท้าย

Tags:
Node Thumbnail

กูเกิลเปิดตัวปัญญาประดิษฐ์ LLM ตัวใหม่ Gemini 1.0 อย่างเป็นทางการเมื่อวันก่อน ที่กูเกิลบอกว่าผลทดสอบความสามารถสูงเหนือกว่าคู่แข่ง และออกคลิปวิดิโอนำเสนอความสามารถ Gemini ในหลากหลายด้านออกมาด้วย

มีคลิปวิดีโอหนึ่งที่ดูจะเป็นประเด็นมากกว่าตัวอื่น มีชื่อว่า Hands-on with Gemini: Interacting with multimodal AI โดยวิดีโอนี้สาธิตการโต้ตอบของ Gemini ผ่านการให้ข้อมูลในรูปแบบต่าง ๆ เพื่อแสดงว่า Gemini เป็นโมเดล AI ที่ทำงานกับข้อมูลแบบผสมผสาน (multimodal) ได้อย่างดี

Tags:
Node Thumbnail

ถึงแม้กระแสเปิดตัวของใหม่ AI วันนี้จะอยู่ที่ Gemini ของกูเกิล แต่ Meta ก็ประกาศของใหม่เกี่ยวกับ AI ด้วยเช่นกันนั่นคือ Imagine with Meta AI เครื่องสำหรับสร้างรูปภาพด้วย prompt ที่แยกออกมาใช้งานโดยเฉพาะ ไม่ได้ไปรวมกับบริการตัวอื่น ซึ่งเหมือนกับ DALL-E, Midjourney หรือ Stable Diffusion ทำงานบนโมเดล Emu ที่ใช้สร้างรูปภาพ

Imagine with Meta AI ยังเปิดให้ใช้งานแบบจำกัดเฉพาะผู้ใช้ในอเมริกาเท่านั้นผ่าน imagine.meta.com

Tags:
Node Thumbnail

กูเกิลประกาศเปลี่ยนเอนจินด้านหลัง Bard ไปใช้ Gemini Pro ที่เปิดตัวมาวันนี้ ทำให้ความสามารถน่าจะดีขึ้นมากจากเดิมที่ใช้ PaLM-2

Gemini Pro ที่ใช้ใน Bard จะเป็นรุ่นปรับปรุงมาเป็นพิเศษ เป็นความสามารถที่คนใช้งานในแชตบ่อยๆ เช่น การทำความเข้าใจข้อความ, สรุปบทความ, การให้เหตุผล, เขียนโปรแกรม, และการวางแผนต่างๆ โดยหลังจากปรับจูนโมเดลมาแล้วกูเกิลได้ขอให้ผู้ทดสอบภายนอกมาเทียบกับบริการแชตอื่นๆ ก็พบว่า Bard รุ่นใหม่นี้เป็นบริการฟรีที่ดีที่สุด

ปีหน้ากูเกิลจะเปิดบริการ Bard Advanced ที่ใช้ Gemini Ultra โดยยังอยู่ระหว่างการทดสอบความปลอดภัย และเมื่อเปิดใช้งานก็จะเปิดวงเล็กให้ทดสอบก่อนจะเปิดใช้งานจริง โดยตอนนี้ยังไม่แน่ชัดว่า Bard Advanced จะเก็บค่าบริการแบบเดียวกับ ChatGPT Plus หรือไม่

Tags:
Node Thumbnail

กูเกิลเปิดตัว Gemini 1.0 ปัญญาประดิษฐ์แบบ LLM ที่เคยเปิดตัวไว้ตั้งแต่งาน Google I/O ที่ผ่านมา โดยระบุว่าผลการทดสอบคะแนนต่างๆ นั้น Gemini ชนะ GPT-4 แทบทุกการทดสอบ

Gemini เป็นโมเดลปัญญาประดิษฐ์แบบ multimodal ตั้งแต่แรก โดยรองรับข้อมูลทั้ง ข้อความปกติ, โค้ด, เสียง, ภาพ, และวิดีโอ ในเวอร์ชั่น 1.0 กูเกิลระบุว่ามี 3 ขนาด ได้แก่ Gemini Ultra ขนาดใหญ่ที่สุด รองรับงานซับซ้อนสูง, Gemini Pro ขนาดรองลงมาโดยยังทำงานได้หลากหลาย, Gemini Nano โมเดลประสิทธิภาพสูงสำหรับรันบนโทรศัพท์มือถือ

Tags:
Node Thumbnail

ทีมวิจัยจาก UC San Diego รายงานผลการทดสอบประสิทธิภาพของปัญญาประดิษฐ์ในการหลอกมนุษย์ว่าเป็นมนุษย์ หรือที่รู้จักกันในชื่อ Turing Test โดยผลเบื้องต้นพบว่า GPT-4 มีคะแนนใกล้คนที่สุด

การทดลองครั้งนี้อาศัยบริการออนไลน์ โดยผู้เล่นจะเข้าไปรอคิวในระบบที่มี AI ที่ทีมงานเตรียม prompt ของ AI ทั้ง GPT-3.5 และ GPT-4 เอาไว้รวม 25 ตัว โดยยังมี ELIZA โปรแกรมแชตที่พยายามคุยเหมือนมนุษย์ที่ออกมาตั้งแต่ปี 1966 มาเป็นตัวเทียบด้วย ผู้เล่นที่ทำหน้าที่ผู้ตัดสินจะต้องตัดสินว่ากำลังคุยกับปัญญาประดิษฐ์ภายใน 5 นาที โดยคุยแต่ละข้อความไม่เกิน 300 ตัวอักษร ระบบจะสุ่มว่าผู้เล่นแต่ละคนนั้นจะได้คุยกับปัญญาประดิษฐ์หรือมนุษย์

Tags:
Node Thumbnail

AWS ประกาศเพิ่มบริการ Claude 2.1 ของทาง Anthropic ที่เพิ่งเปิดตัวสัปดาห์ที่ผ่านมา เข้ามาให้บริการใน Amazon Bedrock นับว่าให้บริการตามผู้พัฒนาโมเดลหลักได้ค่อนข้างเร็ว

Claude 2.1 เพิ่มฟีเจอร์สำคัญคือรองรับข้อมูลขนาดใหญ่มากจำนวน 200,000 โทเค็น หรือคิดเป็นเอกสาร 500 หน้ากระดาษ, ลดอัตราการหลอนลงครึ่งหนึ่ง, และรองรับ system prompt บอก AI ว่าให้ทำตัวอย่างไร

ฟีเจอร์สำคัญอย่างหนึ่งที่มีใน Bedrock คือ function calling เปิดทางให้ Claude สามารถเรียก API หรือฐานข้อมูลต่างๆ ได้ด้วยตัวเอง ฟีเจอร์นี้คล้ายกับ Agents for Amazon Bedrock ที่เปิดตัวในงานเดียวกัน แต่ทาง AWS ระบุว่าต้องขอใช้งานล่วงหน้าจึงเข้าถึงฟีเจอร์นี้ได้

Tags:
Node Thumbnail

เว็บไซต์ The Information รายงานข่าวลือว่า Gemini โมเดลปัญญาประดิษฐ์ตัวใหม่ของกูเกิล อาจต้องเลื่อนการเปิดตัวออกไป จากเดิมที่มีแผนเปิดตัวสัปดาห์หน้า กลายเป็นเดือนมกราคม 2024

Gemini เป็นปัญญาประดิษฐ์ที่กูเกิลหวังใช้ต่อกรกับ GPT ของ OpenAI โดยต้องใช้พลัง Google + DeepMind ทำงานร่วมกัน และมีข่าวว่า Sergey Brin กลับมาช่วยโปรเจคนี้ด้วยตัวเอง

Tags:
Node Thumbnail

ทีมวิจัยร่วมระหว่าง DeepMind และนักวิจัยจากมหาวิทยาลัยหลายแห่ง รายงานถึงเทคนิคการดึงข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์ในกลุ่ม LLM โดยเฉพาะ ChatGPT ที่ถูกจูนเพื่อไม่ให้คืนข้อมูลที่ใช้ฝึกออกมาตรงๆ (ดูตัวอย่างแชต)

การดึงข้อมูลที่ใช้ฝึก AI นั้นมีการวิจัยมานาน แต่ก่อนหน้านี้มักเป็นการทดลองในโมเดลโอเพนซอร์สที่นักวิจัยสามารถศึกษากระบวนการทำงานได้อย่างละเอียด และสามารถตรวจสอบข้อมูลได้ทันทีว่า AI แสดงข้อมูลที่ใช้ฝึกหรือยังเพราะนักวิจัยเห็นข้อมูลฝึกอยู่แล้ว ในกรณี ChatGPT นั้นยากกว่ามากเพราะ OpenAI ฝึกโมเดลเพื่อไม่ให้คืนข้อมูลที่ฝึกเข้าไป และนักวิจัยไม่เห็นอะไรนอกจาก API ของ OpenAI เอง

Tags:
Node Thumbnail

AWS มีบริการ Generative AI ใต้ชื่อแบรนด์ Amazon Bedrock เริ่มมาตั้งแต่เดือนเมษายน โดยมีโมเดลให้เลือกหลากหลายยี่ห้อ เช่น Stable Diffusion, Llama 2 รวมถึงโมเดลของ AWS เองที่ชื่อตระกูล Amazon Titan

ล่าสุดในงาน re:Invent 2023 เราได้เห็นการเปิดตัวบริการใหม่ในตระกูล Titan เพิ่มเติมคือ

Tags:
Node Thumbnail

Commonwealth Bank of Australia (CBA) ธนาคารรายใหญ่ในออสเตรเลียประกาศเตรียมเปิดตัวบริการแชตบอต CommBank Customer Copilot บริการผู้ช่วยผ่านแชตภายในปีหน้า โดยช่วงแรกยังไม่สามารถทำธุรกรรมใดๆ ได้ แต่เป็นการตอบคำถามทั่วไปเท่านั้น

CBA วางแผนการปล่อย Copilot ไว้สามขั้น ขั้นแรกนั้นจะเป็นการตอบคำถามทั่วๆ ไปเท่านั้น เช่น อัตราดอกเบี้ยต่างๆ ขั้นที่สองจะเปิดให้ Copilot ทำความเข้าใจข้อมูลทางการเงินของลูกค้าโดยตรง ทำให้สามารถถามคำถามต่างๆ เช่น ยอดค่าใช้จ่ายในทริปเดินทางล่าสุด หรือให้คำนวณค่าใช้จ่ายที่ประหยัดลงหากหาแหล่งเงินกู้ใหม่ ส่วนแผนระยะยาวคือการสร้าง full co-banker pilot ผู้ช่วยเต็มตัวที่สามารถช่วยลูกค้าทำธุรกรรมได้ด้วยตัวเอง

Tags:
Node Thumbnail

AWS เปิดบริการ Amazon Q แชตบอตผู้ช่วยสารพัดประโยชน์แบบเดียวกับ ChatGPT แต่ชูจุดเด่นในการอ่านข้อมูลภายในองค์กร สามารถดึงข้อมูลจากในสตอเรจ S3 หรือบริการอื่นๆ เช่น Salesforce, Google Drive, Microsoft 365, ServiceNow, Atlassian, หรือ Zendesk มาตอบคำถามผู้ใช้ได้

ข้อมูลที่ Amazon Q นำมาตอบนั้นจะใช้สิทธิการเข้าถึงเดียวกับสิทธิ์ของบริการที่ไปเชื่อมต่อ และสามารถสั่งงานแอปพลิเคชั่นต่างๆ เช่น เปิด ticket ใน Jira หรือเปิดเคสใน Salesforce ได้จากแอปแชต

Tags:
Topics: 
Node Thumbnail

AWS เปิดตัวบริการ Agents for Amazon Bedrock บริการเรียกใช้งานปัญญาประดิษฐ์ในกลุ่ม LLM ที่สามารถหาข้อมูลภายในองค์กรจากฐานข้อมูลที่เก็บเอกสาร พร้อมๆ กับเรียกใช้งาน API ต่างๆ ที่อาจจะเก็บข้อมูลในองค์กร เพื่อให้สามารถตอบคำถามได้อย่างถูกต้องโดยใช้ข้อมูลล่าสุด

Tags:
Node Thumbnail

Inflection AI สตาร์ตอัพของ Reid Hoffman ผู้ร่วมก่อตั้ง LinkedIn และ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind เปิดตัวโมเดลภาษาตัวใหม่ Inflection-2 ที่อัพเกรดขึ้นจาก Inflection-1 เวอร์ชันเมื่อเดือนพฤษภาคม

Inflection-2 ถูกเทรนด้วยจีพียู NVIDIA H100 จำนวน 5,000 ตัว ใช้กำลังประมวลผลราว 10²⁵ FLOPs ใกล้เคียงกับโมเดล PaLM 2 ของกูเกิล แต่ Inflection โฆษณาว่าผลการทดสอบกับเบนช์มาร์คปัญญาประดิษฐ์หลายๆ ตัวสามารถเอาชนะ PaLM 2 ได้ ตอนนี้คะแนนของ Inflection-2 เป็นรองแค่ GPT-4 เท่านั้น

Tags:
Node Thumbnail

กูเกิลอัพเดตความสามารถเพิ่มเติมของ Bard แชตบอท โดยสามารถทำความเข้าใจวิดีโอบน YouTube เพื่อตอบคำถามในรายละเอียดที่ต้องการได้ ตัวอย่าง เมื่อดูวิดีโอการทำขนม ก็สามารถถามรายละเอียดสูตรว่าใช้ไข่กี่ฟองได้ เป็นต้น

Bard รองรับการดึงข้อมูลจาก YouTube ผ่านบริการส่วนขยายมาตั้งแต่เดือนกันยายน ซึ่งตอนนั้นเน้นไปที่การแนะนำวิดีโอจากคำถาม ส่วนอัพเดตนี้เป็นการตอบคำถามจากเนื้อหาในวิดีโอ ที่น่าจะต่อเนื่องจากฟีเจอร์สรุปคลิปที่ YouTube ประกาศไปเมื่อต้นเดือน

ที่มา: TechCrunch

Tags:
Node Thumbnail

ระหว่างที่มหากาพย์ OpenAI ยังไม่จบลง ฝั่งคู่แข่ง Anthropic (ที่มีข่าวว่ามีข้อเสนอให้ควบรวมกัน) ก็เดินหน้าออกโมเดลเวอร์ชันใหม่ Claude 2.1

จุดเด่นของ Claude 2.1 คือการรองรับอินพุตความยาว 200,000 token หรือตีเป็นคำได้ 150,000 คำ เทียบได้กับหนังสือราว 500 หน้า การรองรับอินพุตที่ยาวขนาดนี้ทำให้ Claude สามารถอ่านเอกสารการเงินขนาดยาว, วรรณกรรมขนาดยาว หรืออ่านโค้ดทั้งหมดขององค์กรได้จบทีเดียว แล้วนำไปสรุป วิเคราะห์ ตอบคำถาม ฯลฯ ตามโจทย์ของแต่ละองค์กรได้สบายๆ (ตัวอย่างของ Anthropic คือเอาเอกสารงบประมาณของรัฐสภาสหรัฐ ย้อนหลัง 3 ปีใส่เข้าไปใน Claude แล้วให้สรุปแนวโน้มงบประมาณ)

Pages