The Wall Street Journal อ้างแหล่งข่าวที่เกี่ยวข้องเผยว่า Meta บริษัทแม่ของ Facebook กำลังเจรจากับแอปเปิล เพื่อนำโมเดล Generative AI มาเชื่อมต่อการทำงานกับ Apple Intelligence ระบบ AI ที่แอปเปิลเพิ่งเปิดตัวใน iOS 18
Anthropic บริษัท LLM เปิดตัว Claude 3.5 Sonnet โมเดล LLM ขนาดกลาง อัพเดตจาก Claude 3 ที่เพิ่งเปิดตัวเมื่อเดือนมีนาคมที่ผ่านมา โดยความพิเศษคือรอบนี้เปิดตัวเฉพาะรุ่นกลาง Sonnet แต่ก็มีความฉลาดเหนือกว่า Claude 3 Opus รุ่นใหญ่สุดที่เปิดตัวมาก่อนหน้านี้แล้ว
Anthropic บริษัทปัญญาประดิษฐ์ผู้พัฒนาโมเดล Claude ประกาศเพิ่มฟีเจอร์ใหม่สำหรับแชทบอตเรียกว่า Tool use ให้ผู้ใช้งานสามารถเชื่อมต่อโปรแกรมต่าง ๆ กับ Claude API ได้ หรือนำไปทำแชทบอตแบบคัสตอมนั่นเอง
จุดเด่นของ Claude API คือรองรับอินพุทที่เป็นรูปภาพได้ด้วย จึงสามารถนำไปพัฒนาเครื่องมือวิเคราะห์ข้อมูลจากภาพ ตัวอย่างที่ Anthropic นำเสนอเช่นเป็นแชทบอตแนะนำไอเดียการตกแต่งภายในห้อง โดยถ่ายรูปส่งไปเป็นต้น
ชุด Tool use นี้ สามารถใช้งานได้แล้วตั้งแต่วันนี้ผ่าน Anthropic Messages API, Amazon Bedrock และ Vertex AI บน Google Cloud
ที่มา: Anthropic
หลังผู้บริหารและพนักงาน OpenAI ลาออกไปชุดหนึ่งเมื่อเร็วๆ นี้ เพราะไม่พอใจแนวทางขององค์กร ก็มีคำถามตามมาว่าคนเหล่านี้ย้ายไปทำอะไรกัน เพราะชื่อชั้นและประสบการณ์น่าจะมีแต่คนอยากแย่งตัว
ล่าสุดมีข้อมูลแล้วว่า Jan Leike หัวหน้าทีม Superalignment ที่ดูแลเรื่องความปลอดภัยของ AI ประกาศผ่านทวิตเตอร์แล้วว่าเขาย้ายมาอยู่กับ Anthropic บริษัทคู่แข่งของ OpenAI และยังมาทำงานด้าน Superalignment เช่นเดิม
Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย
โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้องการใช้งาน Claude โดยปริมาณการใช้งานต่อบัญชีจะรองรับมากขึ้น, ได้ใช้โมเดลในกลุ่ม Claude 3 ได้แก่ Opus, Sonnet และ Haiku, รองรับการอ่านเอกสารขนาดยาว, ระบบแอดมินควบคุมค่าใช้จ่าย และฟีเจอร์อื่นที่เหมือนผู้ใช้งานแบบ Pro
แพ็คเกจ Team ราคา 30 ดอลลาร์ต่อบัญชีต่อเดือน ขั้นต่ำผู้ใช้งาน 5 คน
ทีมนักวิจัยของ Anthropic บริษัท AI เจ้าของแชทบอต Claude เผยแพร่รายงานเกี่ยวกับช่องโหว่ของโมเดล AI ภาษาขนาดใหญ่ (LLM - large language model) ซึ่งสามารถทำให้ LLM ให้คำตอบที่ไม่เหมาะสมหรือเป็นอันตรายออกมาได้ แม้ผู้พัฒนาจะเขียนกฎป้องกันไว้แล้วก็ตาม
ช่องโหว่ที่รายงานเกิดจากการสร้างบทสนทนาถามตอบกับ LLM ที่ต่อเนื่องเป็นชุด จน LLM เกิดการเรียนรู้บริบท (in-context learning) ของเนื้อหาที่ถาม ทำให้กรอบหัวข้อที่สนใจแคบลงเรื่อย ๆ และยอมตอบคำถามที่ไม่เหมาะสมหรืออันตรายออกมา
เราเห็น Amazon แก้ปัญหาเรื่องการขาดโมเดล LLM ความสามารถสูง ด้วยการลงทุน 4 พันล้านดอลลาร์ใน Anthropic เพื่อเข้าถึงการใช้งานโมเดล Claude ที่เวอร์ชันล่าสุดทำคะแนนได้ดีกว่า GPT-4
ถึงแม้เงินแก้ปัญหาในระยะสั้นได้ แต่ก็เกิดคำถามตามมา (ในหมู่พนักงานเองด้วย) ว่าบริษัทยักษ์ใหญ่ระดับ Amazon ไม่มีศักยภาพสร้างโมเดล LLM ของตัวเองได้เลยหรือ (ปัจจุบัน Amazon มีโมเดลของตัวเองชื่อ Titan ให้ใช้งานบน AWS แม้ยังอาจสู้ Claude ไม่ได้ก็ตาม)
Amazon ประกาศความคืบหน้าของแผนลงทุนใน Anthropic บริษัท AI ผู้พัฒนา Claude จากก่อนหน้านี้บริษัทจ่ายเงินลงทุน 1,250 ล้านดอลลาร์ และสามารถเพิ่มวงเงินลงทุนได้เป็น 4,000 ล้านดอลลาร์ โดยตอนนี้บริษัทประกาศลงทุนเพิ่มอีก 2,750 ล้านดอลลาร์ ครบจำนวน 4 พันล้านแล้ว
แม้การลงทุนของ Amazon จะเป็นเงินที่สูง แต่รูปแบบก็คล้ายกับดีลไมโครซอฟท์ลงทุนใน OpenAI นั่นคือ Amazon ยังเป็นผู้ถือหุ้นรายเล็ก เพราะเป็นหุ้นคลาสพิเศษ และบริษัทยังไม่มีโควต้าตำแหน่งบอร์ดบริษัท ทั้งนี้ Anthropic มีมูลค่ากิจการประเมินล่าสุดที่ราว 18,400 ล้านดอลลาร์ จากการรับเงินลงทุนรวมประมาณ 7,300 ล้านดอลลาร์
FTX แพลตฟอร์มซื้อขายคริปโตที่ล้มละลายเมื่อปี 2022 และอยู่ในแผนฟื้นฟูกิจการ ประกาศบรรลุข้อตกลงขายสินทรัพย์ ที่เป็นหุ้นของ Anthropic สตาร์ทอัพ AI ที่มีผลิตภัณฑ์เด่นคือแชทบอต Claude ด้วยมูลค่า 884 ล้านดอลลาร์ โดย FTX ไม่ได้ขายหุ้นออกมาทั้งหมด แต่ขายออกมาประมาณ 2 ใน 3 ที่บริษัทลงทุนไว้
Anthropic เปิดให้บริการโมเดล Claude 3 Haiku ซึ่งเป็นโมเดลขนาดเล็กสุดในชุด Claude 3 ที่เปิดตัวไปเมื่อต้นเดือน
จุดเด่นของ Claude 3 Haiku คือการเป็นโมเดลขนาดเล็ก ราคาถูก แต่ให้คำตอบคุณภาพดีกว่าโมเดลคู่แข่งในระดับเดียวกัน (GPT-3.5 และ Gemini 1.0 Pro) และออกแบบโครงสร้างราคาให้เหมาะกับการใช้งานองค์กร ที่ต้องการใส่ prompt ยาวกว่าผู้ใช้ทั่วไป (เช่น ยัดเอกสารขององค์กรเข้าไปทั้งก้อน) ทาง Anthropic ยกตัวอย่างการประมวลผลเอกสารคำตัดสินของศาลความยาว 400 ชิ้น ชิ้นละประมาณ 10,000 โทเคน ในราคาเพียง 1 ดอลลาร์
Anthropic บริษัทปัญญาประดิษฐ์ด้าน LLM เปิดตัวโมเดล Claude 3 โดยจุดเด่นสำคัญคือรุ่นสูงสุดนั้นทำคะแนนชนะ GPT-4 แทบทุกชุดทดสอบ และยังชนะ Gemini Ultra อีกด้วย
Claude 3 ประกอบด้วยรุ่นย่อย 3 รุ่น จากใหญ่ไปเล็กได้แก่ Opus ที่ชนะ GPT-4, Sonnet ใกล้เคียงกับ GPT-4, และ Haiku ที่อยู่ระดับเหนือกว่า GPT-3.5 โดยตัว Haiku นั้นออกแบบให้รันงานได้เร็ว เช่นการอ่านเอกสารความยาวเกินหมื่นโทเค็นก็ยังใช้เวลาไม่ถึง 3 วินาที โมเดลทั้งสามรุ่นรองรับการอ่านภาพ, ไฟล์เอกสาร, และ flowchart ต่างๆ โดยทำคะแนนใกล้เคียงกับ Gemini Ultra
Anthropic ผู้พัฒนา Claude ปัญญาประดิษฐ์สำคัญที่ชูจุดแข็งว่าสามารถรับอินพุตขนาดใหญ่ รายงานถึงผลการทดสอบการถามตอบเอกสารขนาดใหญ่ว่ามักได้ผลไม่ค่อยดีนัก โดยเฉพาะในกรณีที่ข้อความที่ใช้ตอบคำถามนั้นล้อมด้วยเรื่องที่ไม่เกี่ยวข้องกันนัก
รายงานระบุว่า Claude 2.1 นั้นถูกฝึกให้เลี่ยงการตอบคำถามหากไม่มีข้อความสนับสนุนคำตอบมากพอ แนวทางนี้มีเพื่อลดการตอบคำถามอย่างผิดๆ ทีมงานทดสอบโดยการถามคำถามถึงประโยคหนึ่งที่อยู่ในข้อความยาวๆ ที่พูดเรื่องเดียวกัน จากนั้นนำข้อความชุดนี้ไปผสมกับเอกสารอื่นจนเต็ม context 200k แล้วสลับตำแหน่งไปมา พบว่า Claude สามารถตอบคำถามได้เสมอไม่ว่าข้อความที่ใช้ตอบคำถามจะอยู่ตำแหน่งใดๆ แม้ประสิทธิภาพจะดีขึ้นเล็กน้อยหากข้อความอยู่ส่วนท้าย
AWS ประกาศเพิ่มบริการ Claude 2.1 ของทาง Anthropic ที่เพิ่งเปิดตัวสัปดาห์ที่ผ่านมา เข้ามาให้บริการใน Amazon Bedrock นับว่าให้บริการตามผู้พัฒนาโมเดลหลักได้ค่อนข้างเร็ว
Claude 2.1 เพิ่มฟีเจอร์สำคัญคือรองรับข้อมูลขนาดใหญ่มากจำนวน 200,000 โทเค็น หรือคิดเป็นเอกสาร 500 หน้ากระดาษ, ลดอัตราการหลอนลงครึ่งหนึ่ง, และรองรับ system prompt บอก AI ว่าให้ทำตัวอย่างไร
ฟีเจอร์สำคัญอย่างหนึ่งที่มีใน Bedrock คือ function calling เปิดทางให้ Claude สามารถเรียก API หรือฐานข้อมูลต่างๆ ได้ด้วยตัวเอง ฟีเจอร์นี้คล้ายกับ Agents for Amazon Bedrock ที่เปิดตัวในงานเดียวกัน แต่ทาง AWS ระบุว่าต้องขอใช้งานล่วงหน้าจึงเข้าถึงฟีเจอร์นี้ได้
AWS มีบริการ Generative AI ใต้ชื่อแบรนด์ Amazon Bedrock เริ่มมาตั้งแต่เดือนเมษายน โดยมีโมเดลให้เลือกหลากหลายยี่ห้อ เช่น Stable Diffusion, Llama 2 รวมถึงโมเดลของ AWS เองที่ชื่อตระกูล Amazon Titan
ล่าสุดในงาน re:Invent 2023 เราได้เห็นการเปิดตัวบริการใหม่ในตระกูล Titan เพิ่มเติมคือ
ระหว่างที่มหากาพย์ OpenAI ยังไม่จบลง ฝั่งคู่แข่ง Anthropic (ที่มีข่าวว่ามีข้อเสนอให้ควบรวมกัน) ก็เดินหน้าออกโมเดลเวอร์ชันใหม่ Claude 2.1
จุดเด่นของ Claude 2.1 คือการรองรับอินพุตความยาว 200,000 token หรือตีเป็นคำได้ 150,000 คำ เทียบได้กับหนังสือราว 500 หน้า การรองรับอินพุตที่ยาวขนาดนี้ทำให้ Claude สามารถอ่านเอกสารการเงินขนาดยาว, วรรณกรรมขนาดยาว หรืออ่านโค้ดทั้งหมดขององค์กรได้จบทีเดียว แล้วนำไปสรุป วิเคราะห์ ตอบคำถาม ฯลฯ ตามโจทย์ของแต่ละองค์กรได้สบายๆ (ตัวอย่างของ Anthropic คือเอาเอกสารงบประมาณของรัฐสภาสหรัฐ ย้อนหลัง 3 ปีใส่เข้าไปใน Claude แล้วให้สรุปแนวโน้มงบประมาณ)
The Information รายงานข้อมูลถึงการสรรหาซีอีโอของ OpenAI หลังจากบอร์ดบริษัทตัดสินใจไล่ออก Sam Altman แล้วแต่งตั้งแต่ Mira Murati มาเป็นซีอีโอรักษาการ ซึ่งก่อนที่บอร์ดจะประกาศชื่อ Emmett Shear อดีตซีอีโอ Twitch มาเป็นซีอีโอรักษาการคนใหม่นั้น มีตัวเลือกอยู่หลายคนก่อนหน้า
รายชื่อที่ถูกระบุถึงว่าบอร์ดบริษัทได้ติดต่อเชิญมาเป็นซีอีโอ แต่ทั้งหมดได้ปฏิเสธมีดังนี้
The Wall Street Journal รายงานว่ากูเกิลตกลงที่จะลงทุนใน Anthropic สตาร์ทอัพ AI ที่ก่อตั้งโดยอดีตพนักงาน OpenAI เพิ่มอีกมูลค่า 2 พันล้านดอลลาร์ แบ่งเป็นเงินก้อนแรก 500 ล้านดอลลาร์ และส่วนที่เหลือจะทยอยจ่ายในอนาคต
ก่อนหน้านี้กูเกิลเคยลงทุนช่วงแรกใน Anthropic ไปแล้วมูลค่า 550 ล้านดอลลาร์ ดีลใหม่นี้เป็นส่วนเพิ่มมาถัดจากที่ Anthropic เพิ่งรับเงินลงทุนจาก Amazon มูลค่า 4 พันล้านดอลลาร์
การพัฒนาของปัญญาประดิษฐ์กลุ่มโมเดลภาษาขนาดใหญ่ (large language model - LLM) ทำให้มีความพยายามศึกษาการทำงานโครงสร้างภายในของโมเดลเหล่านี้ว่ามัน “คิด” อย่างไร และตอนนี้ Anthropic ผู้สร้าง Claude AI ก็ออกมารายงานถึงแนวทางการศึกษา LLM ว่าควรมองเป็นกลุ่มนิวรอน เรียกว่าฟีเจอร์
ที่ผ่านมาการศึกษาปัญญาประดิษฐ์กลุ่ม deep learning โดยเฉพาะในงานที่เป็นการจัดการภาพนั้น มักจะพบว่านิวรอนแต่ละตัวถูกกระตุ้นโดยอินพุตที่ตรงไปตรงมา เช่น นิวรอนบางตัวอาจจะถูกกระตุ้นโดยภาพแมวเท่านั้น บางตัวถูกกระตุ้นโดยภาพหมา เราสามารถวิเคราะห์อย่างละเอียดได้ว่าอินพุดแบบใดจึงกระตุ้นนิวรอนเหล่านี้ แต่ใน LLM เมื่อมองเป็นนิวรอนรายตัว Anthropic กลับพบว่านิวรอนแต่ละตัวถูกกระตุ้นในภาวะที่ต่างกันไปจนหารูปแบบไม่ได้
Amazon ประกาศลงทุนในสตาร์ตอัพปัญญาประดิษฐ์ Anthropic โดยเตรียมเข้าใช้แพลตฟอร์ม AWS ในการให้บริการเต็มตัว
รูปแบบของดีลนี้นับว่าคล้ายกับ OpenAI และไมโครซอฟท์พอสมควร โดย Anthropic จะพัฒนาเทคโนโลยีของตัวเองผูกเข้าไปกับเทคโนโลยีของ AWS ตั้งแต่การฝึกปัญญาประดิษฐ์ด้วย AWS Trainium รันโมเดลด้วย Inferentia และให้บริการผ่านบริการ Amazon Bedrock ทั้งโมเดล Claude มาตรฐานและการทำ fine-tuning หลังจากนี้ AWS ก็จะลงทุนวางโครงสร้างพื้นฐานให้เพียงพอสำหรับ Anthropic
Anthropic บริษัท AI ที่ก่อตั้งโดยอดีตพนักงาน OpenAI และได้รับการสนับสนุนจากกูเกิล เปิดตัวบริการ Claude Pro เพื่อรันโมเดล Claude แบบไม่โดนจำกัดปริมาณใช้งานเหมือนรุ่นปกติ เทียบเท่ากับ ChatGPT Plus ของฝั่ง OpenAI และคิดราคาเท่ากันเป๊ะคือ 20 ดอลลาร์ต่อเดือน
Claude Pro สามารถใช้งานโมเดลได้เยอะกว่าเวอร์ชันฟรี 5 เท่า และมีคิวพิเศษให้รันโมเดลได้ก่อนในช่วงผู้ใช้งานเยอะๆ รวมถึงได้สิทธิลองใช้ฟีเจอร์ใหม่ก่อนคนทั่วไปด้วย
Google Cloud มีบริการเช่ารันโมเดล AI ชื่อ Vertex AI ที่ให้บริการมาสักระยะหนึ่งแล้ว และเปิดบริการโมเดล Generative AI เมื่อเดือนพฤษภาคมที่ผ่านมา โดยมีทั้งโมเดลของกูเกิลเอง และโมเดลจากบริษัทอื่นด้วย กูเกิลเรียกบริการนี้ว่า Model Garden
ล่าสุดในงาน Google Cloud Next '23 เมื่อคืนนี้ กูเกิลประกาศเพิ่มโมเดลของพาร์ทเนอร์อีกหลายตัว ได้แก่
แนวทางของโมเดลภาษาขนาดใหญ่เมื่อปีที่แล้ว เน้นแข่งขนาดกันใหญ่ขึ้นเรื่อยๆ แต่เทรนด์ของปีนี้มุ่งไปทางโมเดลที่ขนาดเล็กลง โดยคุณภาพของคำตอบที่ได้นั้นไม่ด้อยลงมากนัก
Anthropic บริษัท AI ที่ก่อตั้งโดยอดีตทีมงาน OpenAI เพิ่งเปิดตัวโมเดลเรือธง Claude 2 ไปเมื่อเดือนที่แล้ว แต่ในอีกทางยังมีโมเดลรุ่นเล็กชื่อ Claude Instant ที่ล่าสุดออกเวอร์ชัน 1.2 มีคุณภาพดีขึ้นจากเวอร์ชัน 1.1 ที่ออกมาก่อนหน้า
บริษัทด้าน AI รายใหญ่ 4 ราย ได้แก่ Google, Microsoft, OpenAI, Anthropic ประกาศตั้งกลุ่มอุตสาหกรรม Frontier Model Forum กำหนดแนวทางพัฒนาโมเดลอย่างปลอดภัย ลดความเสี่ยง และใช้กลุ่มเป็นตัวแทนประสานงานร่วมกับหน่วยงานภาครัฐ ภาคการศึกษา ภาคสังคมทั่วโลก
กลุ่มอุตสาหกรรมนี้กำหนดนิยามคำว่า "frontier model" ว่าเป็นโมเดล machine learning ขนาดใหญ่ที่มีความสามารถสูงกว่าโมเดลรุ่นปัจจุบัน โดยสมาชิกที่เข้าร่วมกลุ่มต้องพัฒนาโมเดลให้ปลอดภัย (safety) แบ่งปันข้อมูลกับหน่วยงานที่เกี่ยวข้อง และเดินตามแนวทางร่วมกันเพื่อลดความเสี่ยง
หลังจากประกาศตั้งกลุ่ม Frontier Model Forum แล้ว ในอีกไม่กี่เดือนข้างหน้าจะตั้งบอร์ดที่ปรึกษา กำหนดแนวทาง และเปิดรับสมาชิกต่อไป
Anthropic สตาร์ตอัพด้าน AI ที่ก่อตั้งโดยอดีตทีมงาน GPT ของ OpenAI เปิดตัวโมเดลเวอร์ชันใหม่ Claude 2 ที่พัฒนาขึ้นจาก Claude เวอร์ชันแรก ทั้งในแง่ประสิทธิภาพและการให้คำตอบที่ยาวกว่าเดิม (สูงสุด 100,000 tokens เท่ากับว่าสามารถใส่หนังสือลงไปได้ทั้งเล่มเป็นอินพุต)
จุดเด่นของ Claude ตั้งแต่เวอร์ชันแรกที่คุยง่าย ให้คำตอบเข้าใจง่ายและปลอดภัย มีความจำยาวว่าคุยอะไรไปแล้วบ้าง ส่วน Claude 2 ปรับปรุงเรื่องการเขียนโค้ด คณิตศาสตร์ การให้เหตุผล โดย Anthropic เปรียบเทียบความสามารถของ Claude 2 ว่า
Anthropic สตาร์ตอัพด้านปัญญาประดิษฐ์ ประกาศระดมทุนรอบ C สำเร็จรวมมูลค่า 450 ล้านดอลลาร์ หลังจากก่อนหน้านี้ประกาศว่า Zoom ลงทุน แต่เมื่อประกาศรายชื่อผู้ลงทุนทั้งหมด ก็มีบริษัทใหญ่ๆ เช่น Google, Saleforce Ventures, Sound Ventures เข้ามาร่วมลงทุนในรอบเดียวกัน