Large Language Model

Tags:
Node Thumbnail

Anthropic ผู้พัฒนาปัญญาประดิษฐ์ Claude.ai เพิ่มฟีเจอร์วิเคราะห์ข้อมูลในตัว เปิดทางให้ผู้ใช้สามารถแชตกับข้อมูลและแสดงผลเป็นกราฟได้ในตัว โดยรับข้อมูลเป็นตารางในรูปแบบไฟล์ CSV ที่เซฟจาก Excel หรือ Google Sheet ออกมาได้

โค้ดที่เขียนเป็นภาษาจาวาสคริปต์ และรับข้อมูลจากไฟล์ CSV ที่อัพโหลด จากนั้นสามารถทำความสะอาดข้อมูล, สำรวจข้อมูล, และวิเคราะห์ข้อมูลได้ในตัว

Tags:
Node Thumbnail

เว็บไซต์ The Verge รายงานข่าวจากแวดวงว่า OpenAI เตรียมเปิดตัวโมเดลเวอร์ชันสำคัญตัวใหม่โค้ดเนม Orion ในเดือนธันวาคมนี้ แต่ตอนนี้ยังไม่ชัดเจนว่าจะเรียกชื่ออย่างเป็นทางการว่า GPT-5 หรือไม่

ตามข่าวบอกว่าในช่วงแรกๆ Orion จะยังไม่เปิดให้ใช้งานทั่วไปผ่าน ChatGPT แบบที่แล้วๆ มา แต่จะเปิดให้บริษัทพาร์ทเนอร์ใกล้ชิดลองใช้งานก่อน เพื่อนำ Orion ไปใช้กับผลิตภัณฑ์ของพาร์ทเนอร์เอง ตัวอย่างคือไมโครซอฟท์จะเริ่มโฮสต์​ Orion บนระบบ Azure ในเดือนพฤศจิกายน "เป็นอย่างเร็ว"

Tags:
Topics: 
Node Thumbnail

Meta ปล่อยโมเดล Llama 3.2 รุ่นเล็ก ขนาดพารามิเตอร์ 1B และ 3B แบบลดขนาดโมเดลลงจากปกติ (quantized) ตั้งใจทำมาให้เล็กจนรันในอุปกรณ์พกพาได้ และเพิ่มความเร็วในการตอบคำถาม

ก่อนหน้านี้ Meta มี Llama 3.2 ขนาดพารามิเตอร์ 1B/3B อยู่แล้ว รอบนี้เป็นเวอร์ชันลดขนาดโมเดลลงได้อีก 56% (โมเดลรุ่น 1B ลดเหลือประมาณ GB จากขนาดเดิม 2.3GB) โดยยังคงคุณภาพและความปลอดภัยในระดับใกล้เคียงโมเดลต้นฉบับ ขนาดโมเดลที่ลดลงทำให้ลดหน่วยความจำที่ต้องใช้ลงได้ 41% และเพิ่มความเร็วได้ 2-4 เท่า

Meta จับมือกับผู้ผลิตชิปมือถือรายใหญ่ทั้ง MediaTek และ Qualcomm ให้รองรับโมเดลรุ่นนี้บนซีพียู Arm แล้ว และกำลังพัฒนาให้รองรับการใช้งานบน NPU ต่อไป

Tags:
Node Thumbnail

Google DeepMind เปิดซอร์สโค้ด SynthID Text ตัวช่วยสร้างลายน้ำเพื่อบอกว่าข้อความสร้างด้วย AI เพื่อนำไปใช้ตรวจสอบได้ในอนาคต

Google DeepMind มี SynthID สำหรับทำลายน้ำลงในภาพ AI อยู่ก่อนแล้ว กรณีของภาพ ทุกคนคงนึกออกว่าการแทรกลายน้ำที่แยกด้วยสายตามนุษย์ไม่เห็นคงทำได้ไม่ยากนัก เพราะในหนึ่งภาพมีปริมาณข้อมูลอยู่มาก การแทรกลายน้ำเพิ่มไปอีกหน่อยคงไม่ใช่เรื่องยาก แต่เมื่อต้องใส่ลายน้ำลงในข้อความ text ล้วนๆ จะทำอย่างไร

SynthID Text ใช้หลักการว่า โมเดลภาษา LLM คือ "เครื่องพ่นคำ" คาดเดาคำถัดไปจากความน่าจะเป็น โดยคำหรือ token ที่มีค่าความน่าจะเป็นสูงสุดจะถูกคัดเลือกออกมาเป็นผลลัพธ์ให้ผู้ใช้เห็น

Tags:
Node Thumbnail

คนในแวดวง AI คงรู้จักบริษัท Hugging Face ในฐานะศูนย์รวมคลังโมเดลขนาดใหญ่ (มีโมเดลเกิน 1 ล้านตัวแล้ว) วิธีการหารายได้ของ Hugging Face ที่ผ่านมาคือการให้เช่าเซิร์ฟเวอร์สำหรับเทรน-ปรับแต่ง-รันโมเดลเหล่านี้ได้ทันที

คราวนี้ Hugging Face ขยายโมเดลธุรกิจของตัวเอง โดยนำซอฟต์แวร์ที่ใช้รันโมเดลข้างต้น เปิดให้ลูกค้าเช่าใช้งานซอฟต์แวร์นี้บนระบบไอทีของตัวเองได้ด้วย ใช้ชื่อว่า Hugging Face Generative AI Services หรือตัวย่อ HUGS

Tags:
Node Thumbnail

โครงการ OSS-Fuzz รายงานถึงช่องโหว่ CVE-2024-9143 ของ OpenSSL ที่พบจากโครงการย่อย OSS-Fuzz-Gen โดยมีความเป็นไปได้ที่จะเป็นช่องโหว่ remote code execution แม้น่าจะโจมตีได้ยากก็ตาม ความพิเศษของช่องโหว่นี้คือมันเป็น CVE แรกที่ OSS-Fuzz-Gen ได้

ตอนนี้ OSS-Fuzz-Gen พบบั๊กแล้วจำนวน 26 รายการตั้งแต่ปลายปีที่แล้ว และยังมีบั๊กจำนวนหนึ่งยังไม่เปิดเผย แต่บั๊กก่อนหน้านี้ไม่ได้ให้เลข CVE เอาไว้

ช่องโหว่นี้เกิดจากการตั้งค่า encoding X9.62 ที่กรณีปกติแล้วไม่มีการใช้งานกันมากนัก แม้จะเป็นช่องโหว่ remote code execution จริงก็ความเสี่ยงไม่สูงนัก แต่แอปพลิเคชั่นที่ได้รับผลกระทบต้องมีการใช้งานที่พิเศษ

Tags:
Node Thumbnail

ค่าย JetBrains มีบริการใช้ AI ช่วยเขียนโค้ดชื่อ JetBrains AI Assistant ประมวลผลที่ฝั่งเซิร์ฟเวอร์ เปิดบริการมาตั้งแต่ปี 2023 โดยใช้โมเดลภาษาจากหลายค่ายผสมกัน ที่เคยระบุชื่อไว้คือจาก OpenAI และ Google LLM

ล่าสุด JetBrains เปิดตัวโมเดลภาษาของตัวเองชื่อ Mellum ที่บอกว่าสร้างมาเพื่องานช่วยเติมโค้ด (code completion) โดยเฉพาะ เมื่อเป็นโมเดลสำหรับงานเขียนโค้ดอย่างเดียว ทำให้โมเดลมีขนาดเล็ก ช่วยเติมโค้ดได้เร็วกว่าโมเดลภาษาอื่นๆ ในท้องตลาด

Tags:
Node Thumbnail

Megan Garcia แม่ของ Sewell Setzer III เด็กชายวัยรุ่นสหรัฐฯ อายุ 14 ปี ยื่นฟ้องต่อบริษัท Character.AI โดยระบุว่าบริการของบริษัทเป็นอันตรายต่อเด็ก ทำเหมือนคนจริงจนเด็กติด

คำฟ้องระบุว่า Setzer เริ่มติดโทรศัพท์ตั้งแต่กลางปี 2023 และตัดขาดตัวเองจากโลกภายนอกมากขึ้นเรื่อยๆ โดยที่ครอบครัวไม่รู้ว่าที่จริงแล้วเขาเอาแต่คุยกับ Dany ตัวละครในแอป Character.AI การเสพติดการคุยกับตัวละครมากขึ้นเรือ่ยๆ จนเขาเขียนในบันทึกว่าเขารัก Dany

อาการติดโทรศัพท์หนักขึ้นจนพ่อแม่ของ Setzer ต้องยึดโทรศัพท์ แต่เขาก็ขโมยกลับมา และแชตกับ Dany โดยบอกกับ Dany ว่าจะกลับบ้านไปหา และบอตก็สนับสนุนว่าอยากให้มาหา Setzer ก็ฆ่าตัวตายในที่สุด

Tags:
Node Thumbnail

Runway สตาร์ทอัปที่เน้นโมเดลปัญญาประดิษฐ์สำหรับสร้างวิดีโอ เปิดตัว Act-One เครื่องมือสร้างวิดีโอด้วย AI ที่ให้รายละเอียดตรงตามความต้องการมากขึ้น เพราะใช้อินพุทเพิ่มเติมคือวิดีโอบันทึกใบหน้าบุคคล จากนั้น Act-One จะนำสีหน้า ดวงตา การแสดงออก คำพูด มารวมกับคาแรกเตอร์ที่สร้างจาก AI ออกมาเป็นคลิปวิดีโอที่กลมกลืนผ่านโมเดล Gen-3 Alpha

การสร้างภาพอนิเมชันเคลื่อนไหวจากใบหน้าและคำพูดของนักแสดง ไม่ใช่ของใหม่ในวงการการผลิตคอนเทนต์ แต่วิธีการทำงานของ Act-One ที่ใช้อินพุทเป็นคลิปวิดีโอของนักแสดงเท่านั้น ไม่ต้องใช้อุปกรณ์เสริมตรวจจับตำแหน่งต่าง ๆ ทำให้การสร้างภาพเคลื่อนไหวดังกล่าวง่ายขึ้น ทั้งสำหรับงานการผลิตอนิเมชันและภาพยนตร์แนว Live Action

Tags:
Node Thumbnail

IBM เปิดตัวโมเดล Granite เวอร์ชัน 3.0 ซึ่งเป็นเวอร์ชันอัพเดตจาก Granite 1.0 ที่เปิดตัวเมื่อเดือนพฤษภาคม

Granite เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดเป็นโอเพนซอร์สใต้สัญญาอนุญาตแบบเปิดกว้าง Apache 2.0 ชูจุดเด่นด้านประสิทธิภาพสูงกว่าหรือเทียบเท่าโมเดล LLM โอเพนซอร์สหรือเชิงพาณิชย์

Granite 3.0 มีให้เลือก 2 ขนาดพารามิเตอร์คือ 2B และ 8B โดย IBM โชว์เบนช์มาร์คคะแนน Hugging Face OpenLLM Leaderboard ว่าสามารถเอาชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันอย่าง Llama 3.1 8B และ Mistral 7B

Tags:
Node Thumbnail

Anthropic ผู้พัฒนาปัญญาประดิษฐ์แบบ LLM ตู่แข่ง OpenAI ประกาศอัพเดตโมเดล Claude สองรุ่น คือ Sonnet รุ่นกลาง และ Haiku รุ่นเล็ก โดยรอบนี้มีความพิเศษนอกจากเก่งขึ้นตามปกติแล้ว ยังเริ่มทดสอบฟีเจอร์ควบคุมคอมพิวเตอร์แทนคน ให้ผู้ใช้สามารถสั่งงานเป็นคำสั่งแล้ว Claude คลิกหน้าต่างหรือคำสั่งต่างๆ ให้เอง

Tags:
Node Thumbnail

สำนักพิมพ์ Wall Street Journal และ New York Post ยื่นฟ้องต่อบริษัท Perplexity ฐานใช้เนื้อหาโดยไม่ได้รับอนุญาต และยังทำให้สื่อเสียชื่อเสียงเนื่องจากใส่เนื้อหาผิดๆ แล้วอ้่างว่ามาจากทางสำนักพิมพ์

เมื่อสัปดาห์ที่แล้ว New York Times เพิ่งส่งจดหมายทางการขอให้ Perplexity หยุดใช้เนื้อหาของทางสำนักพิมพ์ (แม้จะชื่อคล้ายๆ กันแต่ New York Times เป็นบริษัทอิสระ ขณะที่ Wall Street Journal และ New York Post นั้นเป็นสื่อในเครือบริษัท News Corp)

Tags:
Node Thumbnail

กูเกิลอัปเดตฟีเจอร์สร้างบทสนทนาเสียงแนวพอดคาสต์ Audio Overviews ของ NotebookLM ที่ทำงานด้วยปัญญาประดิษฐ์ Gemini 1.5 โดยถอดป้ายกำกับว่าเป็นฟีเจอร์ทดลอง (Experimental) พร้อมกับมีเครื่องมือใหม่ดังนี้

  • Guide the conversation: สามารถกำหนดให้บทสนทนา เน้นไปที่เนื้อหาส่วนใดของคอนเทนต์เป็นพิเศษได้
  • Background listening: สามารถฟังบทสนทนาได้ ขณะทำงานส่วนอื่นในแอป

สุดท้ายกูเกิลประกาศเพิ่ม NotebookLM Business สำหรับลูกค้า Google Workspace ธุรกิจ มหาวิทยาลัย และองค์กร โดยมีการป้องกันความปลอดภัยและความเป็นส่วนตัวในมาตรฐานเดียวกับบริการอื่น

Tags:
Node Thumbnail

Lenovo เปิดตัว AI Now เครื่องมือแชทบ็อตที่ทำหน้าที่เหมือนเป็น Copilot อีกตัวบนพีซี โดย AI Now ใช้พลังจากโมเดล Llama 3.1 ของ Meta

AI Now จะเน้นประมวลผลบนเครื่องเป็นหลัก และอาศัยข้อมูลการใช้งานช่วยเพิ่มความเฉพาะบุคคลมากขึ้น (personalised) แต่ก็สามารถส่งไปประมวลผลบนคลาวด์ได้โดย Lenovo บอกว่าผู้ใช้งานต้องยินยอมทุกครั้ง และมี Microsoft Azure AI Content Safety มาช่วยกรองการแสดงผลของ AI อีกชั้น รวมถึงเชื่อมต่อกับระบบบริการหลังการขายของ Lenovo ให้ด้วย

AI Now น่าจะถูกปล่อยอัพเดตให้กับเครื่องที่เป็น AI PC ของ Lenovo แต่ยังไม่มีการระบุไทม์ไลน์ใดๆ

Tags:
Node Thumbnail

Dale และ Jennifer Harris ผู้ปกครองของ RNH ชื่อย่อของนักเรียนโรงเรียน Hingham High School ยื่นฟ้องครูและกรรมการโรงเรียน หลัง RNH ถูกตัดคะแนนการบ้านจนกระทั่งเกรดตก และอาจจะส่งผลต่อการเข้ามหาวิทยาลัยในปีนี้

คำฟ้องระบุว่าโรงเรียนไม่มีกฎห้ามใช้ AI อย่างชัดเจน RNH จึงไม่ควรถูกตัดคะแนนเพราะใช้ AI ช่วยทำการบ้านครั้งนี้ และขอศาลสั่งให้โรงเรียนคำนวณเกรดใหม่

ทางด้านโรงเรียนยืนยันว่าคู่มือนักเรียนระบุชัดเจนว่าห้ามใช้เทคโนโลยีที่ไม่ได้รับอนุญาต นอกจากนี้ในวิชา English Language Arts ก็ยังมีการอบรมเพิ่มเติมเกี่ยวกับการใช้ AI ว่าต้องได้รับอนุญาตเป็นการเฉพาะ รวมถึงมีการอบรมถึงการอ้างอิงไว้ด้วย โดยการบ้านของ RNH นั้นไม่ได้ระบุว่าใช้ AI แต่อย่างใด

Tags:
Node Thumbnail

New York Times ส่งจดหมายทางการขอให้ Perplexity ผู้ให้บริการแชตบอต LLM แบบค้นหาข้อมูลและสรุปในตัวหยุดใช้ข้อมูลในเว็บไปสรุปบทความให้ผู้ใช้

ทาง New York Times นั้นเป็นสื่อรายใหญ่รายแรกๆ ที่เริ่มดำเนินคดีกับ OpenAI ว่าละเมิดลิขสิทธิ์ของสำนักพิมพ์ โดยยกตัวอย่างว่าผู้ใช้สามารถดึงบทความทั้งบทความกลับออกมาได้ และคดีตอนนี้ยังไม่จบแม้ว่าท่าทีของ OpenAI จะยอมจ่ายส่วนแบ่งให้กับสื่อต่างๆ อย่างต่อเนื่อง

Tags:
Node Thumbnail

Zyphra บริษัทปัญญาประดิษฐ์ LLM แบบโอเพนอร์สเปิดตัว Zamba2-7B โมเดล LLM โอเพนซอร์สแบบ Apache 2.0 โดยชูประเด็นประสิทธิภาพการทำงานว่าตอบได้เร็ว ใช้แรมขณะรันโมเดลต่ำ

ความแตกต่างสำคัญของ Zamba2 คือมันไม่ได้ใช้บล็อค Transformer เหมือน LLM ตัวอื่นๆ แต่ออกแบบบล็อค Mamba ของตัวเอง และในเวอร์ชั่นนี้ก็ใช้บล็อค Mamba2 ที่พัฒนาเพิ่มเติม โดยทั่วไปแล้ว Mamba ได้เปรียบ Transformer เมื่อใช้กับโมเดลขนาดเล็กและขนาดกลาง

ข้อมูลที่ใช้ฝึก Zamba2 นั้นใช้ชุดข้อมูลเปิด Zyda ร่วมกับชุดข้อมูลอื่น รวมเป็น 3 ล้านล้านโทเค็น แต่มีชุดข้อมูลคุณภาพสูงพิเศษแสนล้านโทเค็นเพื่อฝึกช่วงแรกให้โมเดลเก่งขึ้นอย่างรวดเร็ว กระบวนการฝึกรวมใช้เวลา 50 วัน ใช้ชิป H100 จำนวน 128 ตัว ถือว่าใช้งบประมาณในการฝึกระดับปานกลาง

Tags:
Topics: 
Node Thumbnail

ทีมวิจัยของแอปเปลรายงานถึงการทดสอบทางคณิตศาสตร์ของ Large Language Model (LLM) ว่าอาจจะยังไม่ดีพอ โดยยกตัวอย่างการทดสอบ GSM8K ที่ทดสอบการให้เหตุผลทางคณิตศาสตร์ที่ LLM รุ่นใหม่ๆ ทำคะแนนได้ดีขึ้นเรื่อยๆ แต่เมื่อทดสอบแก้ไขโจทย์เล็กน้อย หลายโมเดลกลับทำคะแนนได้แย่ลงมาก แสดงให้เห็นว่าโมเดลเหล่านี้ท่องโจทย์มาตอบ ไม่ได้เข้าใจโจทย์จริงๆ

แนวทางของทีมงานคือการสร้างชุดทดสอบ GSM-Symbolic เป็น template ของชุดทดสอบที่สามารถสร้างข้อสอบได้หลากหลาย หลังจากนั้นทดสอบด้วยชุดทดสอบที่เปลี่ยนค่าต่างๆ ไปแล้ว

Tags:
Topics: 
Node Thumbnail

OpenAI รายงานถึงการแบนบัญชีกลุ่มแฮกเกอร์มากกว่า 20 กลุ่มตั้งแต่ต้นปีที่ผ่านมา โดยกลุ่มเหล่านี้ใช้งาน OpenAI ตั้งแต่การเชียนเว็บเพื่อหวังผลทางการเมืองไปจนถึงการใช้งานเพื่อช่วยเขียนมัลแวร์

กลุ่ม STORM-0817 ใช้โมเดลของ OpenAI ทำงานหลายอย่าง ทั้งการแปลข้อความในเว็บ, ดูดข้อมูลจาก Instagram, และพัฒนามัลแวร์ เมื่อติดตามการใช้งานพบว่ากลุ่มนี้พยายามพัฒนามัลแวร์ใหม่สำหรับแอนดรอยด์เพื่อติดตามเครื่องเป้าหมาย ทั้งการดูดข้อมูลจากโทรศัพท์และพัฒนาเซิร์ฟเวอร์เพื่อควบคุมเครื่องที่ติดมัลแวร์ไปแล้ว แม้จะไม่มีข้อมูลชัดเจนว่ากลุ่มนี้เป็นใคร แต่ก็พยายามแปลข้อมูลต่างๆ เป็นภาษาเปอร์เซีย, ทดสอบเป้าหมายมัลแวร์กับชาวอิหร่าน

Tags:
Node Thumbnail

Meta สาธิตเครื่องมือสร้างวิดีโอจาก AI ตัวล่าสุดเรียกชื่อว่า Movie Gen ซึ่งการทำงานก็ตามชื่อเลย นั่นคือสามารถสร้างวิดีโอสั้นจาก Prompt ข้อความ โดยผลลัพธ์เป็นวิดีโอที่มาพร้อมเสียงด้วย ความละเอียดสูงสุด 1080p HD ความยาวสูงสุด 16 วินาที เฟรมเรต 16 เฟรมต่อวินาที

สถานะของ Movie Gen ยังเป็นงานวิจัย และยังไม่มีแผนเปิดให้ใช้งานกับสาธารณะในตอนนี้ โดยการทดสอบเบื้องต้นมีผลลัพธ์ที่ตรงความต้องการดีกว่าโมเดลสร้างวิดีโออื่นในตลาดตอนนี้ เช่น Runway Gen3, LumaLabs หรือ Kling1.5

Tags:
Node Thumbnail

OpenAI เปิดตัว Canvas อินเทอร์เฟซสำหรับการใช้งาน ChatGPT แบบใหม่ ซึ่ง OpenAI บอกว่าเหมาะกับงานเขียนเนื้อหาบทความ หรืองานเขียนโค้ด ซึ่งแตกต่างไปจากวิธีการแชทสนทนาแบบเดิม

Canvas ทำงานโดยเปิดเป็นหน้าต่างแยกจากกล่องแชทหลัก เป็นพื้นที่ให้สามารถจัดการสิ่งที่ต้องการ ปรับแต่งผลลัพธ์ ระบุความต้องการเฉพาะได้ง่ายขึ้นกว่าวิธีการป้อน Prompt ไปมา

การทำงานมีสองโหมดคือ Writing ซึ่ง Canvas มีปุ่มทางลัดทั้ง ระบุการแก้ไขข้อความเฉพาะส่วน, สั่งปรับความยาวของบทความ, ปรับระดับภาษา-ความยากเนื้อหา, ตรวจไวยากรณ์, แทรกอีโมจิ และโหมด Coding มีปุ่มทางลัด ให้ตรวจสอบโค้ดเฉพาะส่วน, เพิ่ม Log, เพิ่ม Comment, สั่งแก้บั๊ก, ส่งออกเป็นภาษาโปรแกรมอื่น

Tags:
Node Thumbnail

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุดของ Gemini Flash ที่เปิดทดลองใช้ฟรีก่อนหน้านี้

Gemini 1.5 Flash-8B เป็นโมเดลที่ปรับขนาดให้เล็กลงเหลือ 8 พันล้านพารามิเตอร์ ในแง่ความฉลาดอาจลดลงบ้างเมื่อเทียบกับ Gemini 1.5 Flash รุ่นปกติ แลกกับข้อดีที่ได้มาคือ ราคาถูกลง 50%, ตอบสนองเร็วขึ้น, และมีอัตรา rate limit เพิ่มขึ้น 2 เท่า (สูงสุด 4,000 รีเควสต์ต่อนาที ของเดิม 2,000 รีเควสต์ต่อนาที)

ราคาของ Gemini 1.5 Flash-8B ถือว่าถูกที่สุดในการรันโมเดล Gemini ทุกตัว ได้แก่

Tags:
Node Thumbnail

กูเกิลเปิดให้นักพัฒนาแอพบน Android เรียกใช้งานโมเดล Gemini Nano เป็นการทั่วไป หลังจากทดสอบแบบจำกัดวงมาตั้งแต่ Google I/O 2024 โดยตอนนี้ใช้โมเดล Gemini Nano 2 ที่มีประสิทธิภาพดีขึ้นด้วย

การใช้งาน Gemini Nano ต้องเรียกผ่าน AICore โดยมี AI Edge SDK อีกที ตอนนี้การใช้งานยังจำกัดเฉพาะบนฮาร์ดแวร์ Pixel 9 series เท่านั้น และสถานะการเปิดใช้ยังเป็นการทดลองใช้งาน (experimental)

การเปิดให้แอพภายนอกใช้ Gemini Nano แบบ on device ทำให้แอพมีฟีเจอร์ด้าน AI จัดการข้อความได้ทันที เช่น rephrasing (ปรับแก้ไขข้อความ), smart reply, proofreading, summarization

Tags:
Topics: 
Node Thumbnail

OpenAI ประกาศฟีเจอร์ฝั่งนักพัฒนาชุดใหญ่ โดยฟีเจอร์สำคัญคือการเปิด API รับข้อมูลเสียงโดยตรงเปิดทางสร้างแอปพลิเคชั่นคุยแบบธรรมชาติใน Advanced Voice Mode จากเดิมที่นักพัฒนานอก OpenAI ไม่สามารถทำแอปเหมือนกันได้

การรับเสียงจะสามารถใช้งานได้ทาง Realtime API ที่เชื่อมต่อกับเซิร์ฟเวอร์ผ่าน WebSocket แทน HTTP แบบเดิม แม้จะออกแบบมาเพื่อคุยเสียงเป็นหลักแต่ที่จริงก็ใช้คุยแชตข้อความปกติได้ พร้อมกันนี้ Chat API เดิมก็จะรองรับข้อมูลเสียงและโมเดล GPT-4o สามารถตอบกลับเป็นเสียงได้เหมือนกัน แม้จะไม่ตอบกลับทันทีเหมือน Realtime API

Tags:
Node Thumbnail

กูเกิลอัปเดตฟีเจอร์ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 และรองรับภาษาไทย โดยเพิ่มการรองรับข้อมูลต้นทางต่อไปนี้

  • URL ของวิดีโอ YouTube ที่เป็นสาธารณะ
  • ไฟล์เสียง (Audio)

กูเกิลยกตัวอย่างกรณีที่สามารถนำ NotebookLM มาช่วยสร้างบันทึกจากข้อมูลต้นทางกลุ่มนี้ เช่น ทำสรุปเนื้อหาวิดีโอทั่วไป วิดีโอเลกเชอร์ รวมทั้งไฟล์เสียงที่บันทึกจากในห้องเรียน

นอกจากนี้กูเกิลยังอัปเดต Audio Overview ฟีเจอร์สร้างไฟล์เสียงแบบพอดคาสต์สรุปเนื้อหาเอกสาร โดยสามารถแชร์ไฟล์เสียงได้โดยตรงภายในแอปแล้ว

ที่มา: กูเกิล

Pages