LLM | Blognone

Anthropic ผู้พัฒนาปัญญาประดิษฐ์ Claude.ai เพิ่มฟีเจอร์วิเคราะห์ข้อมูลในตัว เปิดทางให้ผู้ใช้สามารถแชตกับข้อมูลและแสดงผลเป็นกราฟได้ในตัว โดยรับข้อมูลเป็นตารางในรูปแบบไฟล์ CSV ที่เซฟจาก Excel หรือ Google Sheet ออกมาได้

โค้ดที่เขียนเป็นภาษาจาวาสคริปต์ และรับข้อมูลจากไฟล์ CSV ที่อัพโหลด จากนั้นสามารถทำความสะอาดข้อมูล, สำรวจข้อมูล, และวิเคราะห์ข้อมูลได้ในตัว

[ลือ] OpenAI เตรียมเปิดตัวโมเดลเวอร์ชันใหม่ Orion ในเดือนธันวาคม ยังไม่ชัดเรียก GPT-5 ไหม

By: mk

on 25 October 2024 - 15:52 Tags:

Topics:

Rumors

เว็บไซต์ The Verge รายงานข่าวจากแวดวงว่า OpenAI เตรียมเปิดตัวโมเดลเวอร์ชันสำคัญตัวใหม่โค้ดเนม Orion ในเดือนธันวาคมนี้ แต่ตอนนี้ยังไม่ชัดเจนว่าจะเรียกชื่ออย่างเป็นทางการว่า GPT-5 หรือไม่

ตามข่าวบอกว่าในช่วงแรกๆ Orion จะยังไม่เปิดให้ใช้งานทั่วไปผ่าน ChatGPT แบบที่แล้วๆ มา แต่จะเปิดให้บริษัทพาร์ทเนอร์ใกล้ชิดลองใช้งานก่อน เพื่อนำ Orion ไปใช้กับผลิตภัณฑ์ของพาร์ทเนอร์เอง ตัวอย่างคือไมโครซอฟท์จะเริ่มโฮสต์ Orion บนระบบ Azure ในเดือนพฤศจิกายน "เป็นอย่างเร็ว"

Meta เปิดตัวโมเดล Llama 3.2 รุ่น 1B & 3B Quantized ลดขนาดให้เล็กพิเศษ รันในมือถือได้

By: mk

on 25 October 2024 - 07:41 Tags:

Topics:

Llama

กูเกิลโอเพนซอร์ส SynthID Text ซอฟต์แวร์ใส่ลายน้ำในข้อความเพื่อบอกว่าสร้างโดย AI

By: mk

on 24 October 2024 - 16:31 Tags:

Topics:

DeepMind

Google DeepMind เปิดซอร์สโค้ด SynthID Text ตัวช่วยสร้างลายน้ำเพื่อบอกว่าข้อความสร้างด้วย AI เพื่อนำไปใช้ตรวจสอบได้ในอนาคต

Google DeepMind มี SynthID สำหรับทำลายน้ำลงในภาพ AI อยู่ก่อนแล้ว กรณีของภาพ ทุกคนคงนึกออกว่าการแทรกลายน้ำที่แยกด้วยสายตามนุษย์ไม่เห็นคงทำได้ไม่ยากนัก เพราะในหนึ่งภาพมีปริมาณข้อมูลอยู่มาก การแทรกลายน้ำเพิ่มไปอีกหน่อยคงไม่ใช่เรื่องยาก แต่เมื่อต้องใส่ลายน้ำลงในข้อความ text ล้วนๆ จะทำอย่างไร

SynthID Text ใช้หลักการว่า โมเดลภาษา LLM คือ "เครื่องพ่นคำ" คาดเดาคำถัดไปจากความน่าจะเป็น โดยคำหรือ token ที่มีค่าความน่าจะเป็นสูงสุดจะถูกคัดเลือกออกมาเป็นผลลัพธ์ให้ผู้ใช้เห็น

Hugging Face เปิดซอฟต์แวร์ HUGS ใช้รันโมเดลบนเครื่องเซิร์ฟเวอร์หลากหลาย ให้คนอื่นเช่าใช้งาน

By: mk

on 24 October 2024 - 15:49 Tags:

Topics:

Hugging Face

Cloud Computing

คนในแวดวง AI คงรู้จักบริษัท Hugging Face ในฐานะศูนย์รวมคลังโมเดลขนาดใหญ่ (มีโมเดลเกิน 1 ล้านตัวแล้ว) วิธีการหารายได้ของ Hugging Face ที่ผ่านมาคือการให้เช่าเซิร์ฟเวอร์สำหรับเทรน-ปรับแต่ง-รันโมเดลเหล่านี้ได้ทันที

คราวนี้ Hugging Face ขยายโมเดลธุรกิจของตัวเอง โดยนำซอฟต์แวร์ที่ใช้รันโมเดลข้างต้น เปิดให้ลูกค้าเช่าใช้งานซอฟต์แวร์นี้บนระบบไอทีของตัวเองได้ด้วย ใช้ชื่อว่า Hugging Face Generative AI Services หรือตัวย่อ HUGS

OSS-Fuzz-Gen โครงการใช้ LLM ค้นหาบั๊กพบช่องโหว่ใน OpenSSL, เป็น CVE แรก

By: lew

on 24 October 2024 - 11:26 Tags:

Topics:

Security

OpenSSL

โครงการ OSS-Fuzz รายงานถึงช่องโหว่ CVE-2024-9143 ของ OpenSSL ที่พบจากโครงการย่อย OSS-Fuzz-Gen โดยมีความเป็นไปได้ที่จะเป็นช่องโหว่ remote code execution แม้น่าจะโจมตีได้ยากก็ตาม ความพิเศษของช่องโหว่นี้คือมันเป็น CVE แรกที่ OSS-Fuzz-Gen ได้

ตอนนี้ OSS-Fuzz-Gen พบบั๊กแล้วจำนวน 26 รายการตั้งแต่ปลายปีที่แล้ว และยังมีบั๊กจำนวนหนึ่งยังไม่เปิดเผย แต่บั๊กก่อนหน้านี้ไม่ได้ให้เลข CVE เอาไว้

ช่องโหว่นี้เกิดจากการตั้งค่า encoding X9.62 ที่กรณีปกติแล้วไม่มีการใช้งานกันมากนัก แม้จะเป็นช่องโหว่ remote code execution จริงก็ความเสี่ยงไม่สูงนัก แต่แอปพลิเคชั่นที่ได้รับผลกระทบต้องมีการใช้งานที่พิเศษ

JetBrains เปิดตัว Mellum โมเดลภาษาสำหรับเขียนโค้ด ช่วยเติมโค้ดเร็วกว่า LLM ทั่วไป

By: mk

on 24 October 2024 - 08:10 Tags:

Topics:

JetBrains

Development

ค่าย JetBrains มีบริการใช้ AI ช่วยเขียนโค้ดชื่อ JetBrains AI Assistant ประมวลผลที่ฝั่งเซิร์ฟเวอร์ เปิดบริการมาตั้งแต่ปี 2023 โดยใช้โมเดลภาษาจากหลายค่ายผสมกัน ที่เคยระบุชื่อไว้คือจาก OpenAI และ Google LLM

ล่าสุด JetBrains เปิดตัวโมเดลภาษาของตัวเองชื่อ Mellum ที่บอกว่าสร้างมาเพื่องานช่วยเติมโค้ด (code completion) โดยเฉพาะ เมื่อเป็นโมเดลสำหรับงานเขียนโค้ดอย่างเดียว ทำให้โมเดลมีขนาดเล็ก ช่วยเติมโค้ดได้เร็วกว่าโมเดลภาษาอื่นๆ ในท้องตลาด

แม่เด็กวัยรุ่นฟ้องบริษัท AI หลังลูกติดแชตกับ AI นานหลายเดือนก่อนฆ่าตัวตาย

By: lew

on 23 October 2024 - 23:55 Tags:

Topics:

Megan Garcia แม่ของ Sewell Setzer III เด็กชายวัยรุ่นสหรัฐฯ อายุ 14 ปี ยื่นฟ้องต่อบริษัท Character.AI โดยระบุว่าบริการของบริษัทเป็นอันตรายต่อเด็ก ทำเหมือนคนจริงจนเด็กติด

คำฟ้องระบุว่า Setzer เริ่มติดโทรศัพท์ตั้งแต่กลางปี 2023 และตัดขาดตัวเองจากโลกภายนอกมากขึ้นเรื่อยๆ โดยที่ครอบครัวไม่รู้ว่าที่จริงแล้วเขาเอาแต่คุยกับ Dany ตัวละครในแอป Character.AI การเสพติดการคุยกับตัวละครมากขึ้นเรือ่ยๆ จนเขาเขียนในบันทึกว่าเขารัก Dany

อาการติดโทรศัพท์หนักขึ้นจนพ่อแม่ของ Setzer ต้องยึดโทรศัพท์ แต่เขาก็ขโมยกลับมา และแชตกับ Dany โดยบอกกับ Dany ว่าจะกลับบ้านไปหา และบอตก็สนับสนุนว่าอยากให้มาหา Setzer ก็ฆ่าตัวตายในที่สุด

Runway เปิดตัว Act-One เครื่องมือสร้างวิดีโอด้วย AI ที่เคลื่อนไหวตามบุคคล ไม่ต้องใช้อุปกรณ์เพิ่ม

By: arjin

on 23 October 2024 - 20:20 Tags:

Topics:

Runway

Runway สตาร์ทอัปที่เน้นโมเดลปัญญาประดิษฐ์สำหรับสร้างวิดีโอ เปิดตัว Act-One เครื่องมือสร้างวิดีโอด้วย AI ที่ให้รายละเอียดตรงตามความต้องการมากขึ้น เพราะใช้อินพุทเพิ่มเติมคือวิดีโอบันทึกใบหน้าบุคคล จากนั้น Act-One จะนำสีหน้า ดวงตา การแสดงออก คำพูด มารวมกับคาแรกเตอร์ที่สร้างจาก AI ออกมาเป็นคลิปวิดีโอที่กลมกลืนผ่านโมเดล Gen-3 Alpha

การสร้างภาพอนิเมชันเคลื่อนไหวจากใบหน้าและคำพูดของนักแสดง ไม่ใช่ของใหม่ในวงการการผลิตคอนเทนต์ แต่วิธีการทำงานของ Act-One ที่ใช้อินพุทเป็นคลิปวิดีโอของนักแสดงเท่านั้น ไม่ต้องใช้อุปกรณ์เสริมตรวจจับตำแหน่งต่าง ๆ ทำให้การสร้างภาพเคลื่อนไหวดังกล่าวง่ายขึ้น ทั้งสำหรับงานการผลิตอนิเมชันและภาพยนตร์แนว Live Action

IBM เปิดตัวโมเดลโอเพนซอร์ส Granite 3.0 ประสิทธิภาพดีกว่า Llama 3.1 และ Mistral

By: mk

on 23 October 2024 - 08:23 Tags:

Topics:

IBM

Open Source

Granite

IBM เปิดตัวโมเดล Granite เวอร์ชัน 3.0 ซึ่งเป็นเวอร์ชันอัพเดตจาก Granite 1.0 ที่เปิดตัวเมื่อเดือนพฤษภาคม

Granite เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดเป็นโอเพนซอร์สใต้สัญญาอนุญาตแบบเปิดกว้าง Apache 2.0 ชูจุดเด่นด้านประสิทธิภาพสูงกว่าหรือเทียบเท่าโมเดล LLM โอเพนซอร์สหรือเชิงพาณิชย์

Granite 3.0 มีให้เลือก 2 ขนาดพารามิเตอร์คือ 2B และ 8B โดย IBM โชว์เบนช์มาร์คคะแนน Hugging Face OpenLLM Leaderboard ว่าสามารถเอาชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันอย่าง Llama 3.1 8B และ Mistral 7B

Anthropic อัพเดตโมเดล Claude 3.5 ทดสอบเขียนโปรแกรมชนะ o1 พร้อมฟีเจอร์ควบคุมคอมพิวเตอร์แทนคน

By: lew

on 23 October 2024 - 03:13 Tags:

Topics:

Anthropic

Claude

Anthropic ผู้พัฒนาปัญญาประดิษฐ์แบบ LLM ตู่แข่ง OpenAI ประกาศอัพเดตโมเดล Claude สองรุ่น คือ Sonnet รุ่นกลาง และ Haiku รุ่นเล็ก โดยรอบนี้มีความพิเศษนอกจากเก่งขึ้นตามปกติแล้ว ยังเริ่มทดสอบฟีเจอร์ควบคุมคอมพิวเตอร์แทนคน ให้ผู้ใช้สามารถสั่งงานเป็นคำสั่งแล้ว Claude คลิกหน้าต่างหรือคำสั่งต่างๆ ให้เอง

Wall Street Journal/New York Post ยื่นฟ้อง Perplexity ฐานใช้เนื้อหาโดยไม่ได้รับอนุญาต

By: lew

on 22 October 2024 - 11:24 Tags:

Topics:

สำนักพิมพ์ Wall Street Journal และ New York Post ยื่นฟ้องต่อบริษัท Perplexity ฐานใช้เนื้อหาโดยไม่ได้รับอนุญาต และยังทำให้สื่อเสียชื่อเสียงเนื่องจากใส่เนื้อหาผิดๆ แล้วอ้่างว่ามาจากทางสำนักพิมพ์

เมื่อสัปดาห์ที่แล้ว New York Times เพิ่งส่งจดหมายทางการขอให้ Perplexity หยุดใช้เนื้อหาของทางสำนักพิมพ์ (แม้จะชื่อคล้ายๆ กันแต่ New York Times เป็นบริษัทอิสระ ขณะที่ Wall Street Journal และ New York Post นั้นเป็นสื่อในเครือบริษัท News Corp)

Google เพิ่มฟีเจอร์ใน Audio Overviews ของ NotebookLM สามารถสั่งเน้นเนื้อหาที่สนใจเป็นพิเศษได้

By: arjin

on 19 October 2024 - 00:22 Tags:

Topics:

NotebookLM

Gemini

กูเกิลอัปเดตฟีเจอร์สร้างบทสนทนาเสียงแนวพอดคาสต์ Audio Overviews ของ NotebookLM ที่ทำงานด้วยปัญญาประดิษฐ์ Gemini 1.5 โดยถอดป้ายกำกับว่าเป็นฟีเจอร์ทดลอง (Experimental) พร้อมกับมีเครื่องมือใหม่ดังนี้

Guide the conversation: สามารถกำหนดให้บทสนทนา เน้นไปที่เนื้อหาส่วนใดของคอนเทนต์เป็นพิเศษได้
Background listening: สามารถฟังบทสนทนาได้ ขณะทำงานส่วนอื่นในแอป

สุดท้ายกูเกิลประกาศเพิ่ม NotebookLM Business สำหรับลูกค้า Google Workspace ธุรกิจ มหาวิทยาลัย และองค์กร โดยมีการป้องกันความปลอดภัยและความเป็นส่วนตัวในมาตรฐานเดียวกับบริการอื่น

Lenovo เปิดตัว AI Now ผู้ช่วย AI พลัง Llama 3.1 เหมือนมี Copilot อีกตัวในพีซี

By: nismod

on 17 October 2024 - 15:42 Tags:

Topics:

Lenovo

Llama

Lenovo เปิดตัว AI Now เครื่องมือแชทบ็อตที่ทำหน้าที่เหมือนเป็น Copilot อีกตัวบนพีซี โดย AI Now ใช้พลังจากโมเดล Llama 3.1 ของ Meta

AI Now จะเน้นประมวลผลบนเครื่องเป็นหลัก และอาศัยข้อมูลการใช้งานช่วยเพิ่มความเฉพาะบุคคลมากขึ้น (personalised) แต่ก็สามารถส่งไปประมวลผลบนคลาวด์ได้โดย Lenovo บอกว่าผู้ใช้งานต้องยินยอมทุกครั้ง และมี Microsoft Azure AI Content Safety มาช่วยกรองการแสดงผลของ AI อีกชั้น รวมถึงเชื่อมต่อกับระบบบริการหลังการขายของ Lenovo ให้ด้วย

AI Now น่าจะถูกปล่อยอัพเดตให้กับเครื่องที่เป็น AI PC ของ Lenovo แต่ยังไม่มีการระบุไทม์ไลน์ใดๆ

ผู้ปกครองฟ้องครูฐานตัดคะแนนนักเรียนที่ใช้ AI ช่วยทำการบ้าน

By: lew

on 17 October 2024 - 00:32 Tags:

Topics:

Education

Dale และ Jennifer Harris ผู้ปกครองของ RNH ชื่อย่อของนักเรียนโรงเรียน Hingham High School ยื่นฟ้องครูและกรรมการโรงเรียน หลัง RNH ถูกตัดคะแนนการบ้านจนกระทั่งเกรดตก และอาจจะส่งผลต่อการเข้ามหาวิทยาลัยในปีนี้

คำฟ้องระบุว่าโรงเรียนไม่มีกฎห้ามใช้ AI อย่างชัดเจน RNH จึงไม่ควรถูกตัดคะแนนเพราะใช้ AI ช่วยทำการบ้านครั้งนี้ และขอศาลสั่งให้โรงเรียนคำนวณเกรดใหม่

ทางด้านโรงเรียนยืนยันว่าคู่มือนักเรียนระบุชัดเจนว่าห้ามใช้เทคโนโลยีที่ไม่ได้รับอนุญาต นอกจากนี้ในวิชา English Language Arts ก็ยังมีการอบรมเพิ่มเติมเกี่ยวกับการใช้ AI ว่าต้องได้รับอนุญาตเป็นการเฉพาะ รวมถึงมีการอบรมถึงการอ้างอิงไว้ด้วย โดยการบ้านของ RNH นั้นไม่ได้ระบุว่าใช้ AI แต่อย่างใด

New York Times ส่งจดหมายทางการ ขอให้ Perplexity หยุดใช้เนื้อหาในเว็บ

By: lew

on 15 October 2024 - 20:43 Tags:

Topics:

New York Times ส่งจดหมายทางการขอให้ Perplexity ผู้ให้บริการแชตบอต LLM แบบค้นหาข้อมูลและสรุปในตัวหยุดใช้ข้อมูลในเว็บไปสรุปบทความให้ผู้ใช้

ทาง New York Times นั้นเป็นสื่อรายใหญ่รายแรกๆ ที่เริ่มดำเนินคดีกับ OpenAI ว่าละเมิดลิขสิทธิ์ของสำนักพิมพ์ โดยยกตัวอย่างว่าผู้ใช้สามารถดึงบทความทั้งบทความกลับออกมาได้ และคดีตอนนี้ยังไม่จบแม้ว่าท่าทีของ OpenAI จะยอมจ่ายส่วนแบ่งให้กับสื่อต่างๆ อย่างต่อเนื่อง

Zamba2-7B โมเดล LLM ใหม่ชูจุดเด่นทำงานเร็ว ใช้ข้อมูลฝึกน้อย กินแรมต่ำ

By: lew

on 15 October 2024 - 13:39 Tags:

Topics:

Zyphra บริษัทปัญญาประดิษฐ์ LLM แบบโอเพนอร์สเปิดตัว Zamba2-7B โมเดล LLM โอเพนซอร์สแบบ Apache 2.0 โดยชูประเด็นประสิทธิภาพการทำงานว่าตอบได้เร็ว ใช้แรมขณะรันโมเดลต่ำ

ความแตกต่างสำคัญของ Zamba2 คือมันไม่ได้ใช้บล็อค Transformer เหมือน LLM ตัวอื่นๆ แต่ออกแบบบล็อค Mamba ของตัวเอง และในเวอร์ชั่นนี้ก็ใช้บล็อค Mamba2 ที่พัฒนาเพิ่มเติม โดยทั่วไปแล้ว Mamba ได้เปรียบ Transformer เมื่อใช้กับโมเดลขนาดเล็กและขนาดกลาง

ข้อมูลที่ใช้ฝึก Zamba2 นั้นใช้ชุดข้อมูลเปิด Zyda ร่วมกับชุดข้อมูลอื่น รวมเป็น 3 ล้านล้านโทเค็น แต่มีชุดข้อมูลคุณภาพสูงพิเศษแสนล้านโทเค็นเพื่อฝึกช่วงแรกให้โมเดลเก่งขึ้นอย่างรวดเร็ว กระบวนการฝึกรวมใช้เวลา 50 วัน ใช้ชิป H100 จำนวน 128 ตัว ถือว่าใช้งบประมาณในการฝึกระดับปานกลาง

ทีมวิจัยแอปเปิลชี้ LLM เอาแต่ท่องโจทย์มาตอบ แค่เปลี่ยนเลขก็ทำข้อสอบแย่ลง

By: lew

on 14 October 2024 - 00:19 Tags:

Topics:

Apple

ทีมวิจัยของแอปเปลรายงานถึงการทดสอบทางคณิตศาสตร์ของ Large Language Model (LLM) ว่าอาจจะยังไม่ดีพอ โดยยกตัวอย่างการทดสอบ GSM8K ที่ทดสอบการให้เหตุผลทางคณิตศาสตร์ที่ LLM รุ่นใหม่ๆ ทำคะแนนได้ดีขึ้นเรื่อยๆ แต่เมื่อทดสอบแก้ไขโจทย์เล็กน้อย หลายโมเดลกลับทำคะแนนได้แย่ลงมาก แสดงให้เห็นว่าโมเดลเหล่านี้ท่องโจทย์มาตอบ ไม่ได้เข้าใจโจทย์จริงๆ

แนวทางของทีมงานคือการสร้างชุดทดสอบ GSM-Symbolic เป็น template ของชุดทดสอบที่สามารถสร้างข้อสอบได้หลากหลาย หลังจากนั้นทดสอบด้วยชุดทดสอบที่เปลี่ยนค่าต่างๆ ไปแล้ว

OpenAI ออกรายงานการใช้ GPT ในทางที่ผิด พบแฮกเกอร์ใช้ช่วยเขียนโค้ด, ไล่ยิงสแปม, โน้มน้าวการเมือง

By: lew

on 13 October 2024 - 01:19 Tags:

Topics:

OpenAI รายงานถึงการแบนบัญชีกลุ่มแฮกเกอร์มากกว่า 20 กลุ่มตั้งแต่ต้นปีที่ผ่านมา โดยกลุ่มเหล่านี้ใช้งาน OpenAI ตั้งแต่การเชียนเว็บเพื่อหวังผลทางการเมืองไปจนถึงการใช้งานเพื่อช่วยเขียนมัลแวร์

กลุ่ม STORM-0817 ใช้โมเดลของ OpenAI ทำงานหลายอย่าง ทั้งการแปลข้อความในเว็บ, ดูดข้อมูลจาก Instagram, และพัฒนามัลแวร์ เมื่อติดตามการใช้งานพบว่ากลุ่มนี้พยายามพัฒนามัลแวร์ใหม่สำหรับแอนดรอยด์เพื่อติดตามเครื่องเป้าหมาย ทั้งการดูดข้อมูลจากโทรศัพท์และพัฒนาเซิร์ฟเวอร์เพื่อควบคุมเครื่องที่ติดมัลแวร์ไปแล้ว แม้จะไม่มีข้อมูลชัดเจนว่ากลุ่มนี้เป็นใคร แต่ก็พยายามแปลข้อมูลต่างๆ เป็นภาษาเปอร์เซีย, ทดสอบเป้าหมายมัลแวร์กับชาวอิหร่าน

Meta เปิดตัว Movie Gen เครื่องมือสร้างวิดีโอสั้นพร้อมเสียงด้วย AI

By: arjin

on 4 October 2024 - 20:56 Tags:

Topics:

OpenAI เปิดตัว Canvas อินเทอร์เฟซแบบใหม่ในการใช้ ChatGPT สำหรับงานเขียนเนื้อหา-เขียนโค้ด

By: arjin

on 4 October 2024 - 07:40 Tags:

Topics:

ChatGPT

OpenAI เปิดตัว Canvas อินเทอร์เฟซสำหรับการใช้งาน ChatGPT แบบใหม่ ซึ่ง OpenAI บอกว่าเหมาะกับงานเขียนเนื้อหาบทความ หรืองานเขียนโค้ด ซึ่งแตกต่างไปจากวิธีการแชทสนทนาแบบเดิม

Canvas ทำงานโดยเปิดเป็นหน้าต่างแยกจากกล่องแชทหลัก เป็นพื้นที่ให้สามารถจัดการสิ่งที่ต้องการ ปรับแต่งผลลัพธ์ ระบุความต้องการเฉพาะได้ง่ายขึ้นกว่าวิธีการป้อน Prompt ไปมา

การทำงานมีสองโหมดคือ Writing ซึ่ง Canvas มีปุ่มทางลัดทั้ง ระบุการแก้ไขข้อความเฉพาะส่วน, สั่งปรับความยาวของบทความ, ปรับระดับภาษา-ความยากเนื้อหา, ตรวจไวยากรณ์, แทรกอีโมจิ และโหมด Coding มีปุ่มทางลัด ให้ตรวจสอบโค้ดเฉพาะส่วน, เพิ่ม Log, เพิ่ม Comment, สั่งแก้บั๊ก, ส่งออกเป็นภาษาโปรแกรมอื่น

กูเกิลเปิดบริการ Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุด ราคาถูกลง 50% จาก Flash รุ่นปกติ

By: mk

on 4 October 2024 - 06:52 Tags:

Topics:

Gemini

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุดของ Gemini Flash ที่เปิดทดลองใช้ฟรีก่อนหน้านี้

Gemini 1.5 Flash-8B เป็นโมเดลที่ปรับขนาดให้เล็กลงเหลือ 8 พันล้านพารามิเตอร์ ในแง่ความฉลาดอาจลดลงบ้างเมื่อเทียบกับ Gemini 1.5 Flash รุ่นปกติ แลกกับข้อดีที่ได้มาคือ ราคาถูกลง 50%, ตอบสนองเร็วขึ้น, และมีอัตรา rate limit เพิ่มขึ้น 2 เท่า (สูงสุด 4,000 รีเควสต์ต่อนาที ของเดิม 2,000 รีเควสต์ต่อนาที)

ราคาของ Gemini 1.5 Flash-8B ถือว่าถูกที่สุดในการรันโมเดล Gemini ทุกตัว ได้แก่

กูเกิลเปิดให้นักพัฒนา Android เรียกใช้โมเดล Gemini Nano ประมวลผลในเครื่องแล้ว

By: mk

on 2 October 2024 - 20:30 Tags:

Topics:

กูเกิลเปิดให้นักพัฒนาแอพบน Android เรียกใช้งานโมเดล Gemini Nano เป็นการทั่วไป หลังจากทดสอบแบบจำกัดวงมาตั้งแต่ Google I/O 2024 โดยตอนนี้ใช้โมเดล Gemini Nano 2 ที่มีประสิทธิภาพดีขึ้นด้วย

การใช้งาน Gemini Nano ต้องเรียกผ่าน AICore โดยมี AI Edge SDK อีกที ตอนนี้การใช้งานยังจำกัดเฉพาะบนฮาร์ดแวร์ Pixel 9 series เท่านั้น และสถานะการเปิดใช้ยังเป็นการทดลองใช้งาน (experimental)

การเปิดให้แอพภายนอกใช้ Gemini Nano แบบ on device ทำให้แอพมีฟีเจอร์ด้าน AI จัดการข้อความได้ทันที เช่น rephrasing (ปรับแก้ไขข้อความ), smart reply, proofreading, summarization

OpenAI เปิด API ให้คุยเสียงได้โดยตรง, ฝึกโมเดลด้วยรูปภาพได้, ฝึกโมเดลขนาดเล็กด้วยโมเดลใหญ่

By: lew

on 2 October 2024 - 03:15 Tags:

Topics:

OpenAI ประกาศฟีเจอร์ฝั่งนักพัฒนาชุดใหญ่ โดยฟีเจอร์สำคัญคือการเปิด API รับข้อมูลเสียงโดยตรงเปิดทางสร้างแอปพลิเคชั่นคุยแบบธรรมชาติใน Advanced Voice Mode จากเดิมที่นักพัฒนานอก OpenAI ไม่สามารถทำแอปเหมือนกันได้

การรับเสียงจะสามารถใช้งานได้ทาง Realtime API ที่เชื่อมต่อกับเซิร์ฟเวอร์ผ่าน WebSocket แทน HTTP แบบเดิม แม้จะออกแบบมาเพื่อคุยเสียงเป็นหลักแต่ที่จริงก็ใช้คุยแชตข้อความปกติได้ พร้อมกันนี้ Chat API เดิมก็จะรองรับข้อมูลเสียงและโมเดล GPT-4o สามารถตอบกลับเป็นเสียงได้เหมือนกัน แม้จะไม่ตอบกลับทันทีเหมือน Realtime API

NotebookLM ของ Google รองรับวิดีโอสาธารณะบน YouTube และไฟล์เสียง มีประโยชน์ช่วยทำสรุปเลกเชอร์

By: arjin

on 27 September 2024 - 16:40 Tags:

Topics:

NotebookLM

Gemini