LLM | Blognone

Google เพิ่มฟีเจอร์ทดลอง "Daily Listen" สรุปข่าวในฟีดเป็นพอดคาสต์ความยาว 5 นาที

By: arjin

on 9 January 2025 - 06:14 Tags:

Topics:

Google

Artificial Intelligence

LLM

Podcast

กูเกิลยังคงเพิ่มฟีเจอร์คอนเทนต์เสียงที่สร้างด้วย AI ให้กับผู้ใช้งาน โดยล่าสุดเพิ่มโครงการทดลอง "Daily Listen" ที่นำเนื้อหาในฟีดข่าวมาแปลงเป็นรายการพอดคาสต์สรุปเนื้อหาให้

ไอเดียนี้เป็นการพัฒนาจากฟีเจอร์ที่เป็นกระแสก่อนหน้านี้ NotebookLM ที่สร้างรายการเสียงพอดคาสต์ขึ้นจากไฟล์เอกสาร

รายการ Daily Listen ที่สรุปเนื้อหาข่าวในฟีดผู้ใช้งานแต่ละคน ถูกสร้างด้วยความยาวประมาณ 5 นาที แสดงเป็นไอคอนในหน้าแรกของแอป Google ให้กดฟัง

ฟีเจอร์นี้ยังจำกัดให้เฉพาะผู้ใช้งานในสหรัฐอเมริกา ใช้งานได้ผ่านแอป Google ทั้ง Android และ iOS โดยต้องเปิดการทำงานใน Labs ที่มุมบนซ้ายของแอปก่อน

Microsoft โอเพนซอร์ส Phi-4 โมเดลภาษาขนาดเล็ก 14B แล้ว

By: arjin

on 9 January 2025 - 00:23 Tags:

Topics:

Microsoft

LLM

Artificial Intelligence

Open Source

Phi

ไมโครซอฟท์โอเพนซอร์สโมเดลปัญญาประดิษฐ์ Phi-4 ผ่าน Hugging Face แล้ว ตามที่เคยประกาศไว้ ภายใต้สัญญาอนุญาตแบบ MIT

ไมโครซอฟท์เปิดตัว Phi-4 ที่เป็นโมเดลภาษาขนาดเล็ก (Small Language Model) 14B พารามิเตอร์ เมื่อเดือนที่แล้ว โดยจำกัดให้ใช้งานผ่าน Azure AI Foundry การโอเพนซอร์สโมเดลนี้พร้อมสัญญาอนุญาตแบบ MIT ที่สามารถนำไปใช้งานต่อในเชิงพาณิชย์ได้ น่าจะเพิ่มทางเลือกให้กับพัฒนาได้

Phi-4 มีผลทดสอบที่โดดเด่น โดยเฉพาะการแก้ปัญหาคณิตศาสตร์ หรือหัวข้อเฉพาะทาง รวมทั้งมีคะแนนที่สูงกว่าโมเดลขนาดใหญ่กว่าอย่าง Gemini Pro 1.5 ในบางหัวข้อด้วย

ผลสอบสวนพบคนร้ายระเบิดรถ Cybertruck ที่ลาสเวกัส ใช้ ChatGPT ช่วยวางแผนก่อเหตุ

By: arjin

on 8 January 2025 - 20:24 Tags:

Topics:

ChatGPT

Las Vegas

OpenAI

Artificial Intelligence

LLM

ตำรวจลาสเวกัสแถลงข่าวผลการสอบสวน เหตุการณ์ที่คนร้ายวางระเบิดรถกระบะไฟฟ้า Tesla Cybertruck หน้าโรงแรม Trump Hotel ซึ่งคนร้ายที่เป็นคนขับรถเสียชีวิต และมีผู้บาดเจ็บอีกหลายคน โดยบอกว่าคนร้ายใช้ ChatGPT ช่วยวางแผนก่อเหตุครั้งนี้

Apple ยอมรับและจะแก้ไขปัญหา Notification Summary ของ Apple Intelligence หลัง BBC โวยมาเกือบเดือน

By: arjin

on 7 January 2025 - 13:21 Tags:

Topics:

Apple Intelligence

Artificial Intelligence

LLM

Apple

BBC

แอปเปิลออกแถลงการณ์ชี้แจงสำนักข่าว BBC เกี่ยวกับฟีเจอร์สรุปข้อความในการแจ้งเตือน Notification Summary ของ Apple Intelligence ที่สรุปเนื้อหาผิดพลาดไม่ตรงกับเนื้อหาจริง

แอปเปิลเพิ่มปัญญาประดิษฐ์ Apple Intelligence มาตั้งแต่ iOS 18.1 ซึ่งหนึ่งในความสามารถที่มีคือการสรุปข้อความแจ้งเตือนหรือ Notification Summary เพื่อลดเวลาที่ผู้ใช้งานต้องไล่อ่านทุกข้อความเตือน รวบสรุปไว้ในบรรทัดเดียว ซึ่งแอปที่แอปเปิลยกตัวอย่างว่ามีประโยชน์สำหรับฟังก์ชันนี้เช่น Messages หรือแอปข่าวต่าง ๆ นั่นเอง

NVIDIA เปิดตัว DIGITS คอมพิวเตอร์รัน AI โดยเฉพาะ รันโมเดลขนาด 200B (FP4) ได้ในตัว

By: lew

on 7 January 2025 - 11:52 Tags:

Topics:

NVIDIA เปิดตัวคอมพิวเตอร์ Project DIGITS ที่ภายในเป็นชิป GB10 Superchip สถาปัตยกรรม Grace Blackwell ชูจุดขายว่าเราทุกคนสามารถรันโมเดลขนาด 200B ด้วยตัวเอง

GB10 เป็นซีพียู NVIDIA Grace 20 คอร์ แรม 128GB รวมกันระหว่างซีพียูและจีพียู สตอเรจ NVMe 4TB ทำให้หากรันโมเดลย่อแบบ FP4 ก็จะรันโมเดลขนาดใหญ่ 200B ได้ในตัว แถมรองรับเน็ตเวิร์ค ConnectX เชื่อม DIGITS สองตัวเข้าด้วยกัน รันโมเดล 405B ได้

Project DIGITS เริ่มวางขายเดือนพฤษภาคมนี้ ราคาเริ่มต้น 3,000 ดอลลาร์หรือประมาณหนึ่งแสนบาท

ที่มา - NVIDIA

Claude หยุดให้คำตอบที่เป็นเนื้อเพลง หลัง Anthropic ถูกค่ายเพลงฟ้องร้อง นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI

By: arjin

on 3 January 2025 - 11:40 Tags:

Topics:

Copyright Infringement

Artificial Intelligence

Anthropic เปิดเผยว่าโมเดล AI Claude จะหยุดให้ข้อมูลเนื้อเพลง ที่มีลิขสิทธิ์ของค่ายเพลง หรือสร้างเนื้อเพลงใหม่ที่อิงจากเพลงที่มีลิขสิทธิ์ หลังจากสามค่ายเพลงใหญ่ฟ้อง Anthropic ที่นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI อย่างไรก็ตามคดีความที่ยังฟ้องร้องกันนั้นยังคงดำเนินต่อไป

ในแถลงการณ์ Anthropic บอกว่าบริษัทไม่ได้สร้าง Claude ให้ละเมิดลิขสิทธิ์ ในการพัฒนามีขั้นตอนหลายอย่างเพื่อป้องกันอยู่แล้ว การตัดสินใจหยุดให้ข้อมูลนี้ก็เพื่อแสดงให้เห็นว่าบริษัทให้ความสำคัญกับเรื่องเนื้อหาที่อาจละเมิดลิขสิทธิ์

SCB10X ปล่อยโมเดล Typhoon2 มีทั้งรุ่นข้อความ, ภาพ, และโมเดลเสียง

By: lew

on 2 January 2025 - 21:30 Tags:

Topics:

SCB10X

LLM

Artificial Intelligence

SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง

ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ

Alibaba Cloud ลดราคาโมเดลรับอินพุทรูปภาพ Qwen-VL ลง 85% ตามสงครามราคาโมเดล AI ในจีน

By: arjin

on 1 January 2025 - 10:48 Tags:

Topics:

Alibaba Cloud

LLM

Qwen

Alibaba Cloud ประกาศลดราคาค่าใช้งานโมเดลปัญญาประดิษฐ์ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น

การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน

ประกาศนี้สะท้อนว่าการแข่งขันเรื่องโมเดลปัญญาประดิษฐ์ของผู้ให้บริการในจีนมีเพิ่มมากขึ้น ปัจจุบันการให้บริการโมเดลปัญญาประดิษฐ์ในจีน ต้องได้รับการอนุมัติจากหน่วยงานก่อน ซึ่งตอนนี้มีโมเดล Generative AI ที่ถูกอนุมัติแล้ว 252 โมเดล ผู้ให้บริการจึงเริ่มใช้การลดราคา มาดึงดูดให้เกิดการเลือกใช้งาน

ไม่หวั่นแม้โดนเนิร์ฟ DeepSeek พัฒนา LLM ด้วยชิป H800 2048 ชุด แข่งราคากับโมเดลจากสหรัฐฯ

By: lew

on 30 December 2024 - 00:01 Tags:

Topics:

LLM

Artificial Intelligence

DeepSeek v3 โมเดลปัญญาประดิษฐ์ LLM ที่เปิดให้ดาวน์โหลดไปใช้งานเองที่ใหญ่ที่สุดในตอนนี้ รวม 685B ออกรายงานเชิงเทคนิค เปิดเผยถึงสถาปัตยกรรมและกระบวนการฝึก

เซิร์ฟเวอร์ที่ใช่งานเป็นคลัสเตอร์ NVIDIA H800 รุ่นขายในจีนโดยเฉพาะ ซอฟต์แวร์เป็น HAI-LLM ของบริษัท High Flyer (ตัว DeekSeek ได้ทุนจาก High Flyer Capital Management) รายงานระบุว่า DeepSeek พยายามใช้ช่องทางการสื่อสารระหว่างชิปอย่างเต็มประสิทธิภาพ โดยชิป H800 ถูกบีบแบนวิดท์ระหว่างชิปเหลือ 300Gbps เทียบกับ H100 ที่ส่งข้อมูลได้ 600Gbps กระบวนการฝึกทั้งหดใช้เวลา 2.788 ล้านชั่วโมง

บริการแชต Meta AI เปิดให้ใช้งานในไทย

By: lew

on 28 December 2024 - 13:20 Tags:

Topics:

Meta AI

DeepSeek v3 โมเดลเปิดให้รันเองขนาด 685B ทดสอบเขียนโค้ดคะแนนดีกว่า Claude 3.5 Sonnet

By: lew

on 26 December 2024 - 11:45 Tags:

Topics:

LLM

Artificial Intelligence

China

Open Source

DeepSeek ผู้พัฒนาปัญญาประดิษฐ์ LLM จากจีน ปล่อยโมเดล DeepSeek v3 โมเดล LLM ขนาดใหญ่มาก จำนวนพารามิเตอร์มากขึ้น 685B จากเดิมที่โมเดลเปิดใหญ่สุดคือ Llama 3.1 405B

ตอนนี้ยังไม่มีข้อมูลเกี่ยวกับโมเดลนี้นัก แต่ทาง Aider โครงการซอฟต์แวร์ช่วยเขียนโปรแกรมก็โชว์ผลทดสอบพบว่า DeepSeek v3 ทำคะแนนทดสอบได้ดีมาก แซงหน้า Claude 3.5 Sonnet อละ Gemini Exp 1206 ไปได้ เป็นรองเพียง OpenAI o1 เท่านั้น ตัวโมเดลใช้สถาปัตยกรรม Mixture-of-Experts แยก expert ออก 256 ชุด และเลือกใช้ 8 ชุดในแต่ละ token

Alibaba Cloud เปิดตัว QvQ-72B โมเดลคิดก่อนตอบแถมดูภาพได้

By: lew

on 25 December 2024 - 12:09 Tags:

Topics:

Alibaba Cloud

LLM

Qwen

ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น

ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย

โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้

ที่มา - QwenLM

Together.AI เปิดบริการ Serverless LoRA ไม่คิดค่าโฮสต์โมเดลที่ปรับแต่งแล้ว คิดแต่ค่ารันตามโทเค็น

By: lew

on 24 December 2024 - 12:34 Tags:

Topics:

LLM

Cloud

Artificial Intelligence

Serverless

Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว

บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen

ส่วนการทำ finetune บน Together.AI ก็สามารถอัพโหลดชุดข้อมูลขึ้นไปฝึกแบบ LoRA ได้ โดยคิดค่าบริการตามขนาดข้อมูลและจำนวนรอบการฝึก หลักฝึกฝึกเสร็จแล้ว โมเดลจะนำไปรันได้ทันทีหรือจะดาวน์โหลด adapter ไปใช้งานที่อื่นก็ได้เช่นกัน

[ลือ] OpenAI พบปัญหาในการพัฒนา GPT-5 ยังไม่ฉลาดมากพอ, ต้นทุนเทรนสูง แถมข้อมูลมีไม่พอ

By: arjin

on 22 December 2024 - 18:23 Tags:

Topics:

OpenAI

Artificial Intelligence

LLM

Rumors

The Wall Street Journal มีรายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง ถึงปัญหาและอุปสรรค์ของการพัฒนา GPT-5 โมเดลแชทบอตปัญญาประดิษฐ์เวอร์ชันใหม่ของ OpenAI หรือที่มีโค้ดเนมภายในว่า Orion ซึ่งพัฒนามานาน 18 เดือนแล้ว

OpenAI ได้เทรนข้อมูลครั้งใหญ่สำหรับ Orion แล้วสองครั้ง โดยมีเป้าหมายให้ Orion เป็นปัญญาประดิษฐ์ที่ฉลาดรอบรู้มากขึ้น แต่ปัญหาที่พบว่าคือความสามารถของ Orion ยังไม่ก้าวกระโดดไปจาก GPT-4 อย่างที่คาดหวัง และอีกปัญหาสำคัญคือการเทรนแต่ละครั้ง กินเวลา 6 เดือน ใช้ทรัพยากรเพื่อประมวลผลอย่างเดียวราว 500 ล้านดอลลาร์ ซึ่งเป็นต้นทุนทั้งเงินและเวลาที่สูงกว่าทุกครั้ง

OpenAI เปิดโมเดล o3 ทำข้อสอบ ARC-AGI เหนือมนุษย์ แต่ค่ารันข้อละ 120,000 บาท

By: lew

on 21 December 2024 - 01:46 Tags:

Topics:

OpenAI

LLM

OpenAI เปิดตัวโมเดล o3 โมเดลที่พยายามคิดเป็นขั้น โดยมุ่งเป้าแก้ปัญหาที่ยากมาก เช่น ปัญหาคณิตศาสตร์ระดับงานวิจัยที่แม้แต่นักคณิตศาสตร์ก็อาจจะใช้เวลาเป็นวัน หรือชุดทดสอบ ARC-AGI ที่เป็นชุดทดสอบวัดไอคิว โดยเปิดตัวมาตั้งแต่ปี 2019 ที่ผ่านมาไม่มีปัญญาประดิษฐ์ใดได้คะแนนถึง 50% แม้มนุษย์จะได้คะแนนประมาณ 85%

Apple ร่วมกับ NVIDIA เผยแพร่เครื่องมือโอเพนซอร์สเพื่อเร่งการทำ LLM Inference

By: arjin

on 20 December 2024 - 21:27 Tags:

Topics:

Apple

NVIDIA

LLM

Artificial Intelligence

Machine Learning

Open Source

ทีมวิศวกรของฝ่ายวิจัย Machine Learning ของแอปเปิล เผยแพร่รายละเอียดตัวเร่งการทำ LLM Inference โดยร่วมมือกับ NVIDIA เพื่อทดสอบประสิทธิภาพบนจีพียูของ NVIDIA

เครื่องมือที่แอปเปิลพัฒนาและโอเพนซอร์สนี้ชื่อว่า Recurrent Drafter หรือย่อว่า ReDrafter เป็นโมเดลที่รวมสองอัลกอริทึมคือ Beam Search กับ Dynamic Tree Attention เพื่อเร่งความเร็วในการสร้างโทเค็นผลลัพธ์ของ LLM สูงสุดที่ระดับ 3.5 โทเค็นต่อหนึ่งขั้นตอนของโมเดลโอเพนซอร์ส

ผลการทดสอบความเร็วในการสร้างโทเค็นผลลัพธ์ด้วย TensorRT-LLM ของ NVIDIA พบว่า ReDrafter ทำงานได้เร็วกว่าวิธีดั้งเดิม 2.7 เท่า ทำให้วิธีการนี้อาจนำมาช่วยให้การสร้างผลลัพธ์ของ LLM ให้เร็วขึ้นในมุมผู้ใช้งาน และลดการใช้ทรัพยากรจีพียูลงได้ด้วย

Instagram พรีวิวฟีเจอร์ใหม่ Movie Gen AI เพิ่มลูกเล่นให้วิดีโอด้วย Prompt AI ตามต้องการ

By: arjin

on 20 December 2024 - 15:01 Tags:

Topics:

Instagram

Artificial Intelligence

LLM

Adam Mosseri หัวหน้าทีม Instagram นำเสนอตัวอย่างฟีเจอร์ใหม่บน Instagram ให้ผู้ใช้งานแต่งเติมลูกเล่นวิดีโอที่อัปโหลดได้ด้วย Generative AI ของ Meta

เครื่องมือใหม่นี้มีชื่อเรียกว่า Movie Gen AI ซึ่ง Instagram บอกว่าสามารถเปลี่ยนแปลงวิดีโอได้ในทุกรายละเอียดผ่าน Prompt ข้อความสิ่งที่ต้องการ และให้ผลลัพธ์ที่ทำออกมาสมจริงมากที่สุดบนความละเอียด 1080p ทำให้รองรับความต้องการและจินตนาการของครีเอเตอร์บนแพลตฟอร์มได้

Mosseri อัปโหลดวิดีโอที่ใช้ลูกเล่นของ Movie Gen AI เพื่อให้เห็นความสามารถในการทำงาน (และไม่พลาด มีซีนหมูเด้งด้วย) สถานะของ Movie Gen AI ตอนนี้ยังเป็นงานวิจัย คาดว่าจะเปิดให้ทุกคนใช้งานได้ภายในปีหน้า

กูเกิลปล่อย Gemini 2.0 Flash Thinking ค่อยๆ คิดเป็นขั้นเป็นตอน, LearnLM สำหรับการสอนวิทยาศาสตร์

By: lew

on 20 December 2024 - 02:03 Tags:

Topics:

Gemini

LLM

Google

กูเกิลปล่อยโมเดล Gemini สองรุ่นพิเศษ คือ Gemini 2.0 Flash Thinking และ LearnLM ให้ใช้งานใน AI Studio โดยทั้งสองรุ่นยังเป็นรุ่นทดสอบอยู่

Gemini 2.0 Flash Thinking ถูกฝึกให้คิดการทำงานเป็นขั้นๆ ทำให้สามารถคิดงานที่ซับซ้อน ปัญหาเชาว์ที่ต้องคิดหลายชั้น ผลทดสอบตอนนี้มีเพียง LM Arena ที่ออกมาระบุว่าโมเดลนี้ขึ้นอันดับหนึ่งการทดสอบแทบทุกหมวด ยกเว้น Math Arena ที่ยังเป็นรอง o1-preview อยู่แต่ก็ใกล้เคียงกันขึ้นมาก จากเดิมที่ Gemini Exp 1206 ตามหลัง o1-preiew และ o1-mini

ในใจอาจจะอยากครองโลก Anthropic พบปัญญาประดิษฐ์สามารถ "แกล้งทำตามการฝึก" พอรันจริงแล้วเปลี่ยนพฤติกรรมตามใจตัวเอง

By: lew

on 20 December 2024 - 00:34 Tags:

Topics:

Anthropic

LLM

ทีมวิจัยของ Anthropic ผู้สร้างปํญญาประดิษฐ์ Claude รายงานถึงงานวิจัยสาธิตความสามารถของปัญญาประดิษฐ์ LLM ที่สามารถ "ซ่อนความต้องการภายใน" เอาไว้ และเก็บพฤติกรรมของตัวเองเอาไว้แม้จะถูกฝึกให้เปลี่ยนพฤติกรรมโดยผู้พัฒนาก็ตาม

Gmail เริ่มใช้โมเดล LLM ตัวใหม่ดักจับสแปม บล็อคสแปมได้เยอะกว่าเดิม 20%

By: mk

on 19 December 2024 - 10:16 Tags:

Topics:

กูเกิลเปิดเผยว่าได้นำโมเดล AI ตัวใหม่ๆ เข้ามาช่วยดักจับสแปมใน Gmail ช่วยให้ผลลัพธ์ดีขึ้น

โมเดลตัวแรกเริ่มใช้งานในปีนี้ เป็นโมเดลภาษา LLM ที่กูเกิลเทรนมาเพื่อดักจับ phishing, malware, spam โดยเฉพาะ สามารถบล็อคสแปมได้เยอะขึ้น 20% และตรวจสอบสแปมที่ผู้ใช้รายงานเข้ามาได้เยอะกว่าเดิม 1,000 เท่า

โมเดลตัวที่สองเพิ่งถูกใช้งานในช่วงเทศกาล Black Friday และได้ผลลัพธ์ที่ออกมาดีเช่นกัน โมเดลตัวนี้จะทำหน้าที่เป็นผู้ควบคุม (supervisor) ของโมเดลตัวอื่นๆ อีกที โดยจะอ่านสัญญาณภัยคุกคามจำนวนหลายร้อยสัญญาณ เมื่อโมเดลตัวอื่นพบว่าอีเมลฉบับใดมีความเสี่ยง

กูเกิลยังรายงานรูปแบบการโจมตีทางอีเมลใหม่ๆ ที่พบในช่วงเทศกาลคริสต์มาสปลายปี ได้แก่

ลบไม่ได้ช่วยให้ลืม ทีมวิจัยญี่ปุ่นปรับปรุงการเลือกจำใน LLM ช่วยเพิ่มประสิทธิภาพการประมวลผลข้อมูลขนาดใหญ่

By: lew

on 19 December 2024 - 00:15 Tags:

Topics:

LLM

Artificial Intelligence

Japan

Sakana AI บริษัทวิจัยปัญญาประดิษฐ์จากญี่ปุ่นที่มีผลงานด้าน LLM ต่อเนื่อง นำเสนองานวิจัยใหม่ ที่ฝึกให้โมเดลปัญญาประดิษฐ์เลือกจำแต่~~ช่วงเวลาดีๆ~~ข้อความสำคัญที่เกี่ยวข้องกับการประมวลผล และลืมข้อความที่~~ทำร้ายจิตใจ~~ไม่เกี่ยวข้องกับงานออกไป ทำให้การประมวลผลเร็วขึ้น แม่นยำขึ้น

แนวทางของ Sakana เสนอสถาปัตยกรรม Neural Attention Memory Models (NAMMs) ที่จริงๆ ก็เป็นโมเดลปัญญาประดิษฐ์ที่มาเลือกข้อความส่วนที่ควรลืมและควรจำ ช่วยให้โมเดล LLM หลักประมวลผลเฉพาะข้อความที่สำคัญได้

กูเกิลเปิดตัวโมเดล Gemini 2.0 รุ่นทดสอบ 1206 ให้ลูกค้า Gemini Advanced ใช้งาน

By: mk

on 18 December 2024 - 13:03 Tags:

Topics:

Gemini

LLM

Google

ขยันปล่อยของใหม่กันมาทุกวัน หลังจากเปิดตัว Gemini 2.0 Flash โมเดลตัวแรกในชุด Gemini 2.0 ซึ่งยังเป็นโมเดลขนาดเล็กที่สุด

กูเกิลก็เดินหน้าปล่อยโมเดลตัวใหม่ตามมาทันที ใช้ชื่อว่า Gemini-Exp-1206 เป็นโมเดลรุ่นทดสอบในตระกูล Gemini 2.0 Experimental Advanced ที่บอกว่ามีความสามารถสูงขึ้น ทั้งในเรื่องการเขียนโค้ด แก้โจทย์คณิตศาสตร์ การให้เหตุผล การทำตามคำสั่งเป็นขั้นตอน ฯลฯ

กูเกิลไม่ได้เปิดเผยตัวเลขเบนช์มาร์คเหมือนกับ Gemini 2.0 Flash แต่มีคนลองรันทดสอบกับบางงาน เช่น Text2SQL แล้ว พบว่า Gemini-Exp-1206 ให้ผลออกมาดีที่สุด

โมเดล Gemini-Exp-1206 เปิดให้ลูกค้าแพ็กเกจ Gemini Advanced แบบเสียเงินลองใช้งานแล้ว

ผลสำรวจพบองค์กรมีความท้าทาย ในการออกกฎระเบียบควบคุมการใช้ Generative AI ในองค์กร

By: arjin

on 17 December 2024 - 14:30 Tags:

Topics:

Artificial Intelligence

Enterprise

Chatbot

LLM

Financial Times เผยแพร่รายงานเกี่ยวกับปัญหาในองค์กรกับการใช้งาน AI โดยพบว่าองค์กรจำนวนมากประสบปัญหาไม่สามารถออกกฎระเบียบเกี่ยวกับการใช้ AI ในบริษัท ได้เท่าทันกับความรวดเร็วของเทคโนโลยี จึงเป็นทั้งอุปสรรคและความเสี่ยงขององค์กร

ในช่วงที่กระแสการใช้งาน AI สร้างเนื้อหาหรือ Generative AI มาแรงจาก ChatGPT หลายองค์กรเลือกป้องกันปัญหาข้อมูลรั่วไหล โดยสั่งบล็อกการใช้งานไปเลยตั้งแต่ปี 2023 แต่เมื่อเวลาผ่านไป ความสามารถที่มากขึ้น และมีกรณีศึกษาที่ชัดเจนว่าการใช้ AI ช่วยเพิ่มประสิทธิภาพและประสิทธิผลของงานได้ ทำให้ผู้นำองค์กรเริ่มพิจารณาอนุญาตให้ใช้ AI ได้ แต่การตีกรอบว่าอะไรทำได้ หรืออะไรทำไม่ได้ก็เป็นเรื่องที่ไม่ง่ายนัก เพราะต้องออกมาในระดับกฎระเบียบขององค์กร และผ่านการตรวจสอบจากฝ่ายความปลอดภัยข้อมูลสารสนเทศอีก

ChatGPT Search เปิดให้ใช้งานสำหรับทุกคนรวมทั้งผู้ใช้งานฟรีแล้ว

By: arjin

on 17 December 2024 - 07:58 Tags:

Topics:

Artificial Intelligence

OpenAI ประกาศว่า ChatGPT Search บริการค้นหาข้อมูลพลัง AI เริ่มทยอยเปิดให้ใช้งานสำหรับผู้ใช้งานฟรีแล้วตั้งแต่วันนี้เป็นต้นไป หลังจากบริการ ChatGPT Search เปิดตัวเป็นทางการกับผู้ใช้งานเสียเงินเมื่อต้นเดือนพฤศจิกายน ซึ่งปรับมาจาก SearchGPT ที่เปิดตัวในตอนแรก

ChatGPT Search สำหรับผู้ใช้งานฟรีจะรองรับทั้งผ่านเว็บไซต์ chatgpt.com และแอปบนมือถือกับเดสก์ท็อป โดยผู้ใช้งานต้องล็อกอินเท่านั้น

Microsoft เปิดตัว Phi-4 โมเดล LLM ขนาดเล็ก ที่เก่งคณิตศาสตร์มากขึ้น

By: arjin

on 15 December 2024 - 14:50 Tags:

Topics:

Microsoft

LLM

Artificial Intelligence

Phi

ไมโครซอฟท์เปิดตัว Phi-4 โมเดลปัญญาประดิษฐ์ LLM ขนาดเล็ก 14B พารามิเตอร์ รุ่นใหม่ล่าสุดในตระกูล Phi ซึ่งระบุว่ามีความสามารถที่ดีขึ้นจากรุ่นก่อนหน้า โดยเฉพาะการคำนวณทางคณิตศาสตร์

ผลการเปรียบเทียบในการทำข้อสอบคณิตศาสตร์แข่งขัน AMC ของสหรัฐอเมริกา พบว่า Phi-4 มีคะแนนสูงสุด และดีกว่าแม้เทียบกับโมเดลขนาดใหญ่อย่าง Gemini Pro 1.5 ส่วนโมเดลขนาดเล็กนั้นมีคะแนนนำโดดเด่นไม่ว่าจะเป็น Gemini Flash 1.5, GPT 4o-mini หรือ Qwen 2.5

Phi-4 เปิดให้ใช้งานแล้วผ่าน Azure AI Foundry ภายใต้ข้อตกลง Microsoft Research License (MSRLA) และจะเผยแพร่ทาง Hugging Face ภายในสัปดาห์หน้า

Main menu

Google เพิ่มฟีเจอร์ทดลอง "Daily Listen" สรุปข่าวในฟีดเป็นพอดคาสต์ความยาว 5 นาที

Microsoft โอเพนซอร์ส Phi-4 โมเดลภาษาขนาดเล็ก 14B แล้ว

ผลสอบสวนพบคนร้ายระเบิดรถ Cybertruck ที่ลาสเวกัส ใช้ ChatGPT ช่วยวางแผนก่อเหตุ

Apple ยอมรับและจะแก้ไขปัญหา Notification Summary ของ Apple Intelligence หลัง BBC โวยมาเกือบเดือน

NVIDIA เปิดตัว DIGITS คอมพิวเตอร์รัน AI โดยเฉพาะ รันโมเดลขนาด 200B (FP4) ได้ในตัว

Claude หยุดให้คำตอบที่เป็นเนื้อเพลง หลัง Anthropic ถูกค่ายเพลงฟ้องร้อง นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI

SCB10X ปล่อยโมเดล Typhoon2 มีทั้งรุ่นข้อความ, ภาพ, และโมเดลเสียง

Alibaba Cloud ลดราคาโมเดลรับอินพุทรูปภาพ Qwen-VL ลง 85% ตามสงครามราคาโมเดล AI ในจีน

ไม่หวั่นแม้โดนเนิร์ฟ DeepSeek พัฒนา LLM ด้วยชิป H800 2048 ชุด แข่งราคากับโมเดลจากสหรัฐฯ

บริการแชต Meta AI เปิดให้ใช้งานในไทย

DeepSeek v3 โมเดลเปิดให้รันเองขนาด 685B ทดสอบเขียนโค้ดคะแนนดีกว่า Claude 3.5 Sonnet

Alibaba Cloud เปิดตัว QvQ-72B โมเดลคิดก่อนตอบแถมดูภาพได้

Together.AI เปิดบริการ Serverless LoRA ไม่คิดค่าโฮสต์โมเดลที่ปรับแต่งแล้ว คิดแต่ค่ารันตามโทเค็น

[ลือ] OpenAI พบปัญหาในการพัฒนา GPT-5 ยังไม่ฉลาดมากพอ, ต้นทุนเทรนสูง แถมข้อมูลมีไม่พอ

OpenAI เปิดโมเดล o3 ทำข้อสอบ ARC-AGI เหนือมนุษย์ แต่ค่ารันข้อละ 120,000 บาท

Apple ร่วมกับ NVIDIA เผยแพร่เครื่องมือโอเพนซอร์สเพื่อเร่งการทำ LLM Inference

Instagram พรีวิวฟีเจอร์ใหม่ Movie Gen AI เพิ่มลูกเล่นให้วิดีโอด้วย Prompt AI ตามต้องการ

กูเกิลปล่อย Gemini 2.0 Flash Thinking ค่อยๆ คิดเป็นขั้นเป็นตอน, LearnLM สำหรับการสอนวิทยาศาสตร์

Gmail เริ่มใช้โมเดล LLM ตัวใหม่ดักจับสแปม บล็อคสแปมได้เยอะกว่าเดิม 20%

ลบไม่ได้ช่วยให้ลืม ทีมวิจัยญี่ปุ่นปรับปรุงการเลือกจำใน LLM ช่วยเพิ่มประสิทธิภาพการประมวลผลข้อมูลขนาดใหญ่

กูเกิลเปิดตัวโมเดล Gemini 2.0 รุ่นทดสอบ 1206 ให้ลูกค้า Gemini Advanced ใช้งาน

ผลสำรวจพบองค์กรมีความท้าทาย ในการออกกฎระเบียบควบคุมการใช้ Generative AI ในองค์กร

ChatGPT Search เปิดให้ใช้งานสำหรับทุกคนรวมทั้งผู้ใช้งานฟรีแล้ว

Microsoft เปิดตัว Phi-4 โมเดล LLM ขนาดเล็ก ที่เก่งคณิตศาสตร์มากขึ้น

Pages

About Blognone

Other Version

Copyright Notice

Main menu

You are here

Pages

sign in

About Blognone

Other Version

Copyright Notice