Large Language Model

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Pro ใน Bard ทุกภาษาแล้ว หลังจากเมื่อปีที่แล้วจำกัดเฉพาะภาษาอังกฤษ ส่วนภาษาอื่นๆ ยังใช้ PaLM-2 มาตลอด การเปลี่ยนแปลงครั้งนี้ทำให้ Bard สามารถสรุป, ทำความเข้าใจ, และให้เหตุผลได้ดีขึ้น

นอกจากการเปลี่ยนโมเดลด้านหลังแล้ว Bard ยังเพิ่มอีกสองฟีเจอร์ ได้แก่

  • สร้างภาพด้วย Imagen2 ในตัว ด้วยการพิมพ์ลงพรอมพ์แชตตามปกติ ภาพที่สร้างขึ้นจะถูกฝังลายน้ำ SynthID เอาไว้ ตอนนี้ยังสั่งได้เฉพาะภาษาอังกฤษเท่านั้น
  • ตรวจคำตอบด้วย Google Search รองรับภาษาเพิ่มเติม

กูเกิลชูประเด็นที่ Bard ได้คะแนนสูงใน LMSYS ว่ายืนยันผลทดสอบที่กูเกิลจ้างบริษัทภายนอกมาสำรวจก่อนหน้านี้

Tags:
Node Thumbnail

Meta ปล่อยโมเดล Code Llama ขนาด 70B หลังจากปีที่แล้วปล่อยรุ่นใหญ่สุดอยู่ที่ 34B เท่านั้น โดยตอนนี้ยังไม่บอกรายละเอียดนัก นอกจากระบุว่าคะแนนทดสอบ HumanEval อยู่ที่ 67.8 แซงหน้า GPT-4 (67.0) และ Gemini Pro (67.7) โดยระบบอื่นๆ ที่ได้คะแนนสูงกว่านี้มักใช้ GPT-4/GPT-3.5 ร่วมกับเทคนิคอื่นๆ เพื่อให้ทำคะแนนได้สูงขึ้น

โมเดลที่ปล่อยออกมามี 3 รุ่นย่อย ได้แก่ รุ่นพื้นฐานสำหรับใช้งานทั่วไป, รุ่นภาษาไพธอนโดยเฉพาะ, และรุ่น Instruct สำหรับรับคำสั่งเพื่อเขียนโปรแกรมตาม รุ่นที่รายงานคะแนน HumanEval นั้นคือรุ่น Instruct

โมเดลเหล่านี้ใช้งานได้ฟรีแบบมีข้อจำกัด โดยห้ามใช้งานกับองค์กรที่มีผู้ใช้เกิน 700 ล้านคนต่อเดือน

Tags:
Node Thumbnail

LMSYS ผู้จัดอันดับแชตบอทโดยอาศัย Chatbot Arena เป็นการ "ต่อสู้" ระหว่างแชตบอทสองตัวให้ตอบคำถามเดียวกันแล้วให้ผู้ใช้เลือกว่าชอบคำตอบฝั่งใด รายงานผลรอบล่าสุดวันที่ 26 มกราคม 2024 และพบว่า Bard รุ่นที่ใช้ Gemini Pro นั้นแซงหน้า GPT-4 ขึ้นมาเป็นรองเพียง GPT-4 Turbo เท่านั้น

กูเกิลเปิดตัว Gemini โดยระบุว่าทดสอบวงปิดกับผู้ทดอบแล้วว่า Bard รุ่นใหม่นี้เป็นแชตบอทฟรีที่คุณภาพสูงสุดในตลาด ผลการทดลองนี้ก็ดูจะสนับสนุนว่า Gemini ให้ผลโดยรวมที่ดีในภาพรวมจริงๆ

Tags:
Node Thumbnail

Baidu ประกาศความร่วมมือ นำความสามารถด้าน AI ใส่ใน Samsung Galaxy S24 รุ่นที่ขายในจีน ซึ่งจะใช้แชทบอต Ernie ของ Baidu ที่มีฟีเจอร์ทั้งการแปลภาษาระหว่างสนทนาแบบเรียลไทม์ และฟีเจอร์อื่นเช่น การแปลภาษาและสรุปเนื้อหา Note Assistant

การเข้ามาร่วมมือของ Baidu นี้มีความน่าสนใจ เพราะปัจจุบันในตลาดจีนซัมซุงเป็นสมาร์ทโฟนที่ไม่ติดใน 5 อันดับแรก ขณะที่แอปเปิลเป็นอันดับ 1 ในปีล่าสุด

แชทบอต Ernie ของ Baidu มีรายงานจำนวนผู้ใช้งานเมื่อปลายปีที่แล้วมากกว่า 100 ล้านคน โดยมีคู่แข่ง AI สร้างเนื้อหา จากบริษัทเทคโนโลยีรายใหญ่ในจีนคือ Hunyuan ของ Tencent และ Tongyi Qianwen ของ Alibaba

Tags:
Topics: 
Node Thumbnail

OpenAI ประกาศอัพเดตโมเดลทั้ง LLM และ embedding โดย LLM นั้นเป็นการปรับตามรอบเป็นเวอร์ชั่น 0125 พร้อมกับลดราคาบางส่วน

โมเดล embedding ของ OpenAI ที่ผ่านมาเป็นโมเดล Ada ที่ใช้งานมานาน และมีขนาดเวคเตอร์ขาออกถึง 1536 มิติ ในโมเดล text-embedding-3 จะมีขนาดเวคเตอร์ให้เลือกตั้งแต่ 256, 512, 1024, 1536, 3072 มิติ โดยเวคเตอร์ขนาดเล็กที่สุดก็ยังมีคะแนน ดีกว่า Ada ตัวเดิม

โมเดล GPT-3.5 Turbo ปรับเวอร์ชั่นเป็น 0125 แก้บั๊กการเรียกฟังก์ชั่นด้วยภาษาอื่นนอกจากภาษาอังกฤษ ขณะที่โมเดล GPT-4 แก้ปัญหาโมเดล "ขี้เกียจ" ไม่ยอมทำงานตามที่สั่ง และแก้ปัญหาการตอบภาษาอื่นนอกจากภาษาอังกฤษเช่นกัน

Tags:
Node Thumbnail

Google Research เปิดตัว Lumiere โมเดล AI สำหรับสร้างวิดีโอขึ้นจาก Prompt ตัวหนังสือ หรือรูปภาพต้นแบบ มีจุดเด่นคือโมเดลทำงาน โดยดูองค์ประกอบในภาพข้อมูลตั้งต้น และสร้างวิดีโอต่อเนื่องขึ้นจากสิ่งเหล่านั้น ทำให้รักษาภาพรวมและสไตล์ไว้ได้มากกว่าโมเดลอื่น

ตัวอย่างวิดีโอที่สร้างขึ้นมาจาก Lumiere มีหลายรูปแบบทั้ง Text-to-Video สร้างคลิปสั้นตามข้อความอินพุท, Image-to-Video ให้รูปภาพตั้งต้นแล้วใส่อินพุทสิ่งที่ต้องการให้ภาพเคลื่อนไหว, Stylized Generation กำหนดภาพรูปแบบตั้งต้น แล้วสร้างผลลัพธ์ตามอินพุทที่ต้องการให้ได้โทนเดียวกัน

Tags:
Node Thumbnail

Ollama ซอฟต์แวร์สำหรับรันโมเดลปัญญาประดิษฐ์ในกลุ่ม LLM ปล่อยไลบรารีสำหรับพัฒนาแอปพลิเคชั่นบนภาษา Python และ JavaScript จากเดิมที่ต้องเขียน REST API โดยตรง

ไลบรารีทั้งสองตัวรองรับฟีเจอร์ของ Ollama ครบชุด ได้แก่ streaming สำหรับการคืนคำตอบทีละส่วน, multi-modal ใส่ภาพเป็นอินพุต, text completion สำหรับถามตอบปกติ, และ custom models สำหรับการกำหนด system prompt ด้วยตัวเอง

แนวทางการรัน LLM บนเครื่องไคลเอนต์เริ่มได้รับความสนใจมากขึ้นเรื่อยๆ เพราะไม่ต้องเสียค่าใช้จ่าย, คาดเดาระยะเวลารันได้แน่นอน, และโมเดลขนาดเล็กก็เริ่มมีประสิทธิภาพดีขึ้นในช่วงหลังๆ เช่น ไมโครซอฟท์เองก็เพิ่งปล่อยโมเดล Phi-2 ออกมา

Tags:
Node Thumbnail

Google Arts & Culture ประกาศอัพเดตฟีเจอร์ Art Selfie ที่แปลงรูปถ่ายเซลฟี่ให้เป็นภาพงานศิลปะหรือฉากอื่น ๆ โดยเวอร์ชันใหม่ Art Selfie 2 นี้ เป็นการแปลงภาพถ่ายด้วยพลัง Generative AI มีทั้งทำให้เป็นภาพฉากหลังเขาเอเวอเรสต์, บรรยากาศใน Monet's Garden และอื่น ๆ ซึ่งตอนนี้มีให้เลือกมากกว่า 25 รูปแบบ และจะเพิ่มเติมอีกในอนาคต

Tags:
Node Thumbnail

กูเกิลประกาศเพิ่มฟีเจอร์ให้กับ Google Chrome โดยอาศัยพลัง generative AI 3 รายการ โดยเฉพาะการเพิ่มฟีเจอร์ช่วยเขียนและสร้างภาพ แบบเดียวกับที่ Microsoft Edge ใส่ Copilot เข้ามา โดย 3 ฟีเจอร์ได้แก่

Tags:
Node Thumbnail

Stability AI บริษัทเจ้าของโมเดลสร้างภาพ Stable Diffusion เปิดตัวโมเดลภาษาเวอร์ชันใหม่ Stable LM 2 ซึ่งเป็นเวอร์ชันปรับปรุงจาก Stable LM เวอร์ชันแรกที่เปิดตัวในเดือนเมษายน 2023

ความน่าสนใจของ Stable LM 2 คือตัวโมเดลมีขนาดเล็กลงเหลือเพียง 1.6 พันล้านพารามิเตอร์ (เวอร์ชันแรกเริ่มต้น 3 ล้านพารามิเตอร์) ถือเป็นโมเดลภาษาขนาดเล็ก small language model (SLM) ที่นำไปรันบนฮาร์ดแวร์สเปกต่ำได้กว้างขวางกว่าโมเดลภาษาขนาดใหญ่ (LLM)

Tags:
Node Thumbnail

Mark Zuckerberg เปิดเผยว่าตอนนี้ทีม AI ของบริษัท Meta กำลังเทรนโมเดล Llama 3 บนโครงสร้างพื้นฐานคอมพิวเตอร์ขนาดใหญ่ ที่จะมีจีพียู NVIDIA H100 เพิ่มเป็น 350,000 ตัวภายในสิ้นปี 2024 และถ้านับจีพียูตัวอื่นๆ มารวมด้วย จะเทียบได้กับการมี H100 จำนวนรวม 600,000 ตัว

ตอนนี้ Meta มีทีมพัฒนา AI สองทีมคือ Fundamental AI Research (FAIR) ที่เน้นงานวิจัย และ GenAI ที่เพิ่งตั้งเมื่อต้นปี 2023 เน้นพัฒนาฟีเจอร์ AI ให้กับบริการในเครือ อย่าง WhatsApp, Messenger, Instagram

Tags:
Node Thumbnail

LangChain เปิดตัวเฟรมเวิร์กเวอร์ชัน 0.1.0 แล้ว หลังจากพัฒนามา 1 ปี

LangChain เป็นเฟรมเวิร์กโอเพนซอร์สยอดนิยมที่ออกแบบมาเพื่อช่วยสร้างแอปที่ใช้ LLM โดยเวอร์ชันนี้จะมีทั้ง Python และ JavaScript ซึ่งเป็นการปรับปรุงและเพิ่มความสามารถต่าง ๆ ดังนี้

Tags:
Node Thumbnail

DeepLearning.AI แพลตฟอร์มการเรียนรู้ AI และ Deep Learning ที่ก่อตั้งโดย Andrew Ng เปิดตัวหลักสูตรระยะสั้น Generative AI ในภาษา JavaScript ฟรีในช่วงเวลาจำกัด สอนการสร้างแอป LLM ด้วย LangChain โดย Jacob Lee วิศวกรซอฟต์แวร์ผู้ก่อตั้งและหัวหน้าผู้ดูแลโครงการ LangChain.js ใช้เวลาเรียน 1 ชม. เหมาะสำหรับนักพัฒนาเว็บที่มีพื้นฐานเกี่ยวกับ JavaScript ระดับกลาง

Tags:
Node Thumbnail

Parag Agrawal อดีตซีอีโอเชื้อสายอินเดียของ Twitter ที่ลงจากตำแหน่ง หลัง Elon Musk ซื้อกิจการแล้วปลดออกเป็นคนแรก หลังจากนั้นเขาก็เงียบหายไปเลย (โพสต์สุดท้ายในบัญชีทวิตเตอร์ @paraga เมื่อเดือนตุลาคม 2022)

ล่าสุดเว็บไซต์ Information รายงานว่า Parag กำลังตั้งบริษัทสตาร์ตอัพด้าน AI โดยหาเงินทุนก้อนแรกมูลค่า 30 ล้านดอลลาร์ได้แล้ว จากกลุ่มนักลงทุนที่มี Khosla Ventures เป็นนักลงทุนหลัก

ตอนนี้ยังไม่มีข้อมูลชื่อบริษัทใหม่ของ Parag ว่าชื่ออะไร รู้แค่ว่าเป็นบริษัททำเกี่ยวกับ large language model (LLM)

Tags:
Node Thumbnail

OpenAI ออกมาเขียนบล็อกชี้แจงกรณี The New York Times (NYT) ยื่นฟ้องละเมิดลิขสิทธิ์ โดยระบุว่าเป็นบั๊กที่เกิดได้ยากแล้ว และกำลังแก้ไขให้ไม่มีเหตุการณ์แบบนี้อีก พร้อมกับยืนยันว่าต้องการเป็นพันธมิตรกับสำนักข่าวต่างๆ

Tags:
Node Thumbnail

หลัง Google เปิดตัว Gemini 1.0 โดยมี 3 เวอร์ชันคือ Nano ที่ใช้ใน Pixel แล้ว, Pro ที่ใช้ใน Bard และ Ultra ที่กำลังจะใช้บน Bard Advanced และจะเปิดตัวในปีนี้

ล่าสุดมีนักพัฒนาค้นพบว่า Bard Advanced จะเป็นแบบเสียเงิน (แบบเดียวกับ GPT Plus) โดยจะผูกอยู่กับบริการ Google One ซึ่งช่วงแรกจะเป็นการให้ทดลองใช้ฟรี 3 เดือน

ที่มา - @bedros_p, @evowizz

Tags:
Node Thumbnail

Wang Haifeng ซีทีโอ Baidu เปิดเผยว่าแชทบอต ERNIE ตอนนี้มีผู้ใช้งานรวมมากกว่า 100 ล้านบัญชีแล้ว หลังจาก ERNIE เปิดให้ใช้งานแบบสาธารณะตั้งแต่ต้นเดือนกันยายนที่ผ่านมา

Baidu เปิดตัว ERNIE มาตั้งแต่เดือนมีนาคม ซึ่งเป็นเวลาไม่นานหลังจากกระแส ChatGPT ของ OpenAI มีมากขึ้น ในช่วงแรก Baidu ยังเปิดให้ใช้งาน ERNIE แบบทดสอบจำกัดกลุ่มเฉพาะบริษัทที่ได้รับอนุญาต เนื่องจากกระแสตอบรับมีสูงมาก

Tags:
Node Thumbnail

หนังสือพิมพ์ The New York Times (NYT) ยื่นฟ้องไมโครซอฟท์และ OpenAI ฐานใช้งานบทความของหนังสือพิมพ์โดยไม่ได้รับอนุญาต ทั้งการใช้งานไปในชุดข้อมูลสำหรับฝึก LLM และตัว ChatGPT/Copilot เองก็ตอบบทความแทบทั้งบทความของ NYT ออกมาให้ผู้ใช้ได้

Tags:
Node Thumbnail

แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

Tags:
Node Thumbnail

แอปเปิลเผยแพร่งานวิจัยสองฉบับผ่าน arXiv ซึ่งเป็นงานวิจัยเกี่ยวกับเทคนิคการประมวลผล AI ที่อาจถูกนำมาใช้งานกับผลิตภัณฑ์ของแอปเปิลได้ในอนาคต

งานวิจัยแรกชื่อว่า "LLM in a flash" เป็นวิธีการทำให้อุปกรณ์ซึ่งมีหน่วยความจำจำกัด เช่น สมาร์ทโฟน สามารถรันโมเดล AI LLM ที่มีพารามิเตอร์จำนวนมากได้ โดยใช้สองเทคนิคคือ windowing ใช้งานซ้ำ AI ที่ประมวลผลไปแล้วแทนที่จะต้องใช้ข้อมูลใหม่อีกรอบ และวิธี row-column bundling ใช้การอ่านข้อมูลเป็นส่วน ๆ แทนที่จะอ่านทีละคำ ซึ่งเหมาะสำหรับงาน LLM อยู่แล้ว ผลลัพธ์ที่ได้ทำให้สามารถรัน AI LLM ที่ต้องการหน่วยความจำได้สูงถึง 2 เท่า ของหน่วยความจำที่มีอยู่

Tags:
Node Thumbnail

SCB 10X เปิดตัว Typhoon-7b เป็นโมเดลสร้างข้อความ หรือ LLM ภาษาไทยที่เอาชนะโมเดลทุกตัวในภาษาไทยตอนนี้ และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย

การวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

Tags:
Node Thumbnail

OpenAI แบนบัญชีของบริษัท ByteDance หลังมีรายงานว่าทาง ByteDance เอาเอาท์พุตของ OpenAI ไปฝึกปัญญาประดิษฐ์ของตัวเอง

เหตุการณ์ครั้งนี้รายงานโดย Alex Heath จาก The Verge ชี้ว่า ByteDance ฝึก LLM ของตัวเองที่ชื่อ Project Seed ด้วยเอาท์พุตของ OpenAI แม้ภายหลังจะเลิกใช้เอาท์พุตไปฝึกโมเดลโดยตรง แต่ก็ยังใช้สำหรับการวัดคุณภาพของโมเดลตัวเองอยู่

ทาง OpenAI ออกมายืนยันว่าได้แบนบัญชีของ ByteDance ไว้ชั่วคราวระหว่างสอบสวน แต่ที่จริงแล้ว ByteDance เรียก API ของ OpenAI ผ่านทาง Microsoft Azure และยังไม่แน่ชัดว่าไมโครซอฟท์แบนบัญชีของ ByteDance ไปหรือยัง

Tags:
Node Thumbnail

Mozilla Innovation Project เปิดโครงการ llamafile โครงการแพ็กโมเดลปัญญาประดิษฐ์สำเร็จรูป ทำให้รันโมเดลต่างๆ ได้โดยง่าย เป็นไฟล์ไบนารีไฟล์เดียวก็รันได้เลย

ก่อนหน้านี้มีโครงการจำนวนมากที่พยายามนำโมเดล LLM มารันบนเดสก์ทอปอยู่แล้ว เช่น โครงการ llama.cpp แต่ก็ยังต้องอาศัยการคอนฟิกพอสมควร llamafile ทำให้การใช้งานสะดวกขึ้นอีกขั้น โดยอาศัยโครงการ Cosmopolitan Libc มาแพ็กไฟล์ต่างๆ เข้าด้วยกันให้รันได้ทุกที่

ตอนนี้มีโมเดลที่รองรับแล้ว ได้แก่ LLaVA 1.5, Mistral 7B, Mixtral 8x7B, และ WizardCoder-Python 13B

Tags:
Node Thumbnail

Google DeepMind เผยแพร่งานวิจัยในวารสาร Nature ถึงขั้นตอนการค้นหาวิธีแก้ปัญหาด้านคณิตศาสตร์และวิทยาการคอมพิวเตอร์แบบใหม่ เรียกชื่อว่า FunSearch ซึ่งมาจากคำว่า Function+Search มีจุดเด่นคือพื้นฐานทำงานเป็น AI แบบ LLM ที่ถูกเทรนมาก่อน แล้วหาวิธีแก้ปัญหาร่วมกับโค้ดคอมพิวเตอร์ ที่ทำหน้าที่ตรวจสอบความถูกต้องอีกหนึ่งชั้น เพื่อป้องกันการให้คำตอบที่ผิด

ผลลัพธ์ที่ได้คือฟังก์ชัน ในรูปแบบโค้ดคอมพิวเตอร์ แต่มาพร้อมกับวิธีคิดรูปแบบใหม่ ๆ จากกระบวนการของ LLM

ตัวอย่างที่งานวิจัยนี้นำเสนอคือใช้ FunSearch หาอัลกอริทึมของปัญหาการบรรจุกล่องสินค้าในปริมาตรที่กำหนดหรือ Bin Packing Problem

Tags:
Node Thumbnail

สหภาพยุโรปเตรียมออกกฎหมายควบคุมปัญญาประดิษฐ์หลังรัฐสภายุโรป (European Parliament) บรรลุข้อตกลงกับคณะมนตรียุโรป (European Council) ว่าจะผ่านกฎหมายควบคุมปัญญาประดิษฐ์ โดยกฎหมายนี้ควบคุมการใช้งานตามระดับความเสี่ยง โดยแบ่งเป็น 3 ระดับ ได้แก่

Pages