Llama | Blognone

Enterprise

ไมโครซอฟท์ร่วมมือกับ Meta เปิดให้องค์กรธุรกิจใช้งาน Llama 4 Maverick และ Scout ใน Azure AI Foundry และ Azure Databricks แล้ว

Llama 4 เป็นโมเดล AI โอเพนซอร์สรุ่นใหม่สำหรับการใช้งานแบบ Multimodal ซึ่ง Meta เพิ่งประกาศเปิดตัววันนี้

Meta เปิดตัว Llama 4 โมเดล AI รุ่นล่าสุด ขนาด 109B และ 400B บอกมีประสิทธิภาพดีที่สุดในโลกตอนนี้

By: arjin

on 6 April 2025 - 07:09 Tags:

Topics:

Meta ออกโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) รุ่นใหม่ Llama 4 ซึ่ง Mark Zuckerberg ซีอีโอ Meta บอกว่าเป็นโมเดล AI พื้นฐานที่มีประสิทธิภาพสูงที่สุดในโลกตอนนี้

Llama 4 มีสองรุ่นย่อย ได้แก่ Llama 4 Scout ขนาดพารามิเตอร์ 17B, 16 โมเดลย่อย (Experts) รวม 109B ซึ่ง Meta บอกว่าเป็นโมเดลผสมผสานที่มีประสิทธิภาพดีที่สุดในโลกตอนนี้ สามารถรันได้บนจีพียู NVIDIA H100 ตัวเดียว รองรับอินพุท 10M ทำงานได้ดีกว่าโมเดลที่คล้ายกันอย่าง Gemma 3, Gemini 2.0 Flash-Lite และ Mistral 3.1

Meta ประกาศจำนวนดาวน์โหลดโมเดล Llama ทะลุ 1 พันล้านครั้งแล้ว

By: arjin

on 18 March 2025 - 22:31 Tags:

Topics:

Meta ประกาศว่าโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ Llama มีจำนวนการดาวน์โหลดแล้วมากกว่า 1,000 ล้านครั้ง เพิ่มขึ้นจากตัวเลขเดือนสิงหาคมปีที่แล้วเกือบสามเท่า และใช้เวลาประมาณ 2 ปี นับจากเปิดตัวในเดือนกุมภาพันธ์ 2023

การเติบโตของ Llama มาจากเหตุผลสำคัญคือเป็นโมเดลแบบโอเพนซอร์สเกือบทั้งหมด มีข้อจำกัดเล็กน้อยคือสามารถใช้งานเชิงพาณิชย์ได้หากไม่ใช่บริการขนาดใหญ่ จึงทำให้ถูกดาวน์โหลดติดตั้ง และนำมาใช้งานแพร่หลาย

Meta จัดงานสัมมนา LlamaCon สำหรับนักพัฒนา AI วันที่ 29 เมษายนนี้

By: arjin

on 19 February 2025 - 06:43 Tags:

Topics:

Developer

Meta ประกาศจัดงานสัมมนาสำหรับนักพัฒนา ที่โฟกัสเรื่องปัญญาประดิษฐ์สร้างเนื้อหาหรือ Generative AI ชื่องานว่า LlamaCon กำหนดจัดงานในวันที่ 29 เมษายนนี้

เบื้องต้น Meta บอกว่า LlamaCon จะมีการเผยแพร่ความคืบหน้าล่าสุดของการพัฒนา AI แบบโอเพนซอร์สกับนักพัฒนา เพื่อใช้สำหรับการพัฒนาแอปและผลิตภัณฑ์สำหรับบริษัทและสตาร์ทอัป รายละเอียดเพิ่มเติมจะเผยแพร่ต่อในภายหลัง

หัวข้อสำคัญที่คาดว่า Meta จะเก็บไว้เปิดตัวในงาน LlamaCon นี้ ก็คือโมเดลรุ่นล่าสุด Llama 4 ซึ่งมีข่าวมาระยะหนึ่งแล้วว่าน่าจะเปิดตัวในช่วงต้นปีนี้

สุดท้าย Meta บอกว่าหัวข้อเกี่ยวกับ Metaverse ยังไม่ได้หายไปไหน เพราะงานสัมมนา Meta Connect ยังคงกำหนดจัดงานในวันที่ 17-18 กันยายนนี้

Meta ออก Llama 3.3 70B ความสามารถเท่า Llama 3.1 405B แต่ขนาดเล็กกว่ามาก ต้นทุนถูกกว่า

By: mk

on 7 December 2024 - 08:44 Tags:

Topics:

Meta เปิดตัวโมเดล Llama 3.3 ที่อัพเดตต่อเนื่องจาก Llama 3.2 ในเดือนกันยายน โดยยังมีเฉพาะโมเดลข้อความล้วน (multilingual แถมรองรับภาษาไทย) ในขณะที่ Llama 3.2 มีโมเดลข้อความ+ภาพ (multimodal) ให้ใช้งานด้วย

คุณใช้ผมก็ใช้ - Meta มีเครื่องมือช่วยเขียนโค้ดใช้ในบริษัท ที่เรียกโมเดล GPT-4 ทำงานร่วมกับ Llama

By: arjin

on 4 December 2024 - 23:21 Tags:

Topics:

Developer

Fortune รายงานข้อมูลจากแหล่งข่าวใน Meta บอกว่าถึงแม้ Meta จะมีโมเดล AI แบบโอเพนซอร์ส Llama ที่พยายามผลักดันอยู่ แต่เครื่องมือช่วยเขียนโค้ดที่ใช้ภายในบริษัทชื่อ Metamate ก็เสริมการทำงานด้วยโมเดล AI จากหลายค่ายซึ่งรวมทั้ง GPT-4 ของ OpenAI และ Llama ของ Meta เอง

รายงานบอกว่า Metamate เป็นเครื่องมือช่วยเขียนโค้ดคล้าย GitHub CoPilot ที่สามารถส่งคำถามและใช้ AI ช่วยหาคำตอบ ซึ่ง Metamate จะเลือกจากทั้ง Llama หรือ GPT-4

Meta ปล่อย NotebookLlama จำลอง NotebookLM ของกูเกิลแต่ใช้ AI โอเพนซอร์สทั้งหมด

By: lew

on 28 October 2024 - 12:16 Tags:

Topics:

บริการ NotebookLM ของกูเกิลได้รับความนิยมค่อนข้างดีในช่วงหลัง จากความสามารถในการสรุปรวมเอกสารทั้งชุดให้กลายเป็นพอดแคสต์ ล่าสุดฝั่ง Meta ก็โชว์โครงการ NotebookLlama เป็นชุด Python Notebook ที่แปลงเอกสารให้กลายเป็นพอดแคสต์ได้เหมืิอนกัน

โครงการนี้ใช้ LLM สามชั้น ชั้นแรกใช้ตัวเล็ก Llama 3.2 8B เพื่อแปลง PDF เป็นเอกสารที่อ่านได้ง่ายๆ จากนั้นใช้ Llama 3.1 70B เขียนสริปต์พอดแคสต์ แล้วใช้ Llama 3.1 8B แปลงสคริปต์ให้เร้าใจขึ้น สุดท้ายจึงแปลงข้อความเป็นเสียง

แม้ในทางทฤษฎี โมเดลเหล่านี้จะรันในองค์กรได้ แต่ Llama 3.1 70B ก็ต้องการหน่วยความจำกราฟิกใหญ่มาก เกิน 140GB ขึ้นไป ส่วนมากจึงมักใช้งานผ่านคลาวด์กันอยู่ดี

Cerebras โชว์การรันโมเดล Llama 3.2 70B ได้ 2,100 โทเคนต่อวินาที สูงกว่าจีพียู 16 เท่า

By: mk

on 27 October 2024 - 14:51 Tags:

Topics:

Cerebras

Processor

Cerebras บริษัทผู้พัฒนาชิปเร่งความเร็ว AI ที่คุยว่าทำงานได้เร็วกว่าจีพียู โชว์ประสิทธิภาพการรันโมเดล Llama 3.2 ขนาด 70B ด้วยอัตราตอบสนอง 2,100 โทเคนต่อวินาที สูงกว่าที่โชว์เมื่อรอบก่อนทำได้ 450 โทเคนต่อวินาที โดย Cerebras บอกว่าเป็นการรันบนชิป Wafer Scale Engine 3 (WSE-3) ตัวเดิม แต่ปรับแต่งซอฟต์แวร์ไปอีกมากเพื่อให้ได้ประสิทธิภาพเพิ่มขึ้นจากเดิมมาก

Cerebras โชว์ตัวเลขข่มว่าสถิติ 2,100 โทเคนต่อวินาที สูงกว่าที่จีพียูทำได้ 16 เท่า และถ้าเทียบกับการเช่าคลาวด์รันจะทำได้สูงกว่า 68 เท่า

Meta เปิดตัวโมเดล Llama 3.2 รุ่น 1B & 3B Quantized ลดขนาดให้เล็กพิเศษ รันในมือถือได้

By: mk

on 25 October 2024 - 07:41 Tags:

Topics:

Meta ปล่อยโมเดล Llama 3.2 รุ่นเล็ก ขนาดพารามิเตอร์ 1B และ 3B แบบลดขนาดโมเดลลงจากปกติ (quantized) ตั้งใจทำมาให้เล็กจนรันในอุปกรณ์พกพาได้ และเพิ่มความเร็วในการตอบคำถาม

ก่อนหน้านี้ Meta มี Llama 3.2 ขนาดพารามิเตอร์ 1B/3B อยู่แล้ว รอบนี้เป็นเวอร์ชันลดขนาดโมเดลลงได้อีก 56% (โมเดลรุ่น 1B ลดเหลือประมาณ GB จากขนาดเดิม 2.3GB) โดยยังคงคุณภาพและความปลอดภัยในระดับใกล้เคียงโมเดลต้นฉบับ ขนาดโมเดลที่ลดลงทำให้ลดหน่วยความจำที่ต้องใช้ลงได้ 41% และเพิ่มความเร็วได้ 2-4 เท่า

Meta จับมือกับผู้ผลิตชิปมือถือรายใหญ่ทั้ง MediaTek และ Qualcomm ให้รองรับโมเดลรุ่นนี้บนซีพียู Arm แล้ว และกำลังพัฒนาให้รองรับการใช้งานบน NPU ต่อไป

Lenovo เปิดตัว AI Now ผู้ช่วย AI พลัง Llama 3.1 เหมือนมี Copilot อีกตัวในพีซี

By: nismod

on 17 October 2024 - 15:42 Tags:

Topics:

Lenovo

Lenovo เปิดตัว AI Now เครื่องมือแชทบ็อตที่ทำหน้าที่เหมือนเป็น Copilot อีกตัวบนพีซี โดย AI Now ใช้พลังจากโมเดล Llama 3.1 ของ Meta

AI Now จะเน้นประมวลผลบนเครื่องเป็นหลัก และอาศัยข้อมูลการใช้งานช่วยเพิ่มความเฉพาะบุคคลมากขึ้น (personalised) แต่ก็สามารถส่งไปประมวลผลบนคลาวด์ได้โดย Lenovo บอกว่าผู้ใช้งานต้องยินยอมทุกครั้ง และมี Microsoft Azure AI Content Safety มาช่วยกรองการแสดงผลของ AI อีกชั้น รวมถึงเชื่อมต่อกับระบบบริการหลังการขายของ Lenovo ให้ด้วย

AI Now น่าจะถูกปล่อยอัพเดตให้กับเครื่องที่เป็น AI PC ของ Lenovo แต่ยังไม่มีการระบุไทม์ไลน์ใดๆ

Meta เปิดตัว Llama 3.2 เพิ่มรุ่นอ่านภาพได้, มีโมเดลขนาดเล็กเน้นรันในโทรศัพท์ พร้อมชุดพัฒนาซอฟต์แวร์ของตัวเอง

By: lew

on 26 September 2024 - 01:28 Tags:

Topics:

Meta เปิดตัว Llama 3.2 โมเดล LLM เพิ่มรุ่นรองรับอินพุตเป็นภาพ ที่มีความสามารถระดับเดียวกับ GPT-4o-mini พร้อมกับโมเดลรุ่นเล็กขนาด 1B ที่ความสามารถใกล้เคียงโมเดลกลุ่มขนาดเล็กด้วยกัน

แนวทางการพัฒนา Llama 3.2 รุ่นรับภาพนั้น อาศัยการสร้าง image encoder แปลงข้อมูลเข้าไปให้กับโมเดลภาษาเดิม ระหว่างการฝึกช่วงแรกก็ฝึกเฉพาะ image encoder อย่างเดียว ไม่ปรับแก้ส่วนโมเดลภาษา เพื่อให้แน่ใจว่าความสามารถด้านภาษานั้นยังเท่าเดิมอยู่ จากนั้นฝึกความรู้ที่มีภาพประกอบเพิ่มเข้าไปภายหลัง และจบด้วยการฝึกด้านความปลอดภัยเพิ่มเติม โมเดลรุ่นรองรับภาพนั้นมีสองขนาด คือ 90B และ 11B โดยตัว 90B นั้นความสามารถเทียบเคียงกับ GPT-4o-mini ในหลายชุดทดสอบ

โมเดลโอเพนซอร์ส Reflection ปรับจูนจาก Llama แต่ชนะโมเดลใหญ่ได้ทุกตัวรวม GPT-4o

By: mk

on 7 September 2024 - 13:48 Tags:

Topics:

Open Source

โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดลทุกตัวในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B

สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้

โมเดลมหาชน Meta เผยยอดดาวน์โหลด Llama 350 ล้านครั้ง, ปี 2024 เติบโต 10 เท่า

By: mk

on 30 August 2024 - 13:24 Tags:

Topics:

Meta เผยยอดดาวน์โหลดโมเดลภาษาขนาดใหญ่ตระกูล Llama ทะลุ 350 ล้านครั้ง (นับเฉพาะบน Hugging Face) และมีโมเดลเวอร์ชันพัฒนาต่อยอดมากกว่า 60,000 ตัวบน Hugging Face

Llama ถือเป็นโมเดลภาษาขนาดใหญ่ที่เป็นโอเพนซอร์สเกือบ 100% (มีเงื่อนไขการใช้งานจำกัดเฉพาะบริษัทไอทีและคลาวด์รายใหญ่เท่านั้น) เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2023 และใช้เวลา 18 เดือน พัฒนาตัวเองกลายมาเป็นโมเดลยอดนิยม

Meta จัดแข่งขัน Llama Hackathon ระดับเอเชียแปซิฟิก คนไทยมีสิทธิสมัครแข่งด้วย

By: mk

on 15 August 2024 - 22:32 Tags:

Topics:

Meta จัดแข่งขัน AI Accelerator Program ปี 2024 ระดับเอเชียแปซิฟิก (รวมไทยด้วย) โดยแบ่งเป็นระดับประเทศ ที่นักพัฒนาไทยต้องส่งหัวข้อโครงการที่นำ Llama AI เข้าไปแก้ปัญหาทางเศรษฐกิจและสังคม จากนั้นผู้ผ่านการคัดเลือกจะไปแข่ง Meta Llama Hackathon ที่สิงคโปร์ในเดือนตุลาคม

การแข่งขันรอบประเทศไทย

ส่งหัวข้อภายใน 30 สิงหาคม 2024
นำเสนอผลงานออนไลน์ 13 กันยายน 2024
ประกาศผล 20 กันยายน 2024

ผู้ชนะจะไปแข่งต่อระดับภูมิภาคที่สิงคโปร์วันที่ 1-3 ตุลาคม 2024 โดยผู้ชนะจะได้รับเงินรางวัลมูลค่าสูงสุดถึง 100,000 เหรียญสหรัฐ รายละเอียดสามารถติดตามได้จากเว็บไซต์ของโครงการ

ที่มา - Meta

Meta เปิด AI Studio บริการสร้างแชทบอทพลัง Llama 3.1 แบบคัสตอม เลือกบุคลิก-หัวข้อโต้ตอบได้

By: mk

on 31 July 2024 - 09:31 Tags:

Topics:

Chatbot

Meta เปิดบริการ AI Studio ให้ผู้ใช้สร้างอวตาร AI ของตัวเอง มีทั้งหน้าตา และลักษณะนิสัยเพื่อพูดคุยโต้ตอบกับเราในเรื่องที่สนใจได้

รูปแบบการใช้งานคล้ายกับแชทบอท Meta AI ที่เปิดตัวเมื่อปีที่แล้ว ของเดิมเอาบุคลิกของดาราเซเล็บมาทำเป็นแชทบอท ของใหม่คือเปิดให้ปรับแต่งเองได้อิสระ สามารถแชทคุยได้ผ่าน Instagram, Messenger, WhatsApp รวมถึงแชร์ให้เพื่อนๆ คุยกับบอทของเราได้ด้วย

คลาวด์รายหลักเปิดให้บริการ Llama 3.1 โดยพร้อมเพรียง, Meta อนุญาตให้นำ output ไปฝึกโมเดลของตัวเองได้

By: lew

on 24 July 2024 - 15:35 Tags:

Topics:

หลังจากเมื่อคืนที่ผ่านมา Meta เปิดตัว Llama 3.1 โมเดลปัญญาประดิษฐ์ บรรดาคลาวด์รายเล็กและรายใหญ่ก็ประกาศเปิดบริการ Llama 3.1 โดยพร้อมเพรียงกัน โดยบริการที่ครบถ้วนที่สุดคือ Microsoft Azure เปิดให้บริการพร้อมกับประกาศราคาออกมาพร้อมกันทั้งสามขนาด Google Cloud นั้นเปิดให้ใช้งานโมเดล 405B แล้วแต่ยังไม่ประกาศราคา ขณะที่ AWS นั้นประกาศราคาเฉพาะรุ่น 70B และ 8B โดยรุ่น 405B ต้องเปิดเคสขอใช้งาน

Meta เปิดตัว Llama 3.1 พร้อมรุ่นใหญ่สุด 405B ความสามารถใกล้เคียง GPT-4o เข้าใจภาษาไทยแล้ว

By: lew

on 23 July 2024 - 23:03 Tags:

Topics:

Meta ปล่อยโมเดล Llama 3.1 โมเดล LLM รุ่นล่าสุดที่รีดความสามารถได้สูงขึ้นมาก พร้อมกับปล่อยโมเดลขนาดใหญ่ที่สุด 405B ความสามารถจากการทดสอบหลายอย่างไปอยู่ระดับเดียวกับ GPT-4o แล้ว แม้ว่ายังไม่มีความสามารถ multimodal ที่รองรับภาพและเสียงได้ก็ตาม

ผลทดสอบหลายด้านของ Llama 3.1 แสดงให้เห็นว่าทาง Meta ยังรีดความสามารถในโมเดลขนาดเล็กได้เพิ่มขึ้นเรื่อยๆ โดยผลทดสอบหลายชุด Llama 3.1 8B สามารถทำคะแนนได้ใกล้ Llama 3.0 70B มากขึ้น ขณะที่ Llama 3.1 70B นั้นทำคะแนนเพิ่มเติมได้แทบทุกชุดยกเว้นบ้างเช่นชุดทดสอบเขียนโปรแกรม HumanEval ที่คะแนนลดลง

Meta บอกโมเดล Llama ตัวใหม่ จะไม่เผยแพร่ให้ผู้ใช้งานในกลุ่มประเทศ EU เพื่อเลี่ยงปัญหาจากหน่วยงานกำกับดูแล

By: arjin

on 18 July 2024 - 17:56 Tags:

Topics:

Europe

EU

Meta เปิดเผยว่าบริษัทมีแผนออกโมเดลปัญญาประดิษฐ์ Llama ที่รองรับข้อมูลผสมผสาน (Multimodal) ในอีกไม่กี่เดือนข้างหน้า แต่ประเด็นสำคัญนั้น Meta บอกว่าโมเดล Llama ตัวใหม่นี้จะไม่เผยแพร่ให้กับผู้ใช้งานในกลุ่มประเทศสหภาพยุโรปหรือ EU

โดยเหตุผลที่ Meta ตัดสินใจเช่นนั้นเป็นเพราะ Meta มองว่าทิศทางของหน่วยงานกำกับดูแลของ EU มีลักษณะที่คาดเดาได้ยาก จึงเลือกไม่เผยแพร่โมเดลไปเลยดีกว่า

Mayo Clinic พัฒนาผู้ช่วยแพทย์รักษามะเร็ง finetune จาก Llama 2 ข้อมูลไม่ออกจากโรงพยาบาลเลย

By: lew

on 12 May 2024 - 15:30 Tags:

Topics:

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

แชทบอต Meta AI อัปเดตรองรับ Llama 3, มี AI สร้างรูปเรียลไทม์, เพิ่มประเทศได้ใช้งาน - ไทยรอไปก่อน

By: arjin

on 19 April 2024 - 06:11 Tags:

Topics:

Meta AI

Meta ประกาศอัปเดต Meta AI แชทบอตผู้ช่วยบน Facebook, Instagram, WhatsApp และ Messenger ที่เปิดตัวในงาน Connect เมื่อปีที่แล้ว โดยขยายประเทศที่รองรับเพิ่มเติมนอกจากสหรัฐอเมริกา ตามที่มีข่าวก่อนหน้านี้ รวมทั้งเพิ่มความสามารถด้วยโมเดล Meta Llama 3 ล่าสุดที่เพิ่งเปิดตัว

รายชื่อประเทศที่ได้ใช้งาน Meta AI ในภาษาอังกฤษเพิ่มเติมได้แก่ ออสเตรเลีย แคนาดา กานา จาไมกา มาลาวี นิวซีแลนด์ ไนจีเรีย ปากีสถาน สิงคโปร์ แอฟริกาใต้ ยูกันดา แซมเบีย และซิมบับเว ซึ่งจะขยายเพิ่มเติมต่อไปเร็ว ๆ นี้

Meta ปล่อย Llama 3 เอาชนะ GPT-3.5, Claude 3 Sonnet, Gemini Pro 1.0 กำลังพัฒนารุ่น 400B

By: lew

on 19 April 2024 - 00:19 Tags:

Topics:

Meta ปล่อยโมเดลปัญญาประดิษฐ์ Llama 3 สองรุ่น คือ 8B และ 70B แยกรุ่นย่อยสำหรับการทำตามคำสั่ง โดยยังมีรุ่น 400B อยู่ระหว่างการพัฒนา

รุ่น 8B นั้น Meta เทียบกับ Gemma 7B และ Mistral 7B Instruct เอาชนะได้ทุกชุดการทดสอบ บางหมวดเช่น HumanEval สำหรับการเขียนโปรแกรม และ GSM-8K สำหรับการคำนวณนั้นนำห่าง

รุ่น 70B ทาง Meta นำไปเทียบกับ Gemini Pro 1.5 ทำคะแนนนำได้บางชุดทดสอบ และเมื่อเทียบกับ Claude 3 Sonnet ก็ชนะทุกชุดทดสอบเช่นกัน

Meta โชว์คลัสเตอร์ใหม่สำหรับฝึก LLaMA 3 ชิป H100 24,576 ตัว ซื้อเพิ่มต่อเนื่องสิ้นปี 350,000 ตัว

By: lew

on 13 March 2024 - 00:48 Tags:

Topics: