Large Language Model

Tags:
Node Thumbnail

Piotr Mirowski นักวิจัยของ Google DeepMind ซึ่งใช้เวลาว่างฝึกทักษะการเป็นนักแสดงตลกเดี่ยวไมโครโฟนด้วย เผยแพร่ผลการศึกษา ว่านักแสดงตลกสามารถนำ AI มาช่วยเสริมการทำงานได้ดีแค่ไหน

ในการศึกษานี้ได้ร่วมมือกับนักแสดงตลกมืออาชีพ 20 คน ซึ่งทั้งหมดคุ้นเคยกับการนำ AI มาช่วยงานบางส่วนอยู่แล้ว เช่น เกลาเนื้อหา เขียนร่างแรกของบทพูด โดยครั้งนี้พวกเขาใช้เครื่องมือ LLM เช่น ChatGPT หรือ Gemini มาช่วยเขียนบทพูดที่นักแสดงสะดวกใจที่จะนำไปแสดง แล้วนำไปใช้จริงในงานหนึ่งโดยไม่มีการเปิดเผยกับผู้ชมว่าบททั้งหมดนี้เขียนด้วย AI

Tags:
Node Thumbnail

Lamini บริษัทแพลตฟอร์มปัญญาประดิษฐ์แบบ LLM นำเสนอเทคนิคการปรับแต่งโมเดลปัญญาประดิษฐ์ที่ชื่อว่า Lamini Memory Tuning (LMT) โดยระบุว่าลดอาการหลอน (hallucinate) ของปัญญาประดิษฐ์แบบ LLM ได้ถึง 95%

ก่อนหน้านี้การลดอาการหลอนของ LLM นั้นอาศัยการวางข้อมูลอ้างอิงจากแหล่งที่น่าเชื่อถือต่างๆ เช่น องค์กรอาจจะมีชุดข้อมูลของตัวเองก็สามารถนำข้อมูลที่เกี่ยวข้องกับคำถามมาวางในพรอมพ์ เรียกว่า Retrieval Augmented Generation (RAG) เทคนิคนี้เพิ่มความแม่นยำได้จริง แต่ก็มีข้อจำกัดเพราะกระบวนการดึงข้อมูลไม่สมบูรณ์

Tags:
Node Thumbnail

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

Tags:
Node Thumbnail

John Wiley & Sons หรือ Wiley สำนักพิมพ์ผู้ผลิตตำราเรียนรายใหญ่แห่งหนึ่ง เปิดเผยในรายงานผลประกอบการไตรมาสที่ผ่านมา ว่าบริษัทได้เริ่มโครงการให้บริษัทเทคโนโลยีขนาดใหญ่ ได้สิทธิ์เข้าถึงเนื้อหาหนังสือที่ได้รับอนุญาต สำหรับนำไปเทรนโมเดล Generative AI โดยตอนนี้มีหนึ่งบริษัทที่ไม่เปิดเผย และมูลค่ารายได้ส่วนนี้คือ 23 ล้านดอลลาร์

Wiley บอกว่าบริษัทยังมีการเจรจากับบริษัทเทคโนโลยีขนาดใหญ่อีกหนึ่งแห่ง คาดว่าดีลจะเริ่มต้นได้ในครึ่งหลังของปีนี้ ซึ่งมองว่าเป็นโอกาสอีกมากของบริษัทที่จะเพิ่มมูลค่าสินทรัพย์ที่มี

สำนักพิมพ์ Wiley นอกจากมีตำราเรียนในหลายสาขารวมทั้งคอมพิวเตอร์ ยังเป็นผู้ผลิตหนังสือในชุด for Dummies ที่เป็นที่รู้จักในวงกว้างอีกด้วย

Tags:
Node Thumbnail

จากกระแส LLM ที่กำลังมาแรง เจ้าตลาด AI Assistant เดิมอย่าง Amazon เหมือนจะยังคงตามหลังคู่แข่งอยู่ไกล และน่าจะถูกแซงไปเรื่อย ๆ เมื่อล่าสุดมีรายงานจากทั้งนิตยสาร Fortune และ Yahoo! Finance รายงานอ้างอิงการสัมภาษณ์คนในไปในทางเดียวกันว่า ความพร้อมของ Alexa LLM ยังคงห่างไกลความเป็นจริง หลังเคยเผยพรีวิว เมื่อปลายปีที่แล้ว

อดีตพนักงานของ Amazon ให้สัมภาษณ์กับทางนิตยสารว่า Alexa ตัวใหม่จะไม่มีวันตามใครทัน ถ้า Amazon ยังไม่ยอมทิ้ง Alexa ตัวเก่าเพื่อมาพัฒนาตัวใหม่ และถึงเปิดตัวออกมา ก็จะยังสู้คู่แข่งไม่ได้

Tags:
Topics: 
Node Thumbnail

NLP-Voice Research Lab, KBTG Labs ห้องวิจัยของ KASIKORN Business—Technology Group (KBTG) รายงานถึง THaLLE โมเดล LLM ที่ปรับแต่งเพื่อเพิ่มความสามารถด้านการเงิน โดยวัดจากการสอบ Chartered Financial Analyst (CFA)

การสอบ CFA ระดับต้นนั้นเป็นการสอบแบบตัวเลือก โดยผู้สอบต้องทำคะแนนให้สูงกว่า 70% ที่ผ่านมามีปัญญาประดิษฐ์แบบ LLM ที่ทำคะแนนสูงกว่า 70% นี้อยู่แล้วแต่เป็นโมเดลขนาดใหญ่ เช่น GPT-4o นั้นทำคะแนนในชุดทดสอบ Flare CFA ได้ถึง 88% หรือ Gemini 1.5 Pro ก็ทำคะแนนได้ถึง 78% ขณะที่โมเดล LLM ขนาดเล็กไม่เกิน 8B นั้นนำคะแนนได้ไม่สูงนัก มีเพียง Qwen2-7B ที่ได้คะแนน 68%

Tags:
Node Thumbnail

แอปเปิลเปิดข้อมูลเพิ่มเติมของโมเดล LLM ภายใน Apple Intelligence ที่ใช้สำหรับการช่วยสรุปข้อความ, แก้คำผิด, ปรับคำ, หรือช่วยจัดลำดับความสำคัญของข้อความต่างๆ โดยส่วนประกอบพื้นฐานที่สุดคือ Apple Foundation Models ที่เป็นโมเดลของแอปเปิลเอง

ตัว Apple Foundation Models ฝึกบนเฟรมเวิร์ค AXLearn ที่แอปเปิลปล่อยเป็นโอเพนซอร์สตั้งแต่ปี 2023 โดยโมเดลตัวนี้สร้างจาก JAX และ XLA ตัวโมเดลจริงฝึกชิป TPU ของกูเกิลและ GPU ของแอปเปิลเอง ข้อมูลที่ใช้ฝึกนั้นเป็นข้อมูลที่ซื้อมาหรือการดูดเว็บเข้ามาผ่านทาง AppleBot โดยเว็บต่างๆ สามารถใส่ไฟล์ robots.txt เพื่อไม่ให้แอปเปิลเข้าไปดูดเว็บได้ สุดท้ายคือการปรับจูนแบบอาศัยมนุษย์ reinforcement learning from human feedback (RLHF)

Tags:
Node Thumbnail

ที่งาน World Semiconductor Conference Wang Tao COO ของศูนย์นวัตกรรม Jiangsu Kunpeng ขึ่้นเวทีบรรยายถึงประสิทธิภาพของชิป Huawei Ascend A910B อยู่ที่ประมาณ 80% ของชิป NVIDIA A100 สำหรับการฝึกปัญญาประดิษฐ์แบบ LLM นับว่าไม่ได้ห่างกันมากนัก

ชิป A100 นับเป็นชิปประสิทธิภาพสูงรุ่นท้ายๆ ที่ NVIDIA ส่งมอบให้ลูกค้าในจีนได้ แต่หลังจากนั้นก็ถูกเพิ่มเงื่อนไขเรื่อยมา สำหรับอุตสาหกรรม AI ในจีนที่ถูกบังคับให้พึ่งพาตนเอง การเทียบกับชิป A100 จึงสมเหตุสมผล ขณะที่ฝั่ง NVIDIA ก็ต้องเล่นสงครามราคาในจีนเนื่องจากไม่สามารถส่งชิปรุ่นล่าสุดให้ลูกค้าได้

Tags:
Node Thumbnail

DuckDuckGo บริการเสิร์ชที่มีจุดขายเรื่องความเป็นส่วนตัว เปิดตัวบริการใหม่ DuckDuckGo AI Chat แชทบอตปัญญาประดิษฐ์ที่สามารถเลือกใช้งานได้หลายโมเดล ทั้ง GPT 3.5 Turbo ของ OpenAI, Claude 3 Haiku ของ Anthropic, Llama 3 ของ Meta และ Mixtral 8x7B ของ Mistral

จุดขายของ DuckDuckGo AI Chat ยังคงแนวทางเดิมคือบทสนทนาเป็นส่วนตัว, ถูกกำหนดไว้แบบนิรนาม (anonymous), ปลายทางไม่สามารถระบุตัวตนได้, IP ที่ส่งไปเป็นถูกแก้ไขเป็น IP ของ DuckDuckGo, และแชททั้งหมดไม่ถูกนำไปใช้เทรนโมเดล AI ต่อ

DuckDuckGo อ้างรายงานของ Pew ที่สำรวจคนอเมริกาที่คุ้นเคยกับการใช้แชทบอต AI ซึ่ง 81% มองว่าบริษัทเหล่านี้เก็บข้อมูลส่วนตัวผู้ใช้งาน แม้มองว่า AI ช่วยในหลายอย่าง แต่ก็กังวลเรื่องนี้อยู่ดี

Tags:
Node Thumbnail

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

Tags:
Node Thumbnail

กูเกิลขยายบริการ NotebookLM แอปจดโน้ตพลัง Gemini 1.5 Pro ที่ช่วยผู้ใช้เขียนรายงานได้อย่างรวดเร็วหลังจากเปิดตัวเฉพาะในสหรัฐฯ ช่วงปลายปี 2023 โดยตอนนี้ใช้ Gemini 1.5 Pro ทำให้รองรับการอ่านรูปภาพ สามารถอ้างอิงข้อมูลในภาพของเอกสารที่ใส่เข้าไปได้

แนวทางการใช้งานสร้างเอกสาร เช่น การสร้างคำถามที่พบบ่อย, เอกสารสรุปย่อการประชุม, หรือบทเรียน โดยหลักๆ แล้ว NotebookLM เป็นการพูดคุยกับ Gemini โดยอาศัยเอกสารที่ผู้ใช้มอบให้เป็นหลัก ทำให้แน่ใจได้ว่าการพูดคุยนั้นอยู่ในประเด็นที่ต้องการ

Tags:
Node Thumbnail

ในงาน AWS Summit ที่กรุงเทพสัปดาห์ที่ผ่านมา aCommerce ผู้ให้บริการอีคอมเมิร์ชกับแบรนด์ต่างๆ เปิดตัวบริการในชุดโปรแกรม Market Insight ที่เปิดให้ลูกค้าสามารถสำรวจข้อมูลเชิงลึกทางธุรกิจได้ตามมุมมองที่ตนเองต้องการ

Market Insight เป็นการรวบรวมข้อมูลอีคอมเมิร์ชจากแหล่งต่างๆ รวมกว่าแสนล้านชุดข้อมูล เปิดทางให้ธุรกิจสามารถวิเคราะห์การแข่งขัน เช่น ราคาคู่แข่ง, เทรนด์สินค้าใหม่ๆ, หรือกระทั่งมอนิเตอร์ว่าสินค้าของแบรนด์ตนเองว่ามีการขายในราคาที่ผิดปกติหรือไม่ โดยบริการนี้มีมาก่อนหน้านี้แล้ว แต่ในงานครั้งนี้ทาง aCommerce เปิดฟีเจอร์ AskIQ ที่เปิดให้ผู้ใช้ถามข้อมูลได้โดยตรง โดยระบบสามารถออกรายงานจากข้อมูลที่มีทันที

Tags:
Node Thumbnail

คุณโจเซฟีน เตียว (Josephine Teo) รัฐมนตรีกระทรวงการสื่อสารและสารสนเทศแห่งสิงคโปร์ เปิดตัว AI Verify - Project Moonshot เวอร์ชันเบต้าเป็นชุดเครื่องมือทดสอบปัญญาประดิษฐ์ ออกแบบมาประเมินความปลอดภัยที่เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น Open-source เจ้าแรกๆ ที่สามารถจำลองการโจมตี (red-teaming) การเปรียบเทียบมาตรฐาน และการทดสอบพื้นฐานมารวมกันในแพลตฟอร์มเพื่อรับมือกับความเสี่ยงด้าน AI

Tags:
Node Thumbnail

เทศกาลภาพยนตร์ Tribeca Festival ซึ่งกำหนดจัดขึ้นวันที่ 5-16 มิถุนายนนี้ ที่เมืองนิวยอร์ก ประกาศเซสชันเปิดตัวภาพยนตร์สั้น 5 เรื่อง ที่ผลิตด้วย Sora โมเดล AI สร้างวิดีโอสั้นคุณภาพสูงจาก Text Prompt ของ OpenAI ซึ่งจะเป็นครั้งแรกที่มีการเปิดตัวภาพยนตร์จาก Sora นี้

Jane Rosenthal หนึ่งในผู้จัดงาน Tribeca Festival บอกว่ารากฐานของงาน Tribeca คือการพูดถึงวิธีการเล่าเรื่องที่เปลี่ยนแปลงสิ่งต่าง ๆ ในโลก ซึ่งสามารถผลิตได้บนฟอร์แมตหลากหลายเช่น ภาพยนตร์ขนาดยาว, การสร้างประสบการณ์แนว Immersive, งานศิลปะ ซึ่งหนังสั้นที่สร้างด้วย AI ก็เช่นเดียวกัน

Tags:
Node Thumbnail

Anthropic บริษัทปัญญาประดิษฐ์ผู้พัฒนาโมเดล Claude ประกาศเพิ่มฟีเจอร์ใหม่สำหรับแชทบอตเรียกว่า Tool use ให้ผู้ใช้งานสามารถเชื่อมต่อโปรแกรมต่าง ๆ กับ Claude API ได้ หรือนำไปทำแชทบอตแบบคัสตอมนั่นเอง

จุดเด่นของ Claude API คือรองรับอินพุทที่เป็นรูปภาพได้ด้วย จึงสามารถนำไปพัฒนาเครื่องมือวิเคราะห์ข้อมูลจากภาพ ตัวอย่างที่ Anthropic นำเสนอเช่นเป็นแชทบอตแนะนำไอเดียการตกแต่งภายในห้อง โดยถ่ายรูปส่งไปเป็นต้น

ชุด Tool use นี้ สามารถใช้งานได้แล้วตั้งแต่วันนี้ผ่าน Anthropic Messages API, Amazon Bedrock และ Vertex AI บน Google Cloud

ที่มา: Anthropic

Tags:
Node Thumbnail

Mark Gurman แห่ง Bloomberg คนเดิม รายงานข้อมูลล่าสุดที่เขาทราบมาเกี่ยวกับความสามารถใหม่ของ Siri ในระบบปฏิบัติการ iOS 18 ที่แอปเปิลจะเปิดตัวในงาน WWDC เดือนหน้า ซึ่งมีข่าวออกมาเรื่อย ๆ ก่อนหน้านี้ว่า Siri จะมีความสามารถที่มากขึ้น รวมทั้งความสามารถด้าน Generative AI

Gurman บอกว่า Siri ตัวใหม่ใน iOS 18 จะมีความสามารถควบคุมจัดการฟังก์ชันต่าง ๆ ในแอปได้มากขึ้น ตัวอย่าง เรียกเปิดเอกสารเฉพาะ, ย้ายบันทึกไปไว้อีกโฟลเดอร์, ส่งเมล, ลบเมล, อีเมลแบบแนบลิงก์, ให้สรุปเนื้อหาเว็บ

Tags:
Node Thumbnail

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสที่มีไมโครซอฟท์ถือหุ้นอยู่ด้วย เปิดตัวโมเดล Generative AI ขนาด 22B สำหรับการเขียนโค้ดตัวแรกของบริษัท มีชื่อว่า Codestral

Codestral ถูกเทรนด้วยโค้ดมากกว่า 80 ภาษา ซึ่งรวมทั้งภาษาเขียนโปรแกรมยอดนิยมอย่าง Python, Java, C, C++, JavaScript, และ Bash ไปจนถึงภาษาอย่าง Swift และ Fortran จึงรองรับการทำงานของนักพัฒนาในหลายรูปแบบสถานการณ์ มีความสามารถทั้ง ช่วยเขียนโค้ด เขียนเทสต์ หรือช่วยเติมส่วนที่ขาดหายในโค้ดได้ จึงช่วยลดเวลาและเพิ่มประสิทธิภาพให้กับนักพัฒนาได้

Tags:
Node Thumbnail

Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม

หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน

เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games

Tags:
Node Thumbnail

หน่วยงานวิจัย Cyberspace Research Institute ของจีน เปิดเผยว่ากำลังพัฒนาโมเดล LLM และตัว AI แบบตอบโต้ โดยอิงจากปัญหาและวิธีคิดของผู้นำ Xi Jinping

โมเดลถูกเทรนด้วยเอกสารของรัฐบาลและหนังสือ "Xi Jinping Thought on Socialism with Chinese Characteristics for a New Era (习近平新时代中国特色社会主义思想学习问答) ซึ่งเป็นหนังสือปรัชญาการเมืองและอุดมการณ์ของเลขาธิการพรรคคอมมิวนิสต์ โดยตอนนี้ ตัวปัญญาประดิษฐ์หรือแชทบอตยังไม่มีการให้บริการ แต่เปิดทดสอบภายในอยู่

Tags:
Node Thumbnail

กูเกิลทดสอบฟีเจอร์ใช้ Generative AI ช่วยตอบคำถามของผู้ใช้งานผ่านหน้าผลการค้นหามาตั้งแต่ปีที่แล้ว ซึ่งปัจจุบันเรียกชื่อฟีเจอร์นี้ว่า AI Overviews และมีแผนขยายบริการนี้ไปยังผู้ใช้งานทุกคน โดยเริ่มที่สหรัฐอเมริกาในสัปดาห์ที่ผ่านมา จึงทำให้มีรายงานการตอบคำถามของกูเกิลที่ดูไม่ค่อยดีเท่าใดนักออกมา

ผู้ใช้งานคนหนึ่งแชร์คำตอบของคำถามว่า ทำพิซซ่าอย่างไรให้ชีสไม่ไหลหลุดจากแป้ง ซึ่ง AI Overviews ตอบว่าให้ผสมกาวไป 1/8 ถ้วย จะช่วยได้ คำตอบนี้ย่อมไม่ถูกต้องและทำจริงไม่ได้ ที่น่าสนใจคือใน Reddit มีคนค้นพบว่า เคยมีคนตอบแบบนี้เมื่อ 11 ปีที่แล้ว ซึ่งน่าจะเป็นแหล่งข้อมูลที่กูเกิลนำมาใช้ตอบนั่นเอง

Tags:
Node Thumbnail

Khan Academy เว็บไซต์คอร์สออนไลน์ชื่อดัง ประกาศความร่วมมือกับไมโครซอฟท์ เปิดบริการผู้ช่วย AI สำหรับช่วยสอนวิชาการให้นักเรียน ชื่อว่า Khanmigo และเปิดให้บริการฟรี

รูปแบบการทำงานของ Khanmigo ไม่ต่างอะไรจากแชทบอท AI อื่นๆ มากนัก แต่ปรับความเชี่ยวชาญของบอทให้เป็นเหมือนติวเตอร์สอนวิชา มีความรู้ความเชี่ยวชาญในสาขาวิชานั้นๆ เหมือนกับครูคนหนึ่ง เหมือนเป็นผู้ช่วยสอน (TA) ประจำตัวของนักเรียนแต่ละคน สามารถตอบคำถาม ช่วยแนะนำวิธีการทำโจทย์ได้ (ดูคลิปประกอบ)

Tags:
Node Thumbnail

ไมโครซอฟท์เปิดเผยรายละเอียดเบื้องหลัง Copilot+ PC ที่เป็นการนำพีซีพลัง NPU มารันโมเดลปัญญาประดิษฐ์แบบ on-device ภายในเครื่อง ตกลงแล้วโมเดลตัวที่ว่านี้ชื่อว่า Phi Silica (อ่านว่า "ไฟ ซิลิกา") ถือเป็นหนึ่งในเวอร์ชันย่อยของชุดโมเดล Phi 3 โดยปรับแต่งมาเพื่อการรันบน NPU โดยเฉพาะ

Phi Silica พัฒนาต่อมาจาก Phi-3-mini โมเดลรุ่นเล็กสุดของซีรีส์ Phi-3 แล้วปรับขนาดให้เล็กลงอีกหน่อย (ขนาดพารามิเตอร์ลดลงจาก 3.8B เหลือ 3.3B) เพื่อให้รันใน NPU ได้พอดี ศักยภาพของ Phi Silica รองรับอินพุต 650 token ต่อวินาที ใช้พลังงานเพียง 1.5 วัตต์เท่านั้น

Tags:
Node Thumbnail

ในงาน Build 2024 เมื่อคืนนี้ ไมโครซอฟท์เปิดตัวโมเดลขนาดเล็ก Phi 3 ครบชุด หลังจากเปิดตัว Phi-3-mini มาตั้งแต่เดือนเมษายน

โมเดลในชุด Phi 3 มีด้วยกันทั้งหมด 4 ตัว เป็นโมเดลภาษา (small language model หรือ SML) จำนวน 3 ขนาด พ่วงด้วยของใหม่คือโมเดลภาพ (multimodal) ตัวแรกของไมโครซอฟท์ที่เปิดซอร์สออกมาคือ Phi-3-vision

Tags:
Node Thumbnail

IBM ประกาศโอเพนซอร์สโมเดลช่วยเขียนโค้ดของตัวเองชื่อ Granite โดยบอกว่ามีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สคู่แข่งในขนาดใกล้เคียงกัน (7B-8B) เช่น Google Gemma หรือ Meta CodeLlama

Granite เป็นโมเดลที่อยู่เบื้องหลังบริการ Watsonx Code Assistant (WCA) ที่เปิดตัวเมื่อปีที่แล้ว และนำไปใช้งานกับโค้ด COBOL ในเมนเฟรม Z หรือ Ansible Lightspeed ของฝั่ง Red Hat

Pages