LLM | Blognone

ผลการศึกษา เมื่อให้นักแสดงเดี่ยวไมโครโฟนใช้บทพูดที่สร้างจาก AI พบว่ามุกเก่า มีจังหวะน่าเบื่อ ยังแทนที่ไม่ได้

By: arjin

on 20 June 2024 - 12:50 Tags:

Topics:

Artificial Intelligence

LLM

Piotr Mirowski นักวิจัยของ Google DeepMind ซึ่งใช้เวลาว่างฝึกทักษะการเป็นนักแสดงตลกเดี่ยวไมโครโฟนด้วย เผยแพร่ผลการศึกษา ว่านักแสดงตลกสามารถนำ AI มาช่วยเสริมการทำงานได้ดีแค่ไหน

ในการศึกษานี้ได้ร่วมมือกับนักแสดงตลกมืออาชีพ 20 คน ซึ่งทั้งหมดคุ้นเคยกับการนำ AI มาช่วยงานบางส่วนอยู่แล้ว เช่น เกลาเนื้อหา เขียนร่างแรกของบทพูด โดยครั้งนี้พวกเขาใช้เครื่องมือ LLM เช่น ChatGPT หรือ Gemini มาช่วยเขียนบทพูดที่นักแสดงสะดวกใจที่จะนำไปแสดง แล้วนำไปใช้จริงในงานหนึ่งโดยไม่มีการเปิดเผยกับผู้ชมว่าบททั้งหมดนี้เขียนด้วย AI

Lamini เสนอเทคนิค Memory Tuning ใส่ความรู้ให้ LLM โดยแทบไม่เหลืออาการหลอน

By: lew

on 17 June 2024 - 23:12 Tags:

Topics:

LLM

Artificial Intelligence

Lamini บริษัทแพลตฟอร์มปัญญาประดิษฐ์แบบ LLM นำเสนอเทคนิคการปรับแต่งโมเดลปัญญาประดิษฐ์ที่ชื่อว่า Lamini Memory Tuning (LMT) โดยระบุว่าลดอาการหลอน (hallucinate) ของปัญญาประดิษฐ์แบบ LLM ได้ถึง 95%

ก่อนหน้านี้การลดอาการหลอนของ LLM นั้นอาศัยการวางข้อมูลอ้างอิงจากแหล่งที่น่าเชื่อถือต่างๆ เช่น องค์กรอาจจะมีชุดข้อมูลของตัวเองก็สามารถนำข้อมูลที่เกี่ยวข้องกับคำถามมาวางในพรอมพ์ เรียกว่า Retrieval Augmented Generation (RAG) เทคนิคนี้เพิ่มความแม่นยำได้จริง แต่ก็มีข้อจำกัดเพราะกระบวนการดึงข้อมูลไม่สมบูรณ์

NVIDIA เปิดตัวโมเดล Nemotron-4 340B สร้างข้อมูลสังเคราะห์สำหรับเทรน LLM อีกที

By: mk

on 17 June 2024 - 10:18 Tags:

Topics:

NVIDIA

LLM

Artificial Intelligence

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

สำนักพิมพ์ Wiley เผย เริ่มขายไลเซนส์ให้บริษัท Tech เข้าถึงเนื้อหาตำราเรียน สำหรับเทรน AI แล้ว

By: arjin

on 17 June 2024 - 06:59 Tags:

Topics:

Textbooks

Artificial Intelligence

LLM

John Wiley & Sons หรือ Wiley สำนักพิมพ์ผู้ผลิตตำราเรียนรายใหญ่แห่งหนึ่ง เปิดเผยในรายงานผลประกอบการไตรมาสที่ผ่านมา ว่าบริษัทได้เริ่มโครงการให้บริษัทเทคโนโลยีขนาดใหญ่ ได้สิทธิ์เข้าถึงเนื้อหาหนังสือที่ได้รับอนุญาต สำหรับนำไปเทรนโมเดล Generative AI โดยตอนนี้มีหนึ่งบริษัทที่ไม่เปิดเผย และมูลค่ารายได้ส่วนนี้คือ 23 ล้านดอลลาร์

Wiley บอกว่าบริษัทยังมีการเจรจากับบริษัทเทคโนโลยีขนาดใหญ่อีกหนึ่งแห่ง คาดว่าดีลจะเริ่มต้นได้ในครึ่งหลังของปีนี้ ซึ่งมองว่าเป็นโอกาสอีกมากของบริษัทที่จะเพิ่มมูลค่าสินทรัพย์ที่มี

สำนักพิมพ์ Wiley นอกจากมีตำราเรียนในหลายสาขารวมทั้งคอมพิวเตอร์ ยังเป็นผู้ผลิตหนังสือในชุด for Dummies ที่เป็นที่รู้จักในวงกว้างอีกด้วย

รายงานเผย Alexa ใหม่ที่มี LLM ยังไม่พร้อมตามกำหนดเดิม ยังห่างไกลความพร้อมให้บริการ

By: sarisalily

on 14 June 2024 - 17:12 Tags:

Topics:

Amazon

Alexa

Artificial Intelligence

LLM

จากกระแส LLM ที่กำลังมาแรง เจ้าตลาด AI Assistant เดิมอย่าง Amazon เหมือนจะยังคงตามหลังคู่แข่งอยู่ไกล และน่าจะถูกแซงไปเรื่อย ๆ เมื่อล่าสุดมีรายงานจากทั้งนิตยสาร Fortune และ Yahoo! Finance รายงานอ้างอิงการสัมภาษณ์คนในไปในทางเดียวกันว่า ความพร้อมของ Alexa LLM ยังคงห่างไกลความเป็นจริง หลังเคยเผยพรีวิว เมื่อปลายปีที่แล้ว

อดีตพนักงานของ Amazon ให้สัมภาษณ์กับทางนิตยสารว่า Alexa ตัวใหม่จะไม่มีวันตามใครทัน ถ้า Amazon ยังไม่ยอมทิ้ง Alexa ตัวเก่าเพื่อมาพัฒนาตัวใหม่ และถึงเปิดตัวออกมา ก็จะยังสู้คู่แข่งไม่ได้

KBTG แสดงผลการปรับโมเดล Qwen2-7B จนทำข้อสอบ CFA ผ่าน เปิดทางโมเดลขนาดเล็กแนะนำการเงิน

By: lew

on 12 June 2024 - 20:44 Tags:

Topics:

KBTG

LLM

NLP-Voice Research Lab, KBTG Labs ห้องวิจัยของ KASIKORN Business—Technology Group (KBTG) รายงานถึง THaLLE โมเดล LLM ที่ปรับแต่งเพื่อเพิ่มความสามารถด้านการเงิน โดยวัดจากการสอบ Chartered Financial Analyst (CFA)

การสอบ CFA ระดับต้นนั้นเป็นการสอบแบบตัวเลือก โดยผู้สอบต้องทำคะแนนให้สูงกว่า 70% ที่ผ่านมามีปัญญาประดิษฐ์แบบ LLM ที่ทำคะแนนสูงกว่า 70% นี้อยู่แล้วแต่เป็นโมเดลขนาดใหญ่ เช่น GPT-4o นั้นทำคะแนนในชุดทดสอบ Flare CFA ได้ถึง 88% หรือ Gemini 1.5 Pro ก็ทำคะแนนได้ถึง 78% ขณะที่โมเดล LLM ขนาดเล็กไม่เกิน 8B นั้นนำคะแนนได้ไม่สูงนัก มีเพียง Qwen2-7B ที่ได้คะแนน 68%

เปิดสเปค LLM ภายใน Apple Intelligence รุ่นในอุปกรณ์ขนาด 3B, บนเซิร์ฟเวอร์เท่า GPT-3.5-Turbo

By: lew

on 11 June 2024 - 10:01 Tags:

Topics:

Apple

LLM

Artificial Intelligence

แอปเปิลเปิดข้อมูลเพิ่มเติมของโมเดล LLM ภายใน Apple Intelligence ที่ใช้สำหรับการช่วยสรุปข้อความ, แก้คำผิด, ปรับคำ, หรือช่วยจัดลำดับความสำคัญของข้อความต่างๆ โดยส่วนประกอบพื้นฐานที่สุดคือ Apple Foundation Models ที่เป็นโมเดลของแอปเปิลเอง

ตัว Apple Foundation Models ฝึกบนเฟรมเวิร์ค AXLearn ที่แอปเปิลปล่อยเป็นโอเพนซอร์สตั้งแต่ปี 2023 โดยโมเดลตัวนี้สร้างจาก JAX และ XLA ตัวโมเดลจริงฝึกชิป TPU ของกูเกิลและ GPU ของแอปเปิลเอง ข้อมูลที่ใช้ฝึกนั้นเป็นข้อมูลที่ซื้อมาหรือการดูดเว็บเข้ามาผ่านทาง AppleBot โดยเว็บต่างๆ สามารถใส่ไฟล์ robots.txt เพื่อไม่ให้แอปเปิลเข้าไปดูดเว็บได้ สุดท้ายคือการปรับจูนแบบอาศัยมนุษย์ reinforcement learning from human feedback (RLHF)

Huawei โชว์ประสิทธิภาพชิป Ascend 910B โดยรวมประมาณ 80% ของ NVIDIA A100 แถมชนะบางการทดสอบ

By: lew

on 9 June 2024 - 13:42 Tags:

Topics:

ที่งาน World Semiconductor Conference Wang Tao COO ของศูนย์นวัตกรรม Jiangsu Kunpeng ขึ่้นเวทีบรรยายถึงประสิทธิภาพของชิป Huawei Ascend A910B อยู่ที่ประมาณ 80% ของชิป NVIDIA A100 สำหรับการฝึกปัญญาประดิษฐ์แบบ LLM นับว่าไม่ได้ห่างกันมากนัก

ชิป A100 นับเป็นชิปประสิทธิภาพสูงรุ่นท้ายๆ ที่ NVIDIA ส่งมอบให้ลูกค้าในจีนได้ แต่หลังจากนั้นก็ถูกเพิ่มเงื่อนไขเรื่อยมา สำหรับอุตสาหกรรม AI ในจีนที่ถูกบังคับให้พึ่งพาตนเอง การเทียบกับชิป A100 จึงสมเหตุสมผล ขณะที่ฝั่ง NVIDIA ก็ต้องเล่นสงครามราคาในจีนเนื่องจากไม่สามารถส่งชิปรุ่นล่าสุดให้ลูกค้าได้

DuckDuckGo เปิดตัว AI Chat แชทบอตไม่ระบุตัวตน ให้ความเป็นส่วนตัวในการใช้งาน

By: arjin

on 8 June 2024 - 15:12 Tags:

Topics:

DuckDuckGo

Artificial Intelligence

Chatbot

LLM

Privacy

DuckDuckGo บริการเสิร์ชที่มีจุดขายเรื่องความเป็นส่วนตัว เปิดตัวบริการใหม่ DuckDuckGo AI Chat แชทบอตปัญญาประดิษฐ์ที่สามารถเลือกใช้งานได้หลายโมเดล ทั้ง GPT 3.5 Turbo ของ OpenAI, Claude 3 Haiku ของ Anthropic, Llama 3 ของ Meta และ Mixtral 8x7B ของ Mistral

จุดขายของ DuckDuckGo AI Chat ยังคงแนวทางเดิมคือบทสนทนาเป็นส่วนตัว, ถูกกำหนดไว้แบบนิรนาม (anonymous), ปลายทางไม่สามารถระบุตัวตนได้, IP ที่ส่งไปเป็นถูกแก้ไขเป็น IP ของ DuckDuckGo, และแชททั้งหมดไม่ถูกนำไปใช้เทรนโมเดล AI ต่อ

DuckDuckGo อ้างรายงานของ Pew ที่สำรวจคนอเมริกาที่คุ้นเคยกับการใช้แชทบอต AI ซึ่ง 81% มองว่าบริษัทเหล่านี้เก็บข้อมูลส่วนตัวผู้ใช้งาน แม้มองว่า AI ช่วยในหลายอย่าง แต่ก็กังวลเรื่องนี้อยู่ดี

Alibaba Cloud เปิดตัวปัญญาประดิษฐ์ Qwen2 ใช้งานได้เสรี พร้อมรองรับภาษาไทย

By: lew

on 7 June 2024 - 01:24 Tags:

Topics:

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

กูเกิลเปิดบริการ NotebookLM แอปทำสรุปโน้ตพลัง Gemini นอกสหรัฐฯ คนไทยได้ใช้ด้วย

By: lew

on 6 June 2024 - 18:48 Tags:

Topics:

กูเกิลขยายบริการ NotebookLM แอปจดโน้ตพลัง Gemini 1.5 Pro ที่ช่วยผู้ใช้เขียนรายงานได้อย่างรวดเร็วหลังจากเปิดตัวเฉพาะในสหรัฐฯ ช่วงปลายปี 2023 โดยตอนนี้ใช้ Gemini 1.5 Pro ทำให้รองรับการอ่านรูปภาพ สามารถอ้างอิงข้อมูลในภาพของเอกสารที่ใส่เข้าไปได้

แนวทางการใช้งานสร้างเอกสาร เช่น การสร้างคำถามที่พบบ่อย, เอกสารสรุปย่อการประชุม, หรือบทเรียน โดยหลักๆ แล้ว NotebookLM เป็นการพูดคุยกับ Gemini โดยอาศัยเอกสารที่ผู้ใช้มอบให้เป็นหลัก ทำให้แน่ใจได้ว่าการพูดคุยนั้นอยู่ในประเด็นที่ต้องการ

aCommerce อาศัย Generative AI บน AWS เปิดให้ลูกค้าถามข้อมูลธุรกิจด้วยตัวเอง

By: lew

on 5 June 2024 - 00:05 Tags:

Topics:

aCommerce

AWS

LLM

ในงาน AWS Summit ที่กรุงเทพสัปดาห์ที่ผ่านมา aCommerce ผู้ให้บริการอีคอมเมิร์ชกับแบรนด์ต่างๆ เปิดตัวบริการในชุดโปรแกรม Market Insight ที่เปิดให้ลูกค้าสามารถสำรวจข้อมูลเชิงลึกทางธุรกิจได้ตามมุมมองที่ตนเองต้องการ

Market Insight เป็นการรวบรวมข้อมูลอีคอมเมิร์ชจากแหล่งต่างๆ รวมกว่าแสนล้านชุดข้อมูล เปิดทางให้ธุรกิจสามารถวิเคราะห์การแข่งขัน เช่น ราคาคู่แข่ง, เทรนด์สินค้าใหม่ๆ, หรือกระทั่งมอนิเตอร์ว่าสินค้าของแบรนด์ตนเองว่ามีการขายในราคาที่ผิดปกติหรือไม่ โดยบริการนี้มีมาก่อนหน้านี้แล้ว แต่ในงานครั้งนี้ทาง aCommerce เปิดฟีเจอร์ AskIQ ที่เปิดให้ผู้ใช้ถามข้อมูลได้โดยตรง โดยระบบสามารถออกรายงานจากข้อมูลที่มีทันที

สิงคโปร์เปิดตัว Project Moonshot ชุดเครื่องมือทดสอบความปลอดภัยและรับมือความเสี่ยงด้าน AI

By: Chomsu

on 4 June 2024 - 16:11 Tags:

Topics:

Singapore

Artificial Intelligence

LLM

คุณโจเซฟีน เตียว (Josephine Teo) รัฐมนตรีกระทรวงการสื่อสารและสารสนเทศแห่งสิงคโปร์ เปิดตัว AI Verify - Project Moonshot เวอร์ชันเบต้าเป็นชุดเครื่องมือทดสอบปัญญาประดิษฐ์ ออกแบบมาประเมินความปลอดภัยที่เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น Open-source เจ้าแรกๆ ที่สามารถจำลองการโจมตี (red-teaming) การเปรียบเทียบมาตรฐาน และการทดสอบพื้นฐานมารวมกันในแพลตฟอร์มเพื่อรับมือกับความเสี่ยงด้าน AI

OpenAI เตรียมเปิดตัวหนังสั้น 5 เรื่อง ที่สร้างด้วย Sora ในงานเทศกาลภาพยนตร์ Tribeca Festival

By: arjin

on 1 June 2024 - 16:16 Tags:

Topics:

OpenAI

Movies

Video

Artificial Intelligence

LLM

เทศกาลภาพยนตร์ Tribeca Festival ซึ่งกำหนดจัดขึ้นวันที่ 5-16 มิถุนายนนี้ ที่เมืองนิวยอร์ก ประกาศเซสชันเปิดตัวภาพยนตร์สั้น 5 เรื่อง ที่ผลิตด้วย Sora โมเดล AI สร้างวิดีโอสั้นคุณภาพสูงจาก Text Prompt ของ OpenAI ซึ่งจะเป็นครั้งแรกที่มีการเปิดตัวภาพยนตร์จาก Sora นี้

Jane Rosenthal หนึ่งในผู้จัดงาน Tribeca Festival บอกว่ารากฐานของงาน Tribeca คือการพูดถึงวิธีการเล่าเรื่องที่เปลี่ยนแปลงสิ่งต่าง ๆ ในโลก ซึ่งสามารถผลิตได้บนฟอร์แมตหลากหลายเช่น ภาพยนตร์ขนาดยาว, การสร้างประสบการณ์แนว Immersive, งานศิลปะ ซึ่งหนังสั้นที่สร้างด้วย AI ก็เช่นเดียวกัน

Anthropic เปิดตัวเครื่องมือสร้างแชทบอตคัสตอมบน Claude AI

By: arjin

on 1 June 2024 - 08:32 Tags:

Topics:

Anthropic บริษัทปัญญาประดิษฐ์ผู้พัฒนาโมเดล Claude ประกาศเพิ่มฟีเจอร์ใหม่สำหรับแชทบอตเรียกว่า Tool use ให้ผู้ใช้งานสามารถเชื่อมต่อโปรแกรมต่าง ๆ กับ Claude API ได้ หรือนำไปทำแชทบอตแบบคัสตอมนั่นเอง

จุดเด่นของ Claude API คือรองรับอินพุทที่เป็นรูปภาพได้ด้วย จึงสามารถนำไปพัฒนาเครื่องมือวิเคราะห์ข้อมูลจากภาพ ตัวอย่างที่ Anthropic นำเสนอเช่นเป็นแชทบอตแนะนำไอเดียการตกแต่งภายในห้อง โดยถ่ายรูปส่งไปเป็นต้น

ชุด Tool use นี้ สามารถใช้งานได้แล้วตั้งแต่วันนี้ผ่าน Anthropic Messages API, Amazon Bedrock และ Vertex AI บน Google Cloud

ที่มา: Anthropic

[ลือ] Siri ใน iOS 18 จะรองรับคำสั่งของ App ที่มากขึ้น, สั่งให้ทำงานหลายอย่างต่อเนื่องได้

By: arjin

on 31 May 2024 - 17:20 Tags:

Topics:

Artificial Intelligence

LLM

Mark Gurman แห่ง Bloomberg คนเดิม รายงานข้อมูลล่าสุดที่เขาทราบมาเกี่ยวกับความสามารถใหม่ของ Siri ในระบบปฏิบัติการ iOS 18 ที่แอปเปิลจะเปิดตัวในงาน WWDC เดือนหน้า ซึ่งมีข่าวออกมาเรื่อย ๆ ก่อนหน้านี้ว่า Siri จะมีความสามารถที่มากขึ้น รวมทั้งความสามารถด้าน Generative AI

Gurman บอกว่า Siri ตัวใหม่ใน iOS 18 จะมีความสามารถควบคุมจัดการฟังก์ชันต่าง ๆ ในแอปได้มากขึ้น ตัวอย่าง เรียกเปิดเอกสารเฉพาะ, ย้ายบันทึกไปไว้อีกโฟลเดอร์, ส่งเมล, ลบเมล, อีเมลแบบแนบลิงก์, ให้สรุปเนื้อหาเว็บ

Mistral เปิดตัว Codestral โมเดล Generative AI ขนาด 22B สำหรับงานเขียนโค้ด รองรับกว่า 80 ภาษา

By: arjin

on 30 May 2024 - 18:32 Tags:

Topics:

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสที่มีไมโครซอฟท์ถือหุ้นอยู่ด้วย เปิดตัวโมเดล Generative AI ขนาด 22B สำหรับการเขียนโค้ดตัวแรกของบริษัท มีชื่อว่า Codestral

Codestral ถูกเทรนด้วยโค้ดมากกว่า 80 ภาษา ซึ่งรวมทั้งภาษาเขียนโปรแกรมยอดนิยมอย่าง Python, Java, C, C++, JavaScript, และ Bash ไปจนถึงภาษาอย่าง Swift และ Fortran จึงรองรับการทำงานของนักพัฒนาในหลายรูปแบบสถานการณ์ มีความสามารถทั้ง ช่วยเขียนโค้ด เขียนเทสต์ หรือช่วยเติมส่วนที่ขาดหายในโค้ดได้ จึงช่วยลดเวลาและเพิ่มประสิทธิภาพให้กับนักพัฒนาได้

สงคราม AI จีนหั่นราคาสู้กันเอง Alibaba ลดราคาโมเดล 97%, ByteDance ลด 99%, Baidu แจกฟรี

By: mk

on 24 May 2024 - 19:31 Tags:

Topics:

China

LLM

Artificial Intelligence

Alibaba Cloud

Baidu

ByteDance

Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม

หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน

เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games

รัฐบาลจีนกำลังพัฒนา LLM และแชตบอทที่อิงจากปรัชญา วิธีคิดของ Xi Jinping

By: nismod

on 24 May 2024 - 14:40 Tags:

Topics:

China

LLM

Artificial Intelligence

หน่วยงานวิจัย Cyberspace Research Institute ของจีน เปิดเผยว่ากำลังพัฒนาโมเดล LLM และตัว AI แบบตอบโต้ โดยอิงจากปัญหาและวิธีคิดของผู้นำ Xi Jinping

โมเดลถูกเทรนด้วยเอกสารของรัฐบาลและหนังสือ "Xi Jinping Thought on Socialism with Chinese Characteristics for a New Era (习近平新时代中国特色社会主义思想学习问答) ซึ่งเป็นหนังสือปรัชญาการเมืองและอุดมการณ์ของเลขาธิการพรรคคอมมิวนิสต์ โดยตอนนี้ ตัวปัญญาประดิษฐ์หรือแชทบอตยังไม่มีการให้บริการ แต่เปิดทดสอบภายในอยู่

พบฟีเจอร์ AI Overviews ของ Google ให้คำตอบแปลกหลายครั้ง เช่น ให้ผสมกาวเพื่อให้ชีสติดกับแป้งพิซซ่า

By: arjin

on 24 May 2024 - 13:34 Tags:

Topics:

Google Search

Google

Artificial Intelligence

LLM

กูเกิลทดสอบฟีเจอร์ใช้ Generative AI ช่วยตอบคำถามของผู้ใช้งานผ่านหน้าผลการค้นหามาตั้งแต่ปีที่แล้ว ซึ่งปัจจุบันเรียกชื่อฟีเจอร์นี้ว่า AI Overviews และมีแผนขยายบริการนี้ไปยังผู้ใช้งานทุกคน โดยเริ่มที่สหรัฐอเมริกาในสัปดาห์ที่ผ่านมา จึงทำให้มีรายงานการตอบคำถามของกูเกิลที่ดูไม่ค่อยดีเท่าใดนักออกมา

ผู้ใช้งานคนหนึ่งแชร์คำตอบของคำถามว่า ทำพิซซ่าอย่างไรให้ชีสไม่ไหลหลุดจากแป้ง ซึ่ง AI Overviews ตอบว่าให้ผสมกาวไป 1/8 ถ้วย จะช่วยได้ คำตอบนี้ย่อมไม่ถูกต้องและทำจริงไม่ได้ ที่น่าสนใจคือใน Reddit มีคนค้นพบว่า เคยมีคนตอบแบบนี้เมื่อ 11 ปีที่แล้ว ซึ่งน่าจะเป็นแหล่งข้อมูลที่กูเกิลนำมาใช้ตอบนั่นเอง

Khan Academy เปิดระบบ AI ผู้ช่วยสอนให้ครูสหรัฐใช้งานฟรี ใช้โมเดลขนาดเล็ก Phi 3 ทำให้ต้นทุนต่ำลง

By: mk

on 23 May 2024 - 10:05 Tags:

Topics:

Khan Academy

Microsoft

LLM

Artificial Intelligence

Education

Khan Academy เว็บไซต์คอร์สออนไลน์ชื่อดัง ประกาศความร่วมมือกับไมโครซอฟท์ เปิดบริการผู้ช่วย AI สำหรับช่วยสอนวิชาการให้นักเรียน ชื่อว่า Khanmigo และเปิดให้บริการฟรี

รูปแบบการทำงานของ Khanmigo ไม่ต่างอะไรจากแชทบอท AI อื่นๆ มากนัก แต่ปรับความเชี่ยวชาญของบอทให้เป็นเหมือนติวเตอร์สอนวิชา มีความรู้ความเชี่ยวชาญในสาขาวิชานั้นๆ เหมือนกับครูคนหนึ่ง เหมือนเป็นผู้ช่วยสอน (TA) ประจำตัวของนักเรียนแต่ละคน สามารถตอบคำถาม ช่วยแนะนำวิธีการทำโจทย์ได้ (ดูคลิปประกอบ)

ไมโครซอฟท์เปิดตัว Phi Silica โมเดลหลักของ Copilot+ PC ทุกเครื่อง, รุ่นเล็กสุดของ Phi-3

By: mk

on 22 May 2024 - 17:06 Tags:

Topics:

Copilot+ PC

Microsoft

Artificial Intelligence

LLM

NPU

ไมโครซอฟท์เปิดเผยรายละเอียดเบื้องหลัง Copilot+ PC ที่เป็นการนำพีซีพลัง NPU มารันโมเดลปัญญาประดิษฐ์แบบ on-device ภายในเครื่อง ตกลงแล้วโมเดลตัวที่ว่านี้ชื่อว่า Phi Silica (อ่านว่า "ไฟ ซิลิกา") ถือเป็นหนึ่งในเวอร์ชันย่อยของชุดโมเดล Phi 3 โดยปรับแต่งมาเพื่อการรันบน NPU โดยเฉพาะ

Phi Silica พัฒนาต่อมาจาก Phi-3-mini โมเดลรุ่นเล็กสุดของซีรีส์ Phi-3 แล้วปรับขนาดให้เล็กลงอีกหน่อย (ขนาดพารามิเตอร์ลดลงจาก 3.8B เหลือ 3.3B) เพื่อให้รันใน NPU ได้พอดี ศักยภาพของ Phi Silica รองรับอินพุต 650 token ต่อวินาที ใช้พลังงานเพียง 1.5 วัตต์เท่านั้น

ไมโครซอฟท์เปิดตัวโมเดล Phi-3 ครบทั้งชุด เพิ่มโมเดลภาพ Vision มาเป็นครั้งแรก

By: mk

on 22 May 2024 - 10:02 Tags:

Topics:

Microsoft

LLM

Artificial Intelligence

ในงาน Build 2024 เมื่อคืนนี้ ไมโครซอฟท์เปิดตัวโมเดลขนาดเล็ก Phi 3 ครบชุด หลังจากเปิดตัว Phi-3-mini มาตั้งแต่เดือนเมษายน

โมเดลในชุด Phi 3 มีด้วยกันทั้งหมด 4 ตัว เป็นโมเดลภาษา (small language model หรือ SML) จำนวน 3 ขนาด พ่วงด้วยของใหม่คือโมเดลภาพ (multimodal) ตัวแรกของไมโครซอฟท์ที่เปิดซอร์สออกมาคือ Phi-3-vision

IBM ขยายบริการ Watsonx ช่วยเขียนโค้ดภาษา Java เพิ่ม, เปิดให้รันโมเดลจากบริษัทอื่น

By: mk

on 22 May 2024 - 07:41 Tags:

Topics:

Artificial Intelligence

IBM ประกาศขยายบริการปัญญาประดิษฐ์ Watsonx ที่เปิดตัวในปี 2023 จากเดิมมีเฉพาะ Watsonx Code Assistant for Z ตัวช่วยแปลงโค้ดภาษา COBOL บนเมนเฟรม และ Red Hat Ansible Lightspeed มาสู่บริการข้างเคียงอื่นๆ

IBM โอเพนซอร์สโมเดลช่วยเขียนโค้ด Granite ที่อยู่เบื้องหลัง Watsonx Code Assistant

By: mk

on 22 May 2024 - 06:41 Tags:

Topics:

IBM ประกาศโอเพนซอร์สโมเดลช่วยเขียนโค้ดของตัวเองชื่อ Granite โดยบอกว่ามีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สคู่แข่งในขนาดใกล้เคียงกัน (7B-8B) เช่น Google Gemma หรือ Meta CodeLlama

Granite เป็นโมเดลที่อยู่เบื้องหลังบริการ Watsonx Code Assistant (WCA) ที่เปิดตัวเมื่อปีที่แล้ว และนำไปใช้งานกับโค้ด COBOL ในเมนเฟรม Z หรือ Ansible Lightspeed ของฝั่ง Red Hat

Main menu

Lamini เสนอเทคนิค Memory Tuning ใส่ความรู้ให้ LLM โดยแทบไม่เหลืออาการหลอน

NVIDIA เปิดตัวโมเดล Nemotron-4 340B สร้างข้อมูลสังเคราะห์สำหรับเทรน LLM อีกที

สำนักพิมพ์ Wiley เผย เริ่มขายไลเซนส์ให้บริษัท Tech เข้าถึงเนื้อหาตำราเรียน สำหรับเทรน AI แล้ว

รายงานเผย Alexa ใหม่ที่มี LLM ยังไม่พร้อมตามกำหนดเดิม ยังห่างไกลความพร้อมให้บริการ

KBTG แสดงผลการปรับโมเดล Qwen2-7B จนทำข้อสอบ CFA ผ่าน เปิดทางโมเดลขนาดเล็กแนะนำการเงิน

เปิดสเปค LLM ภายใน Apple Intelligence รุ่นในอุปกรณ์ขนาด 3B, บนเซิร์ฟเวอร์เท่า GPT-3.5-Turbo

Huawei โชว์ประสิทธิภาพชิป Ascend 910B โดยรวมประมาณ 80% ของ NVIDIA A100 แถมชนะบางการทดสอบ

DuckDuckGo เปิดตัว AI Chat แชทบอตไม่ระบุตัวตน ให้ความเป็นส่วนตัวในการใช้งาน

Alibaba Cloud เปิดตัวปัญญาประดิษฐ์ Qwen2 ใช้งานได้เสรี พร้อมรองรับภาษาไทย

กูเกิลเปิดบริการ NotebookLM แอปทำสรุปโน้ตพลัง Gemini นอกสหรัฐฯ คนไทยได้ใช้ด้วย

aCommerce อาศัย Generative AI บน AWS เปิดให้ลูกค้าถามข้อมูลธุรกิจด้วยตัวเอง

สิงคโปร์เปิดตัว Project Moonshot ชุดเครื่องมือทดสอบความปลอดภัยและรับมือความเสี่ยงด้าน AI

OpenAI เตรียมเปิดตัวหนังสั้น 5 เรื่อง ที่สร้างด้วย Sora ในงานเทศกาลภาพยนตร์ Tribeca Festival

Anthropic เปิดตัวเครื่องมือสร้างแชทบอตคัสตอมบน Claude AI

[ลือ] Siri ใน iOS 18 จะรองรับคำสั่งของ App ที่มากขึ้น, สั่งให้ทำงานหลายอย่างต่อเนื่องได้

Mistral เปิดตัว Codestral โมเดล Generative AI ขนาด 22B สำหรับงานเขียนโค้ด รองรับกว่า 80 ภาษา

สงคราม AI จีนหั่นราคาสู้กันเอง Alibaba ลดราคาโมเดล 97%, ByteDance ลด 99%, Baidu แจกฟรี

รัฐบาลจีนกำลังพัฒนา LLM และแชตบอทที่อิงจากปรัชญา วิธีคิดของ Xi Jinping

พบฟีเจอร์ AI Overviews ของ Google ให้คำตอบแปลกหลายครั้ง เช่น ให้ผสมกาวเพื่อให้ชีสติดกับแป้งพิซซ่า

Khan Academy เปิดระบบ AI ผู้ช่วยสอนให้ครูสหรัฐใช้งานฟรี ใช้โมเดลขนาดเล็ก Phi 3 ทำให้ต้นทุนต่ำลง

ไมโครซอฟท์เปิดตัว Phi Silica โมเดลหลักของ Copilot+ PC ทุกเครื่อง, รุ่นเล็กสุดของ Phi-3

ไมโครซอฟท์เปิดตัวโมเดล Phi-3 ครบทั้งชุด เพิ่มโมเดลภาพ Vision มาเป็นครั้งแรก

IBM ขยายบริการ Watsonx ช่วยเขียนโค้ดภาษา Java เพิ่ม, เปิดให้รันโมเดลจากบริษัทอื่น

IBM โอเพนซอร์สโมเดลช่วยเขียนโค้ด Granite ที่อยู่เบื้องหลัง Watsonx Code Assistant

Pages

About Blognone

Other Version

Copyright Notice

Main menu

You are here

Pages

sign in

About Blognone

Other Version

Copyright Notice