LLM | Blognone

MosaicML เปิดตัวโมเดลปัญญาประดิษฐ์ MPT-7B ใกล้เคียง LLaMA ของเฟซบุ๊กแต่เป็นโอเพนซอร์ส

By: lew

on 7 May 2023 - 22:35 Tags:

Topics:

Artificial Intelligence

Open Source

LLM

MosaicML บริการคลาวด์สำหรับปัญญาประดิษฐ์ ประกาศเปิดซอร์สของโมเดล MPT-7B โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์สที่สามารถใช้งานเชิงการค้าได้เต็มรูปแบบ โดยมีขนาด 6,700 ล้านพารามิเตอร์ เทียบเท่ากับโมเดลเล็กที่สุดของ LLaMA ของ Meta/Facebook และคะแนนทดสอบใกล้เคียงกัน พร้อมกันฟีเจอร์สำคัญคือรองรับการประมวลผลข้อมูลขนาดใหญ่มาก

MPT-7B เป็นตระกูลปัญญาประดิษฐ์ที่มีหลายตัว ได้แก่

Google Cloud เปิดตัว Security AI Workbench ใช้โมเดลภาษา PaLM วิเคราะห์ข้อมูลความปลอดภัย

By: mk

on 25 April 2023 - 07:29 Tags:

Topics:

Google Cloud

Security

Artificial Intelligence

กูเกิลเปิดตัวบริการความปลอดภัย Google Cloud Security AI Workbench ที่ใช้โมเดล Generative AI มาช่วยยกระดับประสิทธิภาพในการตรวจจับภัยคุกคาม

โมเดลที่ใช้งานคือ Sec-PaLM เป็นเวอร์ชันพิเศษของ PaLM โมเดลภาษาขนาดใหญ่ (LLM) ที่กูเกิลเปิดตัวเมื่อปีที่แล้ว และเริ่มนำมาใช้งานในวงกว้างขึ้นเรื่อยๆ (ล่าสุดคือเปิด API เชื่อมต่อแอพภายนอก)

Stability AI เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ให้ใช้ฟรี เตรียมเปิดชุดข้อมูลด้วย

By: lew

on 20 April 2023 - 09:44 Tags:

Topics:

Stability AI

Artificial Intelligence

Open Source

LLM

Stability AI ผู้สร้างโมเดล Stable Diffusion ปัญญาประดิษฐ์สร้างภาพ ประกาศเปิดตัว StableLM โมเดลปัญญาประดิษฐ์ด้านภาษา โดยมีขุดแข็งคือบริษัทเปิดให้ใช้งานทั้งสำหรับงานวิจัยและใช้งานเชิงการค้า

โมเดล StableLM มีขนาดเริ่มต้น 3 พันล้านและ 7 พันล้านพารามิเตอร์ และเตรียมจะปล่อยโมเดลขนาดใหญ่ขึ้นที่ 15 พันล้าน และ 65 พันล้านพารามิเตอร์ต่อไป ชุดข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์พัฒนาจาก The Pile ที่มีขนาด 825GiB แต่ทาง Stability AI ขยายชุดข้อมูลจนมีขนาด 1.5 ล้านล้านโทเค็น และทางบริษัทเตรียมจะเปิดชุดข้อมูลให้ภายนอกใช้งานด้วย

รู้จัก Alpaca และ Koala โมเดล LLM ที่พัฒนาต่อจาก LLaMA ของ Meta, ขนาดเล็กกว่า GPT แต่แข่งขันได้

By: mk

on 6 April 2023 - 11:59 Tags:

Topics:

Llama

Artificial Intelligence

Open Source

โมเดลปัญญาประดิษฐ์ LLaMA ของ Meta หลุดออก Torrent แล้ว

By: lew

on 4 March 2023 - 01:39 Tags:

Topics:

Llama

Microsoft เผยแพร่งานวิจัย Multimodal LLM เรียนรู้ อธิบาย ตอบคำถาม จากข้อมูลรูปภาพได้

By: arjin

on 2 March 2023 - 17:40 Tags:

Topics:

Microsoft

Artificial Intelligence

Microsoft Research

LLM

ทีมงานนักวิจัยของไมโครซอฟท์ เผยแพร่งานวิจัย Kosmos-1 โมเดลสร้างภาษาบนข้อมูลสื่อผสมผสาน (Multimodal Large Language Model - MLLM) โดยสามารถเรียนรู้ข้อมูลทั้งตัวหนังสือ รูปภาพ แคปชันประกอบรูปภาพ มาประมวลผลจนสามารถให้ข้อมูลอธิบายได้ในหลากหลายมิติ

ตัวอย่างความสามารถของ Kosmos-1 ที่เผยแพร่ในงานวิจัย เช่น การตอบคำถามจากข้อมูลรูปภาพที่กำหนด ซึ่งโมเดลสามารถเข้าใจบริบทเรื่องราวที่มีอยู่ในภาพได้, สามารถแปลงข้อมูลตัวหนังสือในภาพ (OCR) เพื่อตอบคำถามได้, สามารถหารายละเอียดสำคัญในรูปภาพ และสืบค้นข้อมูลต่อได้ เป็นต้น

ไมโครซอฟท์เล่าเบื้องหลังโมเดล Prometheus เกิดขึ้นเพื่อแก้ปัญหาข้อมูลใน GPT เก่าเกินไป

By: mk

on 26 February 2023 - 18:23 Tags:

Topics:

Bing

Microsoft

Artificial Intelligence

Jordi Ribas ผู้บริหารฝ่าย Search & AI ของไมโครซอฟท์ เขียนบล็อกบน LinkedIn เล่ารายละเอียดของโมเดล Prometheus ที่ใช้ใน Bing เวอร์ชันใหม่เพิ่มอีกหน่อย

Ribas บอกว่าเมื่อกลางปี 2022 ทีม OpenAI โชว์โมเดล GPT เวอร์ชันใหม่ (ที่ยังไม่บอกว่า 4 แต่ใหม่กว่า 3.5) ให้ทีมไมโครซอฟท์ดู ทีมไมโครซอฟท์เห็นศักยภาพจึงเริ่มลงมือพัฒนาเพื่อใช้งานใน Bing แต่ข้อจำกัดของโมเดล LLM แนว GPT คือข้อมูลที่ใช้เทรนจะเก่าในระดับหนึ่ง ไม่มีวันเป็นข้อมูลเรียลไทม์ ไมโครซอฟท์จึงต้องแก้ปัญหาด้วยการนำข้อมูลเรียลไทม์จาก Bing เข้ามาเชื่อมกับ GPT และนี่คือ Prometheus

Meta เผยแพร่ LLaMA ชุดโมเดล AI สร้างภาษา LLM ที่พัฒนาขึ้นมา เพื่อให้ใช้ศึกษาวิจัยต่อ

By: arjin

on 25 February 2023 - 07:49 Tags:

Topics:

Llama

นักวิจัยไมโครซอฟท์เสนอ Language Model ขนาดเล็กสำหรับ Excel เน้นแนะนำ-แก้สูตรให้ผู้ใช้

By: mk

on 6 February 2023 - 20:20 Tags:

Topics:

Excel

Artificial Intelligence

Microsoft

Research

LLM

ช่วงนี้ AI สายตระกูล Large Language Models (LLM) กำลังโด่งดังจากกระแส ChatGPT แต่ข้อเสียของโมเดลใหญ่ขนาดนี้คือขนาดของตัวมันเองที่ใหญ่มาก มีพารามิเตอร์หลักพันล้าน ใช้ข้อมูลการเทรน ทรัพยากรเครื่องจำนวนมหาศาล

ทีมนักวิจัยของไมโครซอฟท์จึงเสนอแนวทาง Language Model ที่มีขนาดเล็กลง แต่ทำงานเฉพาะด้านแทน โดยนำเสนองานวิจัย FLAME ที่ย่อมาจาก First LAnguage Model for Excel หน้าที่ของมันตรงตามชื่อคือเป็นโมเดลภาษาสำหรับ Excel ช่วยแนะนำหรือแก้ไขสูตรในตารางสเปรดชีท

กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์สนทนาเวอร์ชันใหม่ เตรียมเปิดเว็บให้ลองคุยโดยตรง

By: mk

on 16 May 2022 - 11:43 Tags:

Topics:

Google

Artificial Intelligence

LLM

ในงาน Google I/O สัปดาห์ที่ผ่านมา กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์เพื่อการสนทนา (conversation AI) เวอร์ชันอัพเกรดจาก LaMDA (Language Models for Dialog Applications) รุ่นแรกที่เปิดตัวในปี 2021

กูเกิลบอกว่า LaMDA 2 มีพารามิเตอร์มากกว่า 137 พันล้านรายการ เทรนด้วยข้อมูลขนาดใหญ่ 1.56 ล้านล้านคำ ได้โมเดลที่พัฒนาขึ้นจากเดิมใน 3 ด้านคือ

มันขำตรงไหน กูเกิลนำเสนอปัญญาประดิษฐ์ขนาดใหญ่ยักษ์ PaLM อธิบายมุกตลกได้แล้ว

By: lew

on 5 April 2022 - 01:46 Tags:

Topics:

Google

Artificial Intelligence

LLM

กูเกิลนำเสนอโมเดลปัญญาประดิษฐ์ PaLM โมเดลปัญญาประดิษฐ์ขนาด 540,000 ล้านพารามิเตอร์ โดยอาศัยสถาปัตยกรรม Pathway ที่ออกแบบมาให้ปัญญาประดิษฐ์ทำงานได้หลากหลายขึ้น

กูเกิลออกแบบ PaLM ไว้ 3 ขนาด ได้แก่ 8 พันล้านพารามิเตอร์, 64 พันล้านพารามิเตอร์, และ 540 พันล้านพารามิเตอร์ โดยพบว่าความสามารถของตัวปัญญาประดิษฐ์ขนาด 64 พันล้านพารามิเตอร์แซงหน้า GPT-3 ที่มีขนาด 175 พันล้านพารามิเตอร์ได้

กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA รุ่นปรับปรุง คุยได้แทบเหมือนมนุษย์

By: lew

on 19 May 2021 - 01:05 Tags:

Topics:

Google

Artificial Intelligence

LLM

ในงาน Google I/O ปีนี้ กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA ที่ออกแบบมาเพื่อบทสนทนาโดยเข้าใจเรื่องราวที่กำลังคุยกันอยู่ แม้กูเกิลจะสร้าง LaMDA และรายงานผลการพัฒนามาตั้งแต่ต้นปี 2020 แต่กูเกิลก็พบว่าสามารถนำโมเดลปัญญาประดิษฐ์มาฝึกเรื่องราวเฉพาะทางได้

กูเกิลสาธิตการใช้งานด้วยการให้ LaMDA เป็นเครื่องบินกระดาษ ผู้ใช้สามารถสนทนากับเครื่องบินกระดาษได้เหมือนเป็นตัวละครสมมติ เช่น ผู้ใช้ถามว่า "คุณเป็นเครื่องบินกระดาษที่ดีไหม" ตัว LaMDA จะถามกลับได้ว่า "ขึ้นกับคำว่าดีแปลว่าอะไร บางคนอาจจะแปลว่าบินได้ไกล บางคนอาจจะแปลว่าบินได้ตรง"

กูเกิลกำลังตรวจสอบว่า LaMDA สามารถตอบคำถามได้อย่าง "ถูกต้อง" จริงหรือไม่ หรือแค่ตอบคำถามที่ดู "สมเหตุสมผล" เท่านั้น ก่อนจะนำ LaMDA ไปใช้งานกับบริการจริง

กูเกิลเริ่มใช้ Deep Learning ทำความเข้าใจคำค้นหา หาผลลัพธ์ตามรูปประโยค

By: lew

on 25 October 2019 - 19:33 Tags:

Topics:

Artificial Intelligence

กูเกิลประกาศเริ่มใช้งานโมเดลประมวลภาษาธรรมชาติ (natural language processing - NLP) แบบ deep learning ที่บริษัทโอเพนซอร์สออกมาเมื่อปีที่แล้วที่ชื่อว่า BERT ในการทำความเข้าใจคำค้นใน Google Search เพื่อให้เข้าใจความหมายของวลีที่ผู้ใช้กำลังค้นหาได้ดีขึ้น

ก่อนหน้านี้ผู้ใช้มักพยายามเพิ่มคำสำคัญที่ถูกต้อง เพราะเว็บค้นหามักใช้คำเหล่านี้ค้นฐานข้อมูล โดยไม่ได้ใช้คำขยายหรือคำบุพบทมาเป็นส่วนสำคัญ แต่การประมวลผลแบบ NLP ทำให้กูเกิลเข้าใจคำค้นได้ตรงความต้องการแม้จะค้นเหมือนพูดคุยกับคนอยู่ก็ตาม

Main menu

MosaicML เปิดตัวโมเดลปัญญาประดิษฐ์ MPT-7B ใกล้เคียง LLaMA ของเฟซบุ๊กแต่เป็นโอเพนซอร์ส

Google Cloud เปิดตัว Security AI Workbench ใช้โมเดลภาษา PaLM วิเคราะห์ข้อมูลความปลอดภัย

Stability AI เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ให้ใช้ฟรี เตรียมเปิดชุดข้อมูลด้วย

รู้จัก Alpaca และ Koala โมเดล LLM ที่พัฒนาต่อจาก LLaMA ของ Meta, ขนาดเล็กกว่า GPT แต่แข่งขันได้

โมเดลปัญญาประดิษฐ์ LLaMA ของ Meta หลุดออก Torrent แล้ว

Microsoft เผยแพร่งานวิจัย Multimodal LLM เรียนรู้ อธิบาย ตอบคำถาม จากข้อมูลรูปภาพได้

ไมโครซอฟท์เล่าเบื้องหลังโมเดล Prometheus เกิดขึ้นเพื่อแก้ปัญหาข้อมูลใน GPT เก่าเกินไป

Meta เผยแพร่ LLaMA ชุดโมเดล AI สร้างภาษา LLM ที่พัฒนาขึ้นมา เพื่อให้ใช้ศึกษาวิจัยต่อ

นักวิจัยไมโครซอฟท์เสนอ Language Model ขนาดเล็กสำหรับ Excel เน้นแนะนำ-แก้สูตรให้ผู้ใช้

กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์สนทนาเวอร์ชันใหม่ เตรียมเปิดเว็บให้ลองคุยโดยตรง

มันขำตรงไหน กูเกิลนำเสนอปัญญาประดิษฐ์ขนาดใหญ่ยักษ์ PaLM อธิบายมุกตลกได้แล้ว

กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA รุ่นปรับปรุง คุยได้แทบเหมือนมนุษย์

กูเกิลเริ่มใช้ Deep Learning ทำความเข้าใจคำค้นหา หาผลลัพธ์ตามรูปประโยค

Pages

About Blognone

Other Version

Copyright Notice

Main menu

You are here

Pages

sign in

About Blognone

Other Version

Copyright Notice