LLM | Blognone

CNBC ได้เอกสารภายในของกูเกิล เผยรายละเอียดของโมเดล PaLM 2 ตัวใหม่ของกูเกิล

ขนาดของโมเดล PaLM 2 เทรนด้วยข้อมูล (token หรือจำนวนคำ) รวม 3.6 ล้านล้านคำ และจำนวนพารามิเตอร์ 3.4 แสนล้านพารามิเตอร์ หากเทียบกับโมเดล PaLM เวอร์ชันแรกที่ใช้ข้อมูลเทรน 7.8 แสนล้านคำ และพารามิเตอร์ 5.4 แสนล้านพารามิเตอร์ จะเห็นว่าจำนวนพารามิเตอร์ของ PaLM 2 น้อยกว่า สอดคล้องกับที่กูเกิลประกาศในงาน Google I/O ว่าโมเดลใหญ่กว่าไม่ได้ดีกว่าเสมอไป โดยกูเกิลใช้เทคนิคเรียกว่า compute-optimal scaling ช่วยลดจำนวนพารามิเตอร์และต้นทุนในการประมวลผลลง

Meta เปิดตัว AI Sandbox เครื่องมือสร้างสรรค์โฆษณา ปรับ Text เปลี่ยนพื้นหลัง ครอปรูป ด้วย Generative AI

By: arjin

on 13 May 2023 - 16:10 Tags:

Topics:

Meta

Advertising

Meta เปิดตัว AI Sandbox สำหรับผู้ลงโฆษณา เพื่อช่วยสร้างสรรค์รูปแบบโฆษณาด้วย Generative AI หรือ AI สร้างเนื้อหา ทั้ง ข้อความ พื้นหลัง และการครอปรูปภาพในฟอร์แมตต่าง ๆ สำหรับใช้ลงโฆษณาใน Facebook กับ Instagram

Meta บอกว่าเครื่องมือนี้เริ่มทดสอบใช้งานแล้วกับผู้ลงโฆษณากลุ่มเล็ก โดยจะนำผลตอบรับมาปรับปรุงผลิตภัณฑ์ให้ดีขึ้น ในเดือนกรกฎาคมจะขยายไปยังผู้ลงโฆษณามากขึ้น และเพิ่มฟีเจอร์ต่าง ๆ ภายในปีนี้

ตัวอย่างเครื่องมือ เช่น การสร้างข้อความ (ก๊อปปี้) ของโฆษณาในแบบที่ต่างกันตามกลุ่มเป้าหมาย แต่ยึดคอนเซปต์หลักที่ต้องการสื่อสารไว้, การสร้างพื้นหลังแบบต่าง ๆ ทำให้ได้ชุดงานหลากรูปแบบในแคมเปญ และฟีเจอร์ครอปรูปภาพ สำหรับการโพสต์ลงแต่ละรูปแบบที่ต้องการฟอร์แมตแตกต่างกัน

เปิดตัว Duet AI สำหรับ Google Workspace รองรับชุดใหญ่ทั้ง Docs, Slides, Docs

By: nismod

on 11 May 2023 - 17:09 Tags:

Topics:

Google Workspace

เมื่อเดือนมีนาคมที่ผ่านมา Google เปิดตัว Generative AI ที่นำมาใช้งานบน Google Workspace และเมื่อคืนในงาน Google I/O ที่ผ่านมา Google ประกาศฟีเจอร์ให้เพิ่มเติม พร้อมแบรนดิ้งตัวปัญญาประดิษฐ์แล้วในชื่อ Duet AI

โดยของใหม่ของ Duet AI ที่เปิดตัวเมื่อคืนนี้มีดังนี้

กูเกิลเผยข้อมูล Gemini โมเดลปัญญาประดิษฐ์รุ่นถัดไป

By: mk

on 11 May 2023 - 14:12 Tags:

Topics:

Gemini

Sundar Pichai เปิดเผยในงาน Google I/O ว่ากูเกิลเริ่มพัฒนาโมเดล AI ตัวใหม่แล้ว ใช้ชื่อว่า Gemini

Gemini เป็นโมเดลพื้นฐาน (foundational model) ที่พัฒนาขึ้นมาใหม่ทั้งหมด มีประสิทธิภาพสูง ตอนนี้ยังอยู่ระหว่างการเทรน และหลังจากนี้จะปรับจูนเพื่อนำมาใช้งานจริงต่อไป

ช่วงหลังๆ กูเกิลใช้วิธีทยอยเปิดตัวโมเดลใหม่ปีละ 2 ตัว โดยเป็นโมเดลรุ่นปัจจุบันและรุ่นถัดไป เมื่อปีที่แล้ว 2022 เราเห็น LaMDA 2 และ PaLM ส่วนปีนี้ 2023 มี PaLM 2 และ Gemini โดย PaLM 2 นำมาใช้งานในผลิตภัณฑ์หลายตัวของปีนี้แล้ว

Google Cloud เปิด PaLM API ให้ใช้งานฟรีช่วงพรีวิว

By: lew

on 11 May 2023 - 12:59 Tags:

Topics:

Google Cloud

กูเกิลเปิด PaLM 2 ไปเมื่อวานนี้ ตอนนี้ก็เริ่มปล่อย API ฝั่งคลาวด์ออกมา ความพิเศษคือกูเกิลปล่อยช่วงพรีวิวให้ใช้งานได้ฟรี โดยโมเดลที่เปิดให้ใช้งานมี 3 โมเดล ได้แก่

Read more about Google Cloud เปิด PaLM API ให้ใช้งานฟรีช่วงพรีวิว
1 comment
Log in or register to post comments

Google เปิดตัว PaLM 2, AI ภาษารองรับกว่า 100 ภาษา รันได้แม้ในโทรศัพท์มือถือ

By: lew

on 10 May 2023 - 23:52 Tags:

Topics:

กูเกิลเปิดตัว PaLM 2 ปัญญาประดิษฐ์ภาษาขนาดใหญ่รุ่นล่าสุดที่กูเกิลระบุว่าเป็นโมเดลที่ดีที่สุดในตอนนี้ โดยไม่ได้ระบุขนาดโมเดล แต่บอกว่าการศึกษาภายในพบว่าโมเดลที่ใหญ่ที่สุดไม่ได้ดีที่สุดเสมอไป และการที่ PaLM 2 ขนาดเล็กกว่าเป็นข้อดีเพราะรันได้เร็วกว่า และมีประสิทธิภาพสูงกว่า โดยฟีเจอร์สำคัญ 3 ด้านของ PaLM 2 ได้แก่

MosaicML เปิดตัวโมเดลปัญญาประดิษฐ์ MPT-7B ใกล้เคียง LLaMA ของเฟซบุ๊กแต่เป็นโอเพนซอร์ส

By: lew

on 7 May 2023 - 22:35 Tags:

Topics:

Open Source

MosaicML บริการคลาวด์สำหรับปัญญาประดิษฐ์ ประกาศเปิดซอร์สของโมเดล MPT-7B โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์สที่สามารถใช้งานเชิงการค้าได้เต็มรูปแบบ โดยมีขนาด 6,700 ล้านพารามิเตอร์ เทียบเท่ากับโมเดลเล็กที่สุดของ LLaMA ของ Meta/Facebook และคะแนนทดสอบใกล้เคียงกัน พร้อมกันฟีเจอร์สำคัญคือรองรับการประมวลผลข้อมูลขนาดใหญ่มาก

MPT-7B เป็นตระกูลปัญญาประดิษฐ์ที่มีหลายตัว ได้แก่

Google Cloud เปิดตัว Security AI Workbench ใช้โมเดลภาษา PaLM วิเคราะห์ข้อมูลความปลอดภัย

By: mk

on 25 April 2023 - 07:29 Tags:

Topics:

Google Cloud

Security

กูเกิลเปิดตัวบริการความปลอดภัย Google Cloud Security AI Workbench ที่ใช้โมเดล Generative AI มาช่วยยกระดับประสิทธิภาพในการตรวจจับภัยคุกคาม

โมเดลที่ใช้งานคือ Sec-PaLM เป็นเวอร์ชันพิเศษของ PaLM โมเดลภาษาขนาดใหญ่ (LLM) ที่กูเกิลเปิดตัวเมื่อปีที่แล้ว และเริ่มนำมาใช้งานในวงกว้างขึ้นเรื่อยๆ (ล่าสุดคือเปิด API เชื่อมต่อแอพภายนอก)

Stability AI เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ให้ใช้ฟรี เตรียมเปิดชุดข้อมูลด้วย

By: lew

on 20 April 2023 - 09:44 Tags:

Topics:

Stability AI

Open Source

Stability AI ผู้สร้างโมเดล Stable Diffusion ปัญญาประดิษฐ์สร้างภาพ ประกาศเปิดตัว StableLM โมเดลปัญญาประดิษฐ์ด้านภาษา โดยมีขุดแข็งคือบริษัทเปิดให้ใช้งานทั้งสำหรับงานวิจัยและใช้งานเชิงการค้า

โมเดล StableLM มีขนาดเริ่มต้น 3 พันล้านและ 7 พันล้านพารามิเตอร์ และเตรียมจะปล่อยโมเดลขนาดใหญ่ขึ้นที่ 15 พันล้าน และ 65 พันล้านพารามิเตอร์ต่อไป ชุดข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์พัฒนาจาก The Pile ที่มีขนาด 825GiB แต่ทาง Stability AI ขยายชุดข้อมูลจนมีขนาด 1.5 ล้านล้านโทเค็น และทางบริษัทเตรียมจะเปิดชุดข้อมูลให้ภายนอกใช้งานด้วย

รู้จัก Alpaca และ Koala โมเดล LLM ที่พัฒนาต่อจาก LLaMA ของ Meta, ขนาดเล็กกว่า GPT แต่แข่งขันได้

By: mk

on 6 April 2023 - 11:59 Tags:

Topics:

Llama

ถึงแม้ OpenAI เปลี่ยนมาใช้แนวทางปิด ไม่เปิดเผยรายละเอียดของโมเดล GPT-4 และฝั่งกูเกิลเองก็ยังค่อนข้างระมัดระวังในการปล่อย Bard ทีละนิด แต่โลกเราก็ยังมีโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ตัวอื่นให้ใช้งาน โดยเฉพาะ LLaMA ของ Meta ที่เปิดตัวในเดือนกุมภาพันธ์ 2023 ซึ่งเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ GPLv3 และเปิดทางให้หน่วยงานวิจัยมาขอชุดข้อมูลที่ใช้เทรนไปศึกษาได้

ตัวอย่างก่อนหน้านี้คือ Nebuly AI สร้าง ChatLLaMA แบบโอเพนซอร์ส ใช้โมเดล LLaMA ของ Meta เป็นฐาน

โมเดลปัญญาประดิษฐ์ LLaMA ของ Meta หลุดออก Torrent แล้ว

By: lew

on 4 March 2023 - 01:39 Tags:

Topics:

Llama

Meta

เมื่อสัปดาห์ที่ผ่านมา Meta เปิดตัว LLaMA ปัญญาประดิษฐ์ขนาดใหญ่สูงสุด 65 พันล้านพารามิเตอร์ โดยมีจุดเด่นคือ Meta แจกโมเดลที่ฝึกแล้วให้ไปใช้งานกันด้วย แต่จำกัดการใช้งานเฉพาะการศึกษาวิจัยเท่านั้น และนักวิจัยต้องไปขอใช้งานจาก Meta เป็นรายคน ล่าสุดก็มีคนที่ได้โมเดลไป นำโมเดลมาแจกบน torrent แล้ว

Microsoft เผยแพร่งานวิจัย Multimodal LLM เรียนรู้ อธิบาย ตอบคำถาม จากข้อมูลรูปภาพได้

By: arjin

on 2 March 2023 - 17:40 Tags:

Topics:

Microsoft

Microsoft Research

ทีมงานนักวิจัยของไมโครซอฟท์ เผยแพร่งานวิจัย Kosmos-1 โมเดลสร้างภาษาบนข้อมูลสื่อผสมผสาน (Multimodal Large Language Model - MLLM) โดยสามารถเรียนรู้ข้อมูลทั้งตัวหนังสือ รูปภาพ แคปชันประกอบรูปภาพ มาประมวลผลจนสามารถให้ข้อมูลอธิบายได้ในหลากหลายมิติ

ตัวอย่างความสามารถของ Kosmos-1 ที่เผยแพร่ในงานวิจัย เช่น การตอบคำถามจากข้อมูลรูปภาพที่กำหนด ซึ่งโมเดลสามารถเข้าใจบริบทเรื่องราวที่มีอยู่ในภาพได้, สามารถแปลงข้อมูลตัวหนังสือในภาพ (OCR) เพื่อตอบคำถามได้, สามารถหารายละเอียดสำคัญในรูปภาพ และสืบค้นข้อมูลต่อได้ เป็นต้น

ไมโครซอฟท์เล่าเบื้องหลังโมเดล Prometheus เกิดขึ้นเพื่อแก้ปัญหาข้อมูลใน GPT เก่าเกินไป

By: mk

on 26 February 2023 - 18:23 Tags:

Topics:

Bing

Microsoft

Jordi Ribas ผู้บริหารฝ่าย Search & AI ของไมโครซอฟท์ เขียนบล็อกบน LinkedIn เล่ารายละเอียดของโมเดล Prometheus ที่ใช้ใน Bing เวอร์ชันใหม่เพิ่มอีกหน่อย

Ribas บอกว่าเมื่อกลางปี 2022 ทีม OpenAI โชว์โมเดล GPT เวอร์ชันใหม่ (ที่ยังไม่บอกว่า 4 แต่ใหม่กว่า 3.5) ให้ทีมไมโครซอฟท์ดู ทีมไมโครซอฟท์เห็นศักยภาพจึงเริ่มลงมือพัฒนาเพื่อใช้งานใน Bing แต่ข้อจำกัดของโมเดล LLM แนว GPT คือข้อมูลที่ใช้เทรนจะเก่าในระดับหนึ่ง ไม่มีวันเป็นข้อมูลเรียลไทม์ ไมโครซอฟท์จึงต้องแก้ปัญหาด้วยการนำข้อมูลเรียลไทม์จาก Bing เข้ามาเชื่อมกับ GPT และนี่คือ Prometheus

Meta เผยแพร่ LLaMA ชุดโมเดล AI สร้างภาษา LLM ที่พัฒนาขึ้นมา เพื่อให้ใช้ศึกษาวิจัยต่อ

By: arjin

on 25 February 2023 - 07:49 Tags:

Topics:

Llama

Meta

Research

Meta เผยแพร่ชุดโมเดล AI สำหรับสร้างข้อความภาษา หรือ LLM (Large Language Model) โดยเรียกชื่อว่า LLaMA ย่อมาจาก Large Language Model Meta AI โดยมีเป้าหมายเพื่อให้องค์กรต่าง ๆ นำไปศึกษาวิจัยต่อ

LLM เป็นรูปแบบโมเดล AI สร้างข้อความ ที่ถูกนำมาใช้ในผลิตภัณฑ์แชตบอทที่เป็นกระแสในช่วงที่ผ่านมา ไม่ว่าจะเป็น ChatGPT, Bing Chat หรือ Bard ของกูเกิล และเป็นโมเดลที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ต้องการทรัพยากรประมวลที่ใหญ่มาก ทำให้หลายองค์กรไม่มีโอกาสเข้าถึง โดย LLaMA ที่ Meta เผยแพร่มีหลายขนาดชุดข้อมูล ตั้งแต่ 7 พันล้านพารามิเตอร์ จนถึงชุด 65 พันล้านพารามิเตอร์

นักวิจัยไมโครซอฟท์เสนอ Language Model ขนาดเล็กสำหรับ Excel เน้นแนะนำ-แก้สูตรให้ผู้ใช้

By: mk

on 6 February 2023 - 20:20 Tags:

Topics:

Excel

Microsoft

Research

ช่วงนี้ AI สายตระกูล Large Language Models (LLM) กำลังโด่งดังจากกระแส ChatGPT แต่ข้อเสียของโมเดลใหญ่ขนาดนี้คือขนาดของตัวมันเองที่ใหญ่มาก มีพารามิเตอร์หลักพันล้าน ใช้ข้อมูลการเทรน ทรัพยากรเครื่องจำนวนมหาศาล

ทีมนักวิจัยของไมโครซอฟท์จึงเสนอแนวทาง Language Model ที่มีขนาดเล็กลง แต่ทำงานเฉพาะด้านแทน โดยนำเสนองานวิจัย FLAME ที่ย่อมาจาก First LAnguage Model for Excel หน้าที่ของมันตรงตามชื่อคือเป็นโมเดลภาษาสำหรับ Excel ช่วยแนะนำหรือแก้ไขสูตรในตารางสเปรดชีท

กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์สนทนาเวอร์ชันใหม่ เตรียมเปิดเว็บให้ลองคุยโดยตรง

By: mk

on 16 May 2022 - 11:43 Tags:

Topics:

ในงาน Google I/O สัปดาห์ที่ผ่านมา กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์เพื่อการสนทนา (conversation AI) เวอร์ชันอัพเกรดจาก LaMDA (Language Models for Dialog Applications) รุ่นแรกที่เปิดตัวในปี 2021

กูเกิลบอกว่า LaMDA 2 มีพารามิเตอร์มากกว่า 137 พันล้านรายการ เทรนด้วยข้อมูลขนาดใหญ่ 1.56 ล้านล้านคำ ได้โมเดลที่พัฒนาขึ้นจากเดิมใน 3 ด้านคือ

มันขำตรงไหน กูเกิลนำเสนอปัญญาประดิษฐ์ขนาดใหญ่ยักษ์ PaLM อธิบายมุกตลกได้แล้ว

By: lew

on 5 April 2022 - 01:46 Tags:

Topics:

กูเกิลนำเสนอโมเดลปัญญาประดิษฐ์ PaLM โมเดลปัญญาประดิษฐ์ขนาด 540,000 ล้านพารามิเตอร์ โดยอาศัยสถาปัตยกรรม Pathway ที่ออกแบบมาให้ปัญญาประดิษฐ์ทำงานได้หลากหลายขึ้น

กูเกิลออกแบบ PaLM ไว้ 3 ขนาด ได้แก่ 8 พันล้านพารามิเตอร์, 64 พันล้านพารามิเตอร์, และ 540 พันล้านพารามิเตอร์ โดยพบว่าความสามารถของตัวปัญญาประดิษฐ์ขนาด 64 พันล้านพารามิเตอร์แซงหน้า GPT-3 ที่มีขนาด 175 พันล้านพารามิเตอร์ได้

กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA รุ่นปรับปรุง คุยได้แทบเหมือนมนุษย์

By: lew

on 19 May 2021 - 01:05 Tags:

Topics:

ในงาน Google I/O ปีนี้ กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA ที่ออกแบบมาเพื่อบทสนทนาโดยเข้าใจเรื่องราวที่กำลังคุยกันอยู่ แม้กูเกิลจะสร้าง LaMDA และรายงานผลการพัฒนามาตั้งแต่ต้นปี 2020 แต่กูเกิลก็พบว่าสามารถนำโมเดลปัญญาประดิษฐ์มาฝึกเรื่องราวเฉพาะทางได้

กูเกิลสาธิตการใช้งานด้วยการให้ LaMDA เป็นเครื่องบินกระดาษ ผู้ใช้สามารถสนทนากับเครื่องบินกระดาษได้เหมือนเป็นตัวละครสมมติ เช่น ผู้ใช้ถามว่า "คุณเป็นเครื่องบินกระดาษที่ดีไหม" ตัว LaMDA จะถามกลับได้ว่า "ขึ้นกับคำว่าดีแปลว่าอะไร บางคนอาจจะแปลว่าบินได้ไกล บางคนอาจจะแปลว่าบินได้ตรง"

กูเกิลกำลังตรวจสอบว่า LaMDA สามารถตอบคำถามได้อย่าง "ถูกต้อง" จริงหรือไม่ หรือแค่ตอบคำถามที่ดู "สมเหตุสมผล" เท่านั้น ก่อนจะนำ LaMDA ไปใช้งานกับบริการจริง

กูเกิลเริ่มใช้ Deep Learning ทำความเข้าใจคำค้นหา หาผลลัพธ์ตามรูปประโยค

By: lew

on 25 October 2019 - 19:33 Tags:

Topics: