LLM | Blognone

เว็บไซต์ The Information รายงานอ้างแหล่งข่าวภายในจาก OpenAI ว่าโมเดลตัวใหม่โค้ดเนม Orion ไม่ได้พัฒนาจาก GPT-4 แบบก้าวกระโดด เหมือนกับตอนเปลี่ยนจาก GPT-3 มาเป็น GPT-4

แหล่งข่าวของ The Information ยังบอกว่า Orion ยังอาจทำงานไม่ได้ดีกว่าโมเดลรุ่นปัจจุบันอย่างชัดเจนนัก (not be reliably better) ในงานบางด่าน เช่น การเขียนโค้ด

ปัญหานี้ทำให้ตอนนี้ OpenAI ตั้งทีมมาค้นหาวิธีเดินหน้าพัฒนาโมเดลต่อไปในระยะยาว เพราะไม่มีข้อมูลใหม่ๆ มาใช้เทรนโมเดลแล้ว (ใช้ข้อมูลหมดโลกแล้ว) แนวทางที่เป็นไปได้คือ การใช้ข้อมูลสังเคราะห์จากโมเดลอื่นมาเทรน Orion หรือ เพิ่มกระบวนการพัฒนาคุณภาพหลังการเทรนโมเดลเสร็จ

Gemini รองรับการเรียกผ่าน OpenAI Library แล้ว, ออก REST API ให้ใช้งาน

By: mk

on 9 November 2024 - 10:36 Tags:

Topics:

ต้องยอมรับว่ากูเกิลเปิดตัว Gemini หลัง ChatGPT เป็นเวลานานพอสมควร ทำให้ตลาด AI/LLM มุ่งไปที่ฝั่ง OpenAI กันหมด แอพที่เรียกใช้งาน LLM จึงมักเขียนเพื่อรองรับโมเดลของฝั่ง OpenAI โดยเรียกใช้ OpenAI Library (ทั้งที่เป็น official และ unofficial) กันซะเป็นส่วนใหญ่

ล่าสุดกูเกิลประกาศ "แฝงตัว" ให้รองรับการเรียกใช้ Gemini ผ่าน OpenAI Library ได้แล้ว ช่วยลดภาระการแก้โค้ดลง โดยโค้ดสามารถเรียกใช้ OpenAI Library ได้เหมือนเดิม แต่ในส่วนของโมเดลเปลี่ยนเป็นเรียก Gemini แทน ช่วยให้แก้โค้ดเพียงไม่กี่บรรทัดเท่านั้น

รู้จักโครงการ SEALD ความพยายามสร้าง LLM โอเพนซอร์สในบริบทท้องถิ่นอาเซียน

By: nismod

on 7 November 2024 - 18:47 Tags:

Topics:

Google

Singapore

Southeast Asia

ปัจจุบันโมเดล LLM เก่งๆ มีหลากหลายโมเดล แต่ส่วนใหญ่ถูกพัฒนาจากกรอบของภาษาอังกฤษ หรือภาษาอื่นที่เป็นภาษาหลักของโลก รวมถึงชุดข้อมูลและการปรับแต่ง ก็ถูกตีกรอบด้วยอิทธิพลและมุมมองจากตะวันตกเป็นหลัก ทำให้ในหลายๆ ประเทศ หลายๆ ภูมิภาค ที่มีภาษาและบริบททางวัฒนธรรมเฉพาะ ไม่สามารถเข้าถึง LLM ได้ ซึ่งบริษัทใหญ่ๆ ก็คงไม่เน้นพัฒนาให้ หรือประเทศนั้นๆ จะพัฒนาเอง ก็ไม่ได้มีทรัพยากรเพียงพอ

Ollama ออกเวอร์ชั่น 0.4 รองรับอินพุตเป็นภาพ

By: lew

on 7 November 2024 - 12:10 Tags:

Topics:

Ollama ซอฟต์แวร์รันไทม์สำหรับรันโมเดลปัญญาประดิษฐ์ ออกเวอร์ชั่น 0.4 รองรับการรันโมเดลที่รับอินพุตเป็นภาพ โมเดลสำคัญคในกลุ่มนี้คือ Llama 3.2 ของ Meta

llama3.2-vision มีทั้งรุ่น 11B และ 90B ต้องการแรมขั้นต่ำ 8GB ส่วนรุ่น 90B ต้องการขั้นต่ำ 64GB โดยโมเดลรุ่นเล็กเหล่านี้เป็นแบบ quantize 4 bit รุ่นใหญ่สุดแบบ FP16 นั้นเฉพาะไฟล์โมเดลก็ขนาดถึง 177GB แล้ว

การใช้งาน llama3.2-vision สามารถใช้งานได้ทั้งการทำ OCR, อ่านลายมือ, อธิบายภาพ

ที่มา - Ollama

Claude 3.5 Haiku เปิดให้ใช้งานแล้ว พร้อมราคาที่แพงกว่ารุ่นก่อนหน้า Claude 3 Haiku

By: arjin

on 5 November 2024 - 13:13 Tags:

Topics:

Anthropic ประกาศว่าโมเดลปัญญาประดิษฐ์ Claude 3.5 Haiku ที่เป็นรุ่นเล็กมีราคาถูก ตอนนี้เปิดให้ใช้งานแล้วผ่าน API และผ่านผู้ให้บริการคลาวด์ทั้ง Amazon Bedrock และ Vertex AI หลังจากเปิดตัวไปเมื่อเดือนที่แล้วพร้อมกับ Sonnet 3.5 รุ่นปรับปรุง

Runway เพิ่มเครื่องมือกำหนดทิศทางมุมกล้องขั้นสูงในโมเดลวิดีโอ Gen-3 Alpha Turbo

By: arjin

on 4 November 2024 - 12:47 Tags:

Topics:

Runway

Runway สตาร์ทอัปที่เน้นพัฒนาปัญญาประดิษฐ์สร้างวิดีโอ ประกาศเพิ่มเครื่องมือ Advanced Camera Control บนโมเดล Gen-3 Alpha Turbo ทำให้ผู้ใช้งานกำหนดรายละเอียดทิศทางมุมกล้องที่ต้องการได้ตั้งแต่ใน Prompt

ทิศทางและการเคลื่อนที่ของกล้องสามารถกำหนดได้ตั้งแต่ระดับ เลื่อนซ้าย-ขวา-บน-ล่าง, ซูมเข้า, ทิศทางกล้องหมุน ความเร็ว จนถึงระยะห่างที่ซูมกับวัตถุ ทำให้การสร้างวิดีโอด้วย Gen-3 Alpha Turbo ควบคุมได้มากขึ้นคล้ายกับการถ่ายงานวิดีโอจริงมากขึ้นไปอีก

Claude 3.5 Sonnet เพิ่มเครื่องมือ Visual PDF สามารถวิเคราะห์เอกสารได้ทั้งตัวหนังสือ-กราฟ-รูปภาพ

By: arjin

on 2 November 2024 - 22:52 Tags:

Topics:

Anthropic ประกาศเพิ่มเครื่องมือใหม่ Visual PDF บนโมเดล Claude 3.5 Sonnet ซึ่งมีความสามารถในการอ่านวิเคราะห์เนื้อหาจากเอกสาร PDF ได้

เงื่อนไขในการใช้งาน Visual PDF ระบุว่า หากเอกสารนั้นมีจำนวนต่ำกว่า 100 หน้า สามารถอัปโหลดได้โดยตรงผ่านกล่องแชท และ Visual PDF สามารถวิเคราะห์ข้อมูลรูปภาพ แผนภูมิ กราฟิก ได้ด้วย แต่ถ้าเอกสารมีมากกว่า 100 หน้า จะรองรับเฉพาะข้อความตัวหนังสือเท่านั้น

Claude แนะนำว่าเพื่อประสิทธิภาพการทำงานสำหรับไฟล์ที่มีจำนวนหน้าเอกสารเยอะ ควรแบ่งเป็นไฟล์ย่อยให้อยู่ในข้อจำกัด 100 หน้า

OpenAI เปิดตัว ChatGPT Search ค้นหาข้อมูลล่าสุดจากเว็บต่าง ๆ ผ่านแชทบอต - ลูกค้าเสียเงินได้ใช้ก่อนตั้งแต่วันนี้

By: arjin

on 1 November 2024 - 04:00 Tags:

Topics:

OpenAI เปิดตัวบริการใหม่ ChatGPT Search เพื่อให้ผู้ใช้งานค้นหาข้อมูลจากเว็บไซต์ต่าง ๆ รองรับข้อมูลที่มีการปรับปรุงอยู่ตลอดอย่าง ผลการแข่งขันกีฬา, ข่าวสาร หรือราคาหุ้น ด้วยรูปแบบการโต้ตอบของแชทบอตผ่านกล่อง ChatGPT

ในการทำงาน ChatGPT จะเลือกค้นหาข้อมูลผ่านเว็บตามลักษณะคำถาม หรือผู้ใช้งานจะเลือกปุ่ม Web Search เพื่อให้ ChatGPT ค้นหาข้อมูลจากเว็บไซต์ก็ได้ ในผลคำตอบจะมีลิงก์แนบท้ายเพื่อให้ดูข้อมูลเพิ่มเติมที่ต้นทางด้วย

Anthropic ออกแอป Claude เวอร์ชัน Mac และ Windows

By: arjin

on 31 October 2024 - 22:30 Tags:

Topics:

Anthropic ออกแอป Claude สำหรับผู้ใช้งาน Mac และ Windows โดยตัวแอปมีสถานะเป็นพับลิกเบต้า ซึ่ง Anthropic บอกเหตุผลที่ออกแอปสำหรับแต่ละระบบปฏิบัติการ เพื่อให้ Claude สามารถใช้งานได้ในทุกสภาพแวดล้อมที่ต้องการ

แอป Claude บน Mac และ Windows สามารถใช้งานได้ผู้ใช้งานแบบฟรี และผู้ใช้งานที่สมัครแผนพรีเมียม

นอกจากนี้ Anthropic ยังเพิ่มเครื่องมือใหม่ของแชทบอต Claude สามารถพิมพ์ตามเสียงพูดหรือ Dictation รองรับความยาวเสียงสูงสุด 10 นาที ส่งอินพุทได้ทั้งการกดบันทึกเสียง หรืออัปโหลดข้อความเสียง ตอนนี้รองรับเฉพาะแอป iOS, Android และ iPadOS เท่านั้น

Read more about Anthropic ออกแอป Claude เวอร์ชัน Mac และ Windows
4 comments
Log in or register to post comments

GitHub เพิ่มบริการ Copilot สำหรับนักพัฒนาบน Xcode

By: arjin

on 30 October 2024 - 19:39 Tags:

Topics:

GitHub ประกาศว่าบริการ GitHub Copilot สำหรับ Xcode เข้าสู่สถานะพับลิกพรีวิวแล้ว เพิ่มความสามารถให้บริการ Copilot รองรับนักพัฒนาได้ในหลากหลายแพลตฟอร์มรวมทั้งแอปเปิล

GitHub Copilot สำหรับ Xcode มีฟีเจอร์ต่าง ๆ ครอบคลุมเหมือนกับ Copilot บนเครื่องมืออื่นทั้ง Code Completion, รองรับภาษา Swift และ Objective-C, ระบบแนะนำโค้ดแบบหลายบรรทัด, ระบบฟิลเตอร์เนื้อหา และอื่น ๆ

ในการใช้งาน GitHub Copilot สำหรับ Xcode ต้องมีไลเซนส์ของ Copilot ด้วย ซึ่งรองรับทั้งผู้ใช้งานแบบบุคคล, Business และ Enterprise

ที่มา: GitHub

Meta ไม่เห็นด้วยกับนิยาม AI โอเพนซอร์ส ซึ่ง Llama ไม่เข้าเงื่อนไข

By: arjin

on 29 October 2024 - 18:02 Tags:

Topics:

OSI ออกนิยามปัญญาประดิษฐ์โอเพนซอร์ส ต้องใช้งานได้โดยไม่ต้องขออนุญาต ไม่จำกัดการใช้งาน

By: lew

on 29 October 2024 - 09:45 Tags:

Topics:

Open Source

Open Source Initiative (OSI) หน่วยงานผู้ให้นิยามของซอฟต์แวร์โอเพนซอร์ส ประกาศนิยามของปัญญาประดิษฐ์โอเพนซอร์ส The Open Source AI Definition – 1.0 เพื่อให้อุตสาหกรรมเข้าใจตรงกันว่าการเป็นโอเพนซอร์ส (ตาม OSI) ต้องมีเงื่อนไขใดบ้าง

แนวทางนิยามของ OSI สำหรับปัญญาประดิษฐ์นั้นไม่ต่างจากซอฟต์แวร์มากนัก แต่เพิ่มนิยามรายละเอียด แยกส่วน เช่น ข้อมูลที่ใช้ฝึกนั้นต้องให้รายละเอียดเพียงพอ แม้จะไม่ต้องแชร์ข้อมูลออกมาเสมอไป, ตัวโค้ดที่ใช้รันต้องใช้สัญญาอนุญาตที่ OSI รองรับว่าเป็นโอเพนซอร์ส, และตัวพารามิเตอร์ต้องแจกในสัญญาอนุญาตที่ OSI รับรองเช่นกัน

Meta ปล่อย NotebookLlama จำลอง NotebookLM ของกูเกิลแต่ใช้ AI โอเพนซอร์สทั้งหมด

By: lew

on 28 October 2024 - 12:16 Tags:

Topics:

[ลือ] กูเกิลเตรียมเปิดตัวโมเดล Gemini 2.0 ในเดือนธันวาคม 2024

By: mk

on 26 October 2024 - 08:01 Tags:

Topics:

เว็บไซต์ The Verge อ้างข่าวลือจากแหล่งข่าวใกล้ชิดกูเกิล ว่าเราจะได้เห็นโมเดล Gemini 2.0 เปิดตัวในเดือนธันวาคม ไล่เลี่ยกับ ข่าวลือว่า OpenAI จะเปิดตัวโมเดลใหม่ Orion ซึ่งรายงานโดย The Verge เช่นกัน

แหล่งข่าวของ The Verge บอกว่าโมเดล Gemini 2.0 ไม่ได้มีประสิทธิภาพเพิ่มขึ้นมากเท่ากับที่ Google DeepMind คาดหวังไว้ แต่เขาก็บอกว่าทุกบริษัทที่พัฒนาโมเดลขนาดใหญ่เจอปัญหาลักษณะเดียวกัน ซึ่งน่าจะเริ่มเป็นทางตันของโมเดลตระกูล Transformer ที่พัฒนาอย่างก้าวกระโดดในช่วงหลายปีที่ผ่านมา

เวอร์ชันปัจจุบันของ Gemini คือ 1.5 เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2024

Claude เพิ่มฟีเจอร์วิเคราะห์ข้อมูล รันโค้ดสร้างกราฟจากไฟล์ CSV

By: lew

on 26 October 2024 - 00:22 Tags:

Topics:

Anthropic ผู้พัฒนาปัญญาประดิษฐ์ Claude.ai เพิ่มฟีเจอร์วิเคราะห์ข้อมูลในตัว เปิดทางให้ผู้ใช้สามารถแชตกับข้อมูลและแสดงผลเป็นกราฟได้ในตัว โดยรับข้อมูลเป็นตารางในรูปแบบไฟล์ CSV ที่เซฟจาก Excel หรือ Google Sheet ออกมาได้

โค้ดที่เขียนเป็นภาษาจาวาสคริปต์ และรับข้อมูลจากไฟล์ CSV ที่อัพโหลด จากนั้นสามารถทำความสะอาดข้อมูล, สำรวจข้อมูล, และวิเคราะห์ข้อมูลได้ในตัว

[ลือ] OpenAI เตรียมเปิดตัวโมเดลเวอร์ชันใหม่ Orion ในเดือนธันวาคม ยังไม่ชัดเรียก GPT-5 ไหม

By: mk

on 25 October 2024 - 15:52 Tags:

Topics:

OpenAI

Rumors

เว็บไซต์ The Verge รายงานข่าวจากแวดวงว่า OpenAI เตรียมเปิดตัวโมเดลเวอร์ชันสำคัญตัวใหม่โค้ดเนม Orion ในเดือนธันวาคมนี้ แต่ตอนนี้ยังไม่ชัดเจนว่าจะเรียกชื่ออย่างเป็นทางการว่า GPT-5 หรือไม่

ตามข่าวบอกว่าในช่วงแรกๆ Orion จะยังไม่เปิดให้ใช้งานทั่วไปผ่าน ChatGPT แบบที่แล้วๆ มา แต่จะเปิดให้บริษัทพาร์ทเนอร์ใกล้ชิดลองใช้งานก่อน เพื่อนำ Orion ไปใช้กับผลิตภัณฑ์ของพาร์ทเนอร์เอง ตัวอย่างคือไมโครซอฟท์จะเริ่มโฮสต์ Orion บนระบบ Azure ในเดือนพฤศจิกายน "เป็นอย่างเร็ว"

Meta เปิดตัวโมเดล Llama 3.2 รุ่น 1B & 3B Quantized ลดขนาดให้เล็กพิเศษ รันในมือถือได้

By: mk

on 25 October 2024 - 07:41 Tags:

Topics:

Llama

กูเกิลโอเพนซอร์ส SynthID Text ซอฟต์แวร์ใส่ลายน้ำในข้อความเพื่อบอกว่าสร้างโดย AI

By: mk

on 24 October 2024 - 16:31 Tags:

Topics:

DeepMind

Google

Google DeepMind เปิดซอร์สโค้ด SynthID Text ตัวช่วยสร้างลายน้ำเพื่อบอกว่าข้อความสร้างด้วย AI เพื่อนำไปใช้ตรวจสอบได้ในอนาคต

Google DeepMind มี SynthID สำหรับทำลายน้ำลงในภาพ AI อยู่ก่อนแล้ว กรณีของภาพ ทุกคนคงนึกออกว่าการแทรกลายน้ำที่แยกด้วยสายตามนุษย์ไม่เห็นคงทำได้ไม่ยากนัก เพราะในหนึ่งภาพมีปริมาณข้อมูลอยู่มาก การแทรกลายน้ำเพิ่มไปอีกหน่อยคงไม่ใช่เรื่องยาก แต่เมื่อต้องใส่ลายน้ำลงในข้อความ text ล้วนๆ จะทำอย่างไร

SynthID Text ใช้หลักการว่า โมเดลภาษา LLM คือ "เครื่องพ่นคำ" คาดเดาคำถัดไปจากความน่าจะเป็น โดยคำหรือ token ที่มีค่าความน่าจะเป็นสูงสุดจะถูกคัดเลือกออกมาเป็นผลลัพธ์ให้ผู้ใช้เห็น

Hugging Face เปิดซอฟต์แวร์ HUGS ใช้รันโมเดลบนเครื่องเซิร์ฟเวอร์หลากหลาย ให้คนอื่นเช่าใช้งาน

By: mk

on 24 October 2024 - 15:49 Tags:

Topics:

Hugging Face

Cloud Computing

คนในแวดวง AI คงรู้จักบริษัท Hugging Face ในฐานะศูนย์รวมคลังโมเดลขนาดใหญ่ (มีโมเดลเกิน 1 ล้านตัวแล้ว) วิธีการหารายได้ของ Hugging Face ที่ผ่านมาคือการให้เช่าเซิร์ฟเวอร์สำหรับเทรน-ปรับแต่ง-รันโมเดลเหล่านี้ได้ทันที

คราวนี้ Hugging Face ขยายโมเดลธุรกิจของตัวเอง โดยนำซอฟต์แวร์ที่ใช้รันโมเดลข้างต้น เปิดให้ลูกค้าเช่าใช้งานซอฟต์แวร์นี้บนระบบไอทีของตัวเองได้ด้วย ใช้ชื่อว่า Hugging Face Generative AI Services หรือตัวย่อ HUGS

OSS-Fuzz-Gen โครงการใช้ LLM ค้นหาบั๊กพบช่องโหว่ใน OpenSSL, เป็น CVE แรก

By: lew

on 24 October 2024 - 11:26 Tags:

Topics:

Security

OpenSSL

โครงการ OSS-Fuzz รายงานถึงช่องโหว่ CVE-2024-9143 ของ OpenSSL ที่พบจากโครงการย่อย OSS-Fuzz-Gen โดยมีความเป็นไปได้ที่จะเป็นช่องโหว่ remote code execution แม้น่าจะโจมตีได้ยากก็ตาม ความพิเศษของช่องโหว่นี้คือมันเป็น CVE แรกที่ OSS-Fuzz-Gen ได้

ตอนนี้ OSS-Fuzz-Gen พบบั๊กแล้วจำนวน 26 รายการตั้งแต่ปลายปีที่แล้ว และยังมีบั๊กจำนวนหนึ่งยังไม่เปิดเผย แต่บั๊กก่อนหน้านี้ไม่ได้ให้เลข CVE เอาไว้

ช่องโหว่นี้เกิดจากการตั้งค่า encoding X9.62 ที่กรณีปกติแล้วไม่มีการใช้งานกันมากนัก แม้จะเป็นช่องโหว่ remote code execution จริงก็ความเสี่ยงไม่สูงนัก แต่แอปพลิเคชั่นที่ได้รับผลกระทบต้องมีการใช้งานที่พิเศษ

JetBrains เปิดตัว Mellum โมเดลภาษาสำหรับเขียนโค้ด ช่วยเติมโค้ดเร็วกว่า LLM ทั่วไป

By: mk

on 24 October 2024 - 08:10 Tags:

Topics:

JetBrains

Development

ค่าย JetBrains มีบริการใช้ AI ช่วยเขียนโค้ดชื่อ JetBrains AI Assistant ประมวลผลที่ฝั่งเซิร์ฟเวอร์ เปิดบริการมาตั้งแต่ปี 2023 โดยใช้โมเดลภาษาจากหลายค่ายผสมกัน ที่เคยระบุชื่อไว้คือจาก OpenAI และ Google LLM

ล่าสุด JetBrains เปิดตัวโมเดลภาษาของตัวเองชื่อ Mellum ที่บอกว่าสร้างมาเพื่องานช่วยเติมโค้ด (code completion) โดยเฉพาะ เมื่อเป็นโมเดลสำหรับงานเขียนโค้ดอย่างเดียว ทำให้โมเดลมีขนาดเล็ก ช่วยเติมโค้ดได้เร็วกว่าโมเดลภาษาอื่นๆ ในท้องตลาด

แม่เด็กวัยรุ่นฟ้องบริษัท AI หลังลูกติดแชตกับ AI นานหลายเดือนก่อนฆ่าตัวตาย

By: lew

on 23 October 2024 - 23:55 Tags:

Topics:

Megan Garcia แม่ของ Sewell Setzer III เด็กชายวัยรุ่นสหรัฐฯ อายุ 14 ปี ยื่นฟ้องต่อบริษัท Character.AI โดยระบุว่าบริการของบริษัทเป็นอันตรายต่อเด็ก ทำเหมือนคนจริงจนเด็กติด

คำฟ้องระบุว่า Setzer เริ่มติดโทรศัพท์ตั้งแต่กลางปี 2023 และตัดขาดตัวเองจากโลกภายนอกมากขึ้นเรื่อยๆ โดยที่ครอบครัวไม่รู้ว่าที่จริงแล้วเขาเอาแต่คุยกับ Dany ตัวละครในแอป Character.AI การเสพติดการคุยกับตัวละครมากขึ้นเรือ่ยๆ จนเขาเขียนในบันทึกว่าเขารัก Dany

อาการติดโทรศัพท์หนักขึ้นจนพ่อแม่ของ Setzer ต้องยึดโทรศัพท์ แต่เขาก็ขโมยกลับมา และแชตกับ Dany โดยบอกกับ Dany ว่าจะกลับบ้านไปหา และบอตก็สนับสนุนว่าอยากให้มาหา Setzer ก็ฆ่าตัวตายในที่สุด

Runway เปิดตัว Act-One เครื่องมือสร้างวิดีโอด้วย AI ที่เคลื่อนไหวตามบุคคล ไม่ต้องใช้อุปกรณ์เพิ่ม

By: arjin

on 23 October 2024 - 20:20 Tags:

Topics:

Runway

Runway สตาร์ทอัปที่เน้นโมเดลปัญญาประดิษฐ์สำหรับสร้างวิดีโอ เปิดตัว Act-One เครื่องมือสร้างวิดีโอด้วย AI ที่ให้รายละเอียดตรงตามความต้องการมากขึ้น เพราะใช้อินพุทเพิ่มเติมคือวิดีโอบันทึกใบหน้าบุคคล จากนั้น Act-One จะนำสีหน้า ดวงตา การแสดงออก คำพูด มารวมกับคาแรกเตอร์ที่สร้างจาก AI ออกมาเป็นคลิปวิดีโอที่กลมกลืนผ่านโมเดล Gen-3 Alpha

การสร้างภาพอนิเมชันเคลื่อนไหวจากใบหน้าและคำพูดของนักแสดง ไม่ใช่ของใหม่ในวงการการผลิตคอนเทนต์ แต่วิธีการทำงานของ Act-One ที่ใช้อินพุทเป็นคลิปวิดีโอของนักแสดงเท่านั้น ไม่ต้องใช้อุปกรณ์เสริมตรวจจับตำแหน่งต่าง ๆ ทำให้การสร้างภาพเคลื่อนไหวดังกล่าวง่ายขึ้น ทั้งสำหรับงานการผลิตอนิเมชันและภาพยนตร์แนว Live Action

IBM เปิดตัวโมเดลโอเพนซอร์ส Granite 3.0 ประสิทธิภาพดีกว่า Llama 3.1 และ Mistral

By: mk

on 23 October 2024 - 08:23 Tags:

Topics:

IBM

Open Source