Amazon เปิดตัวโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ Nova ในเดือนพฤศจิกายน 2024 หลังจากนั้นเริ่มนำมาใช้ในผลิตภัณฑ์คอนซูเมอร์อย่าง Alexa+ บ้างแล้ว
ล่าสุด Amazon เปิดตัว Amazon Nova Act โมเดลย่อยในตระกูล Nova ที่เทรนมาเพื่องานควบคุมการท่องเว็บผ่านเบราว์เซอร์โดยเฉพาะ เปิดทางให้เกิดงานสาย Agentic AI ที่นำ Nova Act ไปควบคุมหน้าเว็บต่างๆ ได้ง่ายผ่าน Nova Act SDK ที่เปิดให้นักพัฒนาภายนอกเข้ามาเชื่อมต่อ
Nova Act นั้นทำงานคล้ายๆ กับ OpenAI Operator หรือ Gemini Mariner ที่เปิดตัวไปก่อนแล้ว จุดเด่นของ Nova Act คือเป็นโมเดลที่ปรับแต่งมาเพื่องานลักษณะนี้ งานอ่านเว็บ ควบคุมเว็บ รู้จักไอคอนต่างๆ บนหน้าเว็บ (เช่น ระบบรีวิวแบบ 5 ดาวที่นิยมกัน) ควบคุม UI ที่พบบ่อยๆ หน้าเว็บ เช่น ตัวเลือกวันที่ ตัวเลือกเมืองจากแผนที่ ฯลฯ จึงทำได้ดีกว่าโมเดลคู่แข่งระดับเดียวกัน
Nova Act ยังมาพร้อมกับ SDK ที่เตรียมมาพร้อมสำหรับการสั่งงานหน้าเว็บที่ใช้บ่อยๆ (search, checkout, answer questions about the screen) สั่งเงื่อนไขพิเศษที่ซับซ้อน (don’t accept the insurance upsell) รวมถึงการทำงานแบบ headless โดยไม่ต้องโชว์ภาพให้เห็นตลอดเวลา
ที่มา - Amazon, Amazon AGI Blog
Comments
เหมาะกับการเอาไปสร้างบอตกดบัตรคอน
The Dream hacker..
😡😡😡
เอาจริงๆ ขนาด screen reader ยังเข้าถึงลำบากเลยนะ ตัวเลือกวันที่ ตัวเลือกแผนที่พวกนี้... แต่กลายเป็นบอตจะเข้าถึงได้ดีกว่าซะแล้ว เห้อ
@ Virusfowl
I'm not a dev. not yet a user.