Opera กลายเป็นเสือปืนไวแห่งกระแส Agentic AI ที่เริ่มมีบริษัทบางรายนำมาใช้งานควบคุมหน้าเว็บตามคำสั่ง (เช่น OpenAI Operator) เปิดตัวฟีเจอร์ Agent ที่ฝังมาในตัวเบราว์เซอร์เลย ใช้ชื่อว่า Browser Operator
ฟีเจอร์นี้เราสามารถพิมพ์ข้อความ prompt เพื่อสั่งให้ Opera ทำงานต่างๆ แทนเรา เช่น เข้าหน้าเว็บอีคอมเมิร์ซ ค้นหาสินค้า เลือกสี ขนาดที่ต้องการ แล้วนำใส่รถเข็นเตรียมให้ผู้ใช้ตรวจสอบอีกครั้งก่อนกดจ่ายเงิน, สามารถรับคำสั่งที่ซับซ้อนมีหลายขั้นตอนได้ เช่น สั่งซื้อตั๋วเข้าชมเกมฟุตบอลแบบกำหนดเงื่อนไข ถ้ามีตั๋วเหลือแค่บางประเภท ต้องการนั่งบริเวณไหน เป็นต้น
Opera บอกว่าการฝังฟีเจอร์ Agentic AI เข้ามาในตัวเบราว์เซอร์โดยตรง แก้ปัญหาเรื่องความปลอดภัย เพราะไม่ต้องนำข้อมูลออกจากเบราว์เซอร์เลย และตัว Operator ออกแบบมาให้รอการตัดสินใจของมนุษย์อีกครั้งในจุดสำคัญๆ เช่น กรอกฟอร์มหรือกดจ่ายเงิน
แนวทางของ Opera ยังไม่ได้พึ่งพาภาพหน้าจอเหมือนกับ Agentic AI ตัวอื่นๆ แต่เป็นการอ่าน DOM Tree ของเบราว์เซอร์เลย ถือเป็นการอ่านข้อความเว็บเพจ แทนการดูจากภาพ ช่วยให้ Browser Operator ทำงานได้เร็วกว่าการอ่านเป็นภาพ และไม่ต้องเลื่อนจอเพื่อดูหน้าเพจทีละส่วน เพราะอ่าน DOM Tree ทั้งหมดแต่แรก
ฟีเจอร์ Browser Operator ยังมีสถานะเป็นพรีวิว และเตรียมเปิดให้ทดสอบกันในเร็วๆ นี้
ที่มา - Opera
Comments
playwright agent ฝังไปเลยสินะ
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P