Bixby เป็นระบบผู้ช่วยส่วนตัวของซัมซุง ที่เริ่มใช้ใน Galaxy S8 แต่ฟีเจอร์ส่วนของ Bixby Voice ที่สั่งงานด้วยเสียงกลับล่าช้ากว่ากำหนด และเพิ่งเปิดให้ผู้ใช้ Galaxy S8 ทั่วโลกใช้งานเมื่อไม่กี่วันที่ผ่านมา (ก่อน Note 8 เปิดตัวแค่ไม่กี่วัน)
ต้องบอกว่าซัมซุง "คิดการใหญ่" กับ Bixby ถึงขนาดใส่ปุ่มเรียกมันเข้ามาโดยเฉพาะ และเราคงเดากันได้ว่าจะได้เห็นสารพัดผลิตภัณฑ์ตระกูล Bixby ตามมาอีกมากในอนาคต
เพื่อให้เข้าใจว่าซัมซุงคิดจะทำอะไร และ Bixby มีความแตกต่างจากระบบผู้ช่วยส่วนตัวค่ายอื่นๆ อย่างไรบ้าง เราจึงลองทดสอบการใช้งานจริงของ Bixby Voice บน Galaxy S8 กัน
พื้นฐานของ Bixby มาจากบริษัท Viv Labs ของผู้สร้าง Siri ที่ซัมซุงซื้อกิจการเข้ามาในเดือนตุลาคม 2016 แต่จริงๆ แล้ว Bixby เป็นชื่อแบรนด์ที่ครอบคลุมบริการหลายตัว ได้แก่
ในบทความนี้จะสนใจเฉพาะ Bixby Voice เท่านั้น และคำว่า Bixby จะหมายถึง Bixby Voice ยกเว้นจะระบุเป็นอย่างอื่น
หน้าตาของ Bixby Home
หลังจากซัมซุงเปิดให้ใช้ Bixby Voice ทั่วโลกแล้ว ผู้ใช้ Galaxy S8 ในไทยจะได้รับแจ้งเตือนให้อัพเดต Bixby เป็นเวอร์ชันล่าสุด (การอัพเดตต้องล็อกอินบัญชี Samsung Account) หลังจากนั้นเราจะเข้าสู่หน้าจอการตั้งค่า Bixby สำหรับการใช้งานเป็นครั้งแรก
หน้าจอแรกเลยคือเลือกภาษาที่ต้องการ (ตอนนี้ยังรองรับเฉพาะภาษาเกาหลีกับภาษาอังกฤษ) และยอมรับเงื่อนไขการใช้งานด้านความเป็นส่วนตัว
ถัดไปจะเป็นการแนะนำวิธีการใช้งาน และให้เราเทรนเสียงพูดของเรา เพื่อเพิ่มความแม่นยำในการตรวจจับเสียงของระบบ
วิธีการใช้งาน Bixby มีด้วยกัน 2 ทางคือ พูดคำว่า "Hi Bixby" เพื่อให้ระบบตื่นมาฟังคำสั่งของเรา กับกดปุ่ม Bixby ที่ด้านซ้ายของตัวเครื่อง (ใต้ปุ่มปรับระดับเสียง) ค้างไว้แล้วพูดคำสั่งได้เลย เมื่อพูดเสร็จก็ปล่อยมือ (เหมือนการใช้วิทยุคลื่นสั้น)
ผมพบว่าการกดปุ่มเป็นวิธีที่สะดวกกว่ามาก เหตุเพราะเราไม่ต้องเสียเวลาพูดคำว่า Hi Bixby ทุกรอบ สามารถกดปุ่มค้างแล้วพูดได้ทันที (ถือเป็นเหตุผลที่ปุ่มนี้ควรค่าแก่การดำรงอยู่บนตัวเครื่อง แม้ผู้ใช้บางคนจะไม่ชอบก็ตาม) ส่วนการใช้วิธีพูดว่า Hi Bixby อาจมองว่าเป็นทางเลือกที่ช่วยอำนวยความสะดวก ในกรณีที่เราไม่ต้องการเอื้อมมือไปกดปุ่มที่ตัวเครื่อง (เช่น วางมือถือไว้บนโต๊ะ)
ผมพบว่าค่าดีฟอลต์ของระดับการดักคำว่า Hi Bixby (wake-up sensitivity) ที่ตั้งมาเป็น low ค่อนข้างน้อยไปหน่อย พอเปลี่ยนค่าเป็น medium แล้วก็ช่วยให้ระบบดักเสียงเรียกของเราได้ดีขึ้น
ปกติแล้ว เวลาเราเรียก Bixby ขึ้นมา (ไม่ว่าจะด้วยวิธีไหน) มันจะแสดงไอคอนรูปตัว B ลอยทับบนหน้าจอปกติ พร้อมแสดงข้อความที่ฟังจากเสียงพูดของเรา แต่เราสามารถสั่งมันทำงานในโหมด fullscreen ได้ด้วย ซึ่งอินเทอร์เฟซจะคล้ายกับ Siri คือเป็นพื้นหลังไล่สี gradient (เปลี่ยนสีเองได้) พร้อมไอคอนวงกลมที่ด้านล่างของหน้าจอ
โหมดเต็มหน้าจอของ Bixby จะแสดงข้อมูลง่ายๆ ให้เราได้ด้วย เช่น สภาพอากาศ หรือผลการค้นข้อมูลจากอินเทอร์เน็ตให้เรา
การเรียกใช้ Bixby สามารถทำได้ทุกขณะใช้งาน สั่งงานได้แม้เราล็อคหน้าจอด้วยรหัสผ่านหรือ PIN แต่สิทธิการทำงานของ Bixby จะแตกต่างกันไปด้วย เช่น เราสามารถถามข้อมูลทั่วๆ ไปบนอินเทอร์เน็ตหรือเปิดแอพกล้องขึ้นมา แต่ถ้าต้องการสั่งให้ทำอะไรมากกว่านั้นอย่างการเปิดแอพทั่วไป Bixby จะแสดงข้อความให้เราปลดล็อคเครื่องก่อน
อย่างแรกเลยคือถามตอบคำถามได้เหมือนกับผู้ช่วยส่วนตัวอื่นๆ เช่น ถามเวลา สภาพอากาศ หรือข้อมูลบนอินเทอร์เน็ตเหมือนกับการค้นเว็บทั่วไป เราสามารถถามว่า What is the capital of Thailand หรือ Who is Barack Obama ได้เลย
แต่คำถามนี้ Bixby ตอบไม่ได้
ถ้าเทียบกับ Google Assistant แล้ว ต้องบอกว่า Bixby ยังไม่สามารถสนทนาต่อเนื่องได้ เช่น เราไม่สามารถถามว่า "Taylor Swift คือใคร" แล้วตามด้วยคำถามว่า "เธออายุเท่าไร" ได้ เพราะ Bixby มองว่าเป็นประโยคสนทนาที่ไม่เกี่ยวข้องกัน
แต่สิ่งที่ทำให้ Bixby ค่อนข้างแตกต่างไปจากคู่แข่งรายอื่นๆ คือมันสามารถ "ควบคุม" การทำงานของ OS และแอพได้ด้วยเสียง แถมยังสามารถสั่งงานที่ซับซ้อนเป็นประโยคยาวๆ รวดเดียวได้ เช่น
อธิบายง่ายๆ คือในแอพที่ซัพพอร์ตมีปุ่มอะไรให้กดบ้าง เราสามารถสั่ง Bixby ให้กดปุ่มแทนเราได้แทบทั้งหมด
ปัญหาของแนวทางนี้คือ ในแอพที่ซัพพอร์ตมันจะทำงานได้ค่อนข้างดี แต่มันจะใช้กับแอพที่ไม่ซัพพอร์ตไม่ได้เลย ดังนั้น Bixby จะใช้สั่งงานด้วยเสียงได้ดีแค่ไหน ก็ขึ้นกับปริมาณแอพที่รองรับ
แอพของระบบและแอพของซัมซุงเองย่อมซัพพอร์ต Bixby เป็นอย่างดี และซัมซุงก็พยายามซัพพอร์ตการสั่งงานด้วยเสียงกับแอพดังๆ บางตัว เช่น Facebook, Twitter, Instagram, WhatsApp, Google Play, YouTube โดยยังระบุสถานะว่าเป็นขั้นทดลอง (experimental)
ผมทดสอบการใช้ Bixby สั่งงานแอพต่างๆ และได้ผลออกมาผสมๆ ปนเปกันไป ทั้งที่เวิร์คและไม่เวิร์ค ดูได้จากวิดีโอประกอบนะครับ (วิดีโอทั้งหมดไม่มีเสียง เพราะต้องแย่งอินพุตจากไมโครโฟนกับ Bixby)
Settings
เราสามารถสั่งปรับค่าต่างๆ ใน Settings ได้ ตัวอย่างนี้คือเปิดหรือปิด mobile data ด้วยเสียงพูด
อันนี้ค่อนข้างน่าประทับใจ เราสามารถสั่ง "Open Twitter and tweet hello from Bixby" ได้จากหน้าจอใดๆ ผลคือแอพ Twitter จะถูกเรียกขึ้นมา แล้วเปิดหน้าโพสต์ข้อความทวีต ป้อนข้อความที่เราสั่งเข้าไปให้อัตโนมัติ สิ่งที่เราต้องทำมีแค่ตรวจเช็คว่าข้อความถูกต้อง แล้วพูดคำว่า "Tweet" ก็เรียบร้อย
นอกจากการโพสต์ข้อความแล้ว Twitter ยังรองรับคำสั่งอื่นๆ เช่น ค้นหาข้อมูลได้ด้วย "Open Twitter and search Thailand"
การโพสต์ข้อความแบบ Twitter ก็ใช้ได้กับ Facebook ด้วย ลองแล้วก็ได้ผลดีครับ
อย่างไรก็ตาม ผมลองโพสต์รูปลง Facebook ด้วยประโยคว่า "Open Facebook and post a recent picture" (ซึ่งตรงกับที่เขียนใน tutorial ของ Bixby เป๊ะๆ) กลับไม่สำเร็จ โดยไม่ทราบเหตุผลที่แน่ชัด
YouTube
อันนี้เป็นอีกตัวอย่างที่ทำได้บน Google Assistant ซึ่ง Bixby ก็ทำได้เหมือนกัน สั่ง "Play Taylor Swift on YouTube" ก็จะเปิดเพลงของ Taylor Swift ขึ้นมาให้เลย (ส่วนการสั่งลอยๆ แล้วจะเปิดเพลงไหนนั้น ผมได้ผลลัพธ์ไม่เหมือนกันในการสั่งแบบเดียวกัน)
Google Play
นี่เป็นตัวอย่างที่ค่อนข้างประทับใจครับ เราสามารถสั่งงานต่อเนื่องให้ติดตั้งแอพสักตัวได้โดยไม่ต้องแตะหน้าจอเลย
อย่างที่เขียนไปแล้วว่า Bixby ยังไม่รองรับการใช้งานกับแอพหลายๆ ตัว (เช่น LINE หรือ Spotify) การที่มันทำงานไม่ได้ทุกกรณี ทำให้สุดท้ายแล้วเราเลี่ยงจะใช้งาน Bixby ทั้งหมดไปเลยแทน
ส่วนของการฟังและแยกแยะเสียงพูด (speech recognition) ผมพบว่า Bixby ฟังภาษาอังกฤษสำเนียงของผมได้แย่กว่า Google Assistant อยู่พอสมควร และต้องพูดหลายครั้งมากกว่าจะได้ผลลัพธ์ตามที่ต้องการ เรื่องนี้ไม่น่าแปลกใจนักเพราะซัมซุงเองก็เคยยอมรับว่า พัฒนาระบบเสียงพูดภาษาอังกฤษล่าช้าเพราะมีข้อมูล Big Data ไม่เยอะพอ
เรื่องของคำสั่ง (query) ต่อให้ฟังออกว่าเราพูดอะไร แต่บางครั้งคำสั่งแบบเดียวกันก็ยังให้ผลแตกต่างกัน ที่ชัดที่สุดคือการพูดว่า "Weather" จะเป็นการเรียกแอพ Weather แต่การพูดว่า "Open Weather" กลายเป็นแสดงข้อมูลสภาพอากาศในตัว Bixby แทน
ในกรณีที่คำสั่งกำกวม เช่น เปิดเบราว์เซอร์ขึ้นมาแล้วสั่ง "Go Home" จะทำให้ Bixby สับสนว่าเราต้องการไปยังหน้าโฮมของเบราว์เซอร์ หรือกลับไปยังหน้าโฮมสกรีนของระบบ และขึ้นหน้าต่างมาถามว่าเราอยากได้อะไรกันแน่
ซัมซุงยังพยายามนำระบบเก็บแต้ม (gamification) มาใส่ใน Bixby ให้เราได้ค่าประสบการณ์ (XP) จากการลองคำสั่งต่างๆ ซึ่งการได้แต้มจะนับไปรวมเป็น Level เพื่อแลกเป็นรางวัลในอนาคต ตรงนี้กลายเป็นว่าข้อความแสดงว่าเราได้ XP กลายเป็นสิ่งเกะกะหน้าจอ ทำให้ดูรก และเสียประสบการณ์ที่ดีในการใช้งาน Bixby ไปมาก (ควรตัดทิ้งไปเลย)
ในภาพรวม เราสามารถสรุปได้ว่า Bixby ยังไม่สมบูรณ์อย่างที่ควรจะเป็น และซัมซุงน่าจะพัฒนามันต่อไปได้อีกมาก (ตอนนี้อาจทำได้เพียง 30-40% ของที่วางแผนไว้ ตัวเลขผมคิดเองนะครับ) สิ่งที่สามารถแก้ไขได้ไม่ยากนักคือการตรวจสอบและแยกแยะเสียงพูดให้แม่นยำขึ้น ซึ่งก็จะพัฒนาตามเวลาและปริมาณผู้ใช้ที่เพิ่มมากขึ้น
สิ่งที่ผมยังกังขาอยู่ว่าจะทำได้แค่ไหนคือการใช้ Bixby สั่งการแอพต่างๆ เพราะซัมซุงไม่มีทางอื่นนอกจากไล่ซัพพอร์ตปุ่มต่างๆ ในแต่ละแอพเอาเอง ซึ่งก็ไม่น่าจะทำได้ครบหมดทุกแอพยอดนิยม และถ้าหากแอพเปลี่ยนเวอร์ชัน เปลี่ยนตำแหน่งหรือข้อความบนปุ่ม ซัมซุงก็ต้องมาแก้ไขใหม่ทุกครั้ง สุดท้ายแล้วผู้ใช้ก็จะไม่อยากใช้งานเพราะไม่รู้ว่าเสียงที่พูดไปจะสามารถใช้การได้หรือไม่
อย่างไรก็ตาม Bixby ในตอนนี้ช่วยให้เราพอมองเห็นว่าวิสัยทัศน์และเป้าหมายของซัมซุงเป็นอย่างไร และมันน่าจะชัดเจนขึ้นเรื่อยๆ หลังเวลาผ่านไปอีก 1-2 ปี มือถือซัมซุงรองรับ Bixby มากขึ้น และอุปกรณ์อื่นๆ อย่างลำโพงอัจฉริยะหรือเครื่องใช้ไฟฟ้าของซัมซุงรองรับ Bixby โดยตรงมากขึ้นนั่นเอง
Comments
เพราะซัมซุงไม่เหมือน Google หรือ Apple ที่มีอำนาจในการออก SDK และ Feature มา(บังคับ)ให้คนทำแอพทำตามเพื่อซัพพอร์ตได้ เรื่องการรองรับแอพยอดนิยมนี่น่าจะเป็นตัวชี้ชะตาเลยผมว่าจะไปต่อได้หรือไม่ได้ไปต่อก็ตรงนี้แหละครับ
เกรงว่าจะทำให้ตัว os ใหญ่และกินพื้นที่เยอะขึ้นเป็นสองเท่า เพราะฟังก์ชันทับซ้อนกับตัว android เอง มาขึ้นเรื่ิอยๆ เช่น multi Windows, bixby,...
ผมว่าสุดท้าย Samsung จะทำให้ Bixby ทำหน้าที่แทน Homescreen ของ Android โดยทำให้ทุกอย่างทำงานด้วยเสียงแบบต่อเนื่องโดยตลอด วิธีนี้จะทำให้นำ Bixby ไปใช้บนอุปกรณ์อื่นๆ ของ Samsung ได้ด้วย โดยผู้ใช้ได้ประสบการณ์ใช้งานในแบบเดียวกัน และสุดท้ายก็ลดการพึ่งพา Google เพราะประสบการณ์ที่ผู้ใช้ได้รับทำให้สามารถใช้ Layer ล่างเป็น OS อะไรก็ได้ แต่ส่วนติดต่อผู้ใช้เป็น Bixby
ผมก็คิดว่านี้แหละ คือเจตนารมย์ของ SS แต่อุปสรรคก็ ตามเมนต์แรกว่าไว้ล่ะครับ
แล้วค่อนข้างผ่านยากด้วย
เห็นด้วยกับบทความครับ
นึกถึงตอนใช้งาน Siri ใหม่ๆ ที่ต้องสั่งเป็นภาษาอังกฤษ และด้วยสำเนียงอันแสนห่วย Siri ก็ฟังไม่รู้เรื่อง มาลองเล่น Bixby อารมย์เดียวกันเลย
oxygen2.me, panithi's blog
Device: ThinkPad T480s, iPad Pro, iPhone 11 Pro Max, Pixel 6