Google Meet มีฟีเจอร์ใช้ Gemini ช่วยฟังเสียงและสรุปการประชุมมาตั้งแต่เดือนสิงหาคม 2024 ล่าสุดกูเกิลประกาศเพิ่มฟีเจอร์ดังนี้
- caption history scrolling ถ้าอ่าน live caption สดๆ ไม่ทันตอนฟังประชุม สามารถเลื่อนไปอ่าน caption ย้อนหลังทั้งหมดได้จากหน้า Google Meet โดยตรง
- บันทึกการประชุมที่ Gemini ช่วยสรุปให้ สามารถเพิ่มคำแนะนำว่าที่ประชุมควรทำอะไรต่อ (Suggested next steps) ในรูปแบบ checklist และส่งเข้า Gmail รวมถึงสามารถมอบหมายงานแต่ละรายการให้เพื่อนร่วมทีมผ่าน Google Tasks ได้ด้วย
- บันทึกการประชุมจะมีทั้งส่วนบันทึกฉบับเต็ม (full transcript ถอดเสียงการประชุมทั้งหมด) และส่วนสรุป (summary) ที่ลิงก์ไปยังแต่ละส่วนของบันทึกให้ด้วย


นอกจากนี้ Google Vids แอพสร้างวิดีโอด้วย AI ในชุด Google Workspace ยังเพิ่มฟีเจอร์ใช้ AI ช่วยพากย์เสียงในวิดีโอให้ได้แล้ว โดยจะอิงตามสคริปต์คำพูดที่ AI สร้างให้อีกที เราสามารถเลือกสไตล์เสียงที่ต้องการได้เลย
ที่มา - Google
Comments
อีกหน่อยก็ส่ง AI เข้าประชุมแทนไปเล้ยยย แล้วให้ AI ประชุมกันเองกลายเป็น skynet
ทำเป็นเล่นไป อนาคตต่อไปหากทุกคนมี Personal AI มันก็อาจเป็นอย่างนั้นก็ได้ ส่งแค่ Avatar ไปประชุม แถมออกความคิดเห็นตาม pattern ความคิดของเราได้ ส่วนเราก็ไปเที่ยวกับครอบครัว ไม่ดีหรือครับ โดยเฉพาะผู้บริหารผมว่าอนาคตน่าจะมาแนวนี้เลยล่ะ เนื่องจากส่วนใหญ่จะมีหลายภาระงานหลายบริษัท ไปถึงก็แค่ถามว่าเป็นอย่างไงบ้าง สบายดีไหม งานที่ฝากไว้ทำถึงไหนแล้ว คราวนี้ฝากเรื่องนี้ไปคุยต่อให้หน่อยนะ แล้วสรุปให้ผมมาด้วย โอเค เริ่มประชุมกันได้ เดี๋ยวผมขอตัวไปอีกบริษัทนึงก่อนนะ แต่ฝ่ายปฏิบัติการน่าจะยังต้องเข้าประชุมเองเนื่องจากมันต้องลงรายละเอียด และมีข้อมูลหน้างานที่ AI น่าจะยังต้องใช้เวลาให้ Robot ทำงานแทนคนได้อย่างสมบูรณ์ก่อน
ภาพของผมคือ ผู้บริหารนั่งอยู่บ้านพักตากอากาศ เล่นกับลูก แล้วมีผู้ช่วยส่วนตัวที่เป็นหุ่นยนต์คอยรายงานผลความคืบหน้าของแต่ละห้องประชุมให้ฟังแบบสรุป ไม่ต้องมาฟังเรื่องโม้ไร้สาระ present ตัวเองกับผู้บริหาร เอาแต่เนื้องานมาให้ ถ้าอันไหนดูผิดปรกติก็นั่งคิดแล้วแล้วอธิบายให้ผู้ช่วยที่เป็นหุ่นยนต์ฟัง เพื่อส่งข้อมูลต่อไปยัง Avatar ที่อยู่ในห้องประชุม ผมว่าประชุมในไทยส่วนใหญ่ 10% เป็นเนื้่อ ที่เหลือมีแต่น้ำกับเรื่องคุยไปนอกเรื่องมากกว่า รวมถึงบางทีก็ลงรายละเอียดซะ ผู้บริหารนั่งมึนว่ากรูจะรู้ไปทำไมเนี่ย จ้างมรึงมาบริหารแล้วก็จัดการกันเองซิ ไปดีกว่า ถ้าไม่ใช่ช่วงเร่งส่งงานนี่เรียกว่าเป็นช่วงพักผ่อนกินกาแฟ เดินเข้าเดินออกห้องประชุมกันเป็นว่าเล่นเลยล่ะ
อ่อ หลายคนอาจไม่เห็นด้วยกับแนวคิดของผม ซึ่งผมสมมุติว่าผมมองในภาพผู้บริหารสูงสุด ซึ่งต้องมีข้อมูลจากหลายแหล่ง จากหลายบริษัท มาประกอบการตัดสินใจก่อน ดังนั้นในแต่ละการประชุมมันก็จะเป็นการแค่เข้าไปรวมรวมสถานะการณ์ปัจจุบัน แล้วให้ผู้บริหารบริษัทนั้นตัดสินใจไปในสถานะการณ์ในห้องประชุม เพราะมันไม่ใช่หน้าที่ของผู้บริหารสูงสุด ไม่งั้นคุณจะจ้างผู้จัดการทั่วไปของบริษัทนั้นมาทำไมจริงไหม ส่วนใหญ่เขาจะออกจากห้องประชุม แล้วมานั่งดูรายงานแต่ละชุดก่อนเพื่อวางแผนงานปีถัดไปมากกว่า จะมาตัดสินใจเฉพาะหน้า ยกเว้นเรื่องด่วนจริงๆ ที่ต้องการอำนาจผู้บริหารสูงสุดแทรกแซง อันนี้ผู้จัดการทั่วไปบริษัทนั้นจะกระซิบบอกก่อนเข้าประชุมอยู่แล้ว
มันคือ multi agent system ครับ จริงๆ ตอนนี้ก็พอมีหลาย framework ให้เล่นอยู่ครับ ปล่อยมันคุยกันเองไปเลย
Gemini นี่เค้ามาเงียบๆ แต่มาเรื่อยๆ นะ
มีโอกาสได้ลองบางส่วน ตัว live caption ทำงานกับภาษาไทยได้ค่อนข้างโอเคเลยครับ ถึงจะไม่ถูก 100% (มีปัญหากับการพูดทับศัพท์) แต่ก็เข้าใจได้
ขอติอันเดียวคือการแสดงผล live caption นั่นล่ะ ตัวมันใหญ่มากจนต้องย่อหน้าจอ present ลง ไม่โอเคเลย