ปีที่แล้วกูเกิลประกาศโครงการความร่วมมือระหว่างกูเกิลและโรงพยาบาลราชวิถี ในการใช้ปัญญาประดิษฐ์มาวิเคราะห์ภาวะเบาหวานขึ้นจอประสาทตา (diabetic retinopathy - DR) ล่าสุดกูเกิลก็เผยแพร่รายงานวิจัย การประเมินผลโดยใช้มนุษย์เป็นศูนย์กลาง (human-centered evaluation) ของการนำระบบปัญญาประดิษฐ์มาใช้ในการโรงพยาบาลจริงครั้งนี้
รายงานนี้เล่าถึงประสบการณ์ที่ทีมวิจัยได้สังเกตกระบวนการคัดกรอง DR ทั้งก่อนการนำปัญญาประดิษฐ์เข้าไปทดสอบและหลังจากเริ่มนำปัญญาประดิษฐ์ให้ทดสอบ โดยเก็บข้อมูลจากคลีนิก 11 แห่งในปทุมธานีและเชียงใหม่ โดยระบบทุกวันนี้อาศัยพยาบาลเป็นผู้ประเมินเบื้องต้นว่าภาพดวงตาที่ได้มีความผิดปกติหรือไม่ หากดูไม่พบความผิดปกติก็จะรวบรวมเป็นชุดส่งให้จักษุแพทย์ (ophthalmologist) วินิจฉัยเป็นชุดผ่านทางอีเมลโดยต้องรอเวลาหลายสัปดาห์ หรือหากพยาบาลพบความผิดปกติก็จะส่งภาพตรงให้จักษุแพทย์ผ่านแอปแชตซึ่งหลายครั้งแพทย์ก็อ่านผลให้ในไม่กี่ชั่วโมงหรือไม่กี่วัน
ระบบปัญญาประดิษฐ์ของกูเกิลน่าจะทำให้กระบวนการอ่านผลภาพกินเวลาเพียง 10 นาทีเท่านั้น
หลังนำปัญญาประดิษฐ์เข้าไปทดสอบจริง ทีมวิจัยพบความลำบากในการทำวิจัย เช่นพยาบาลต้องอธิบายคนไข้ให้เข้าใจถึงโครงการวิจัยรวมถึงต้องอธิบาย "deep learning" ด้วย นอกจากนี้การเข้าโครงการวิจัยนั้นเมื่อผลจากปัญญาประดิษฐ์ออกมาแล้วบางครั้งคนไข้จะต้องไปตรวจเพิ่มเติมในโรงพยาบาลปทุมธานี ซึ่งคนไข้หลายคนไม่สะดวกเดินทางทำให้หลายคนไม่ยอมเข้าร่วมโครงการเพราะเสียเวลา
ปัญหาใหญ่ที่ทีมงานพบ คือ ปัญญาประดิษฐ์ที่สร้างขึ้นออกแบบให้อ่านผลเฉพาะภาพที่ชัดเจนสมบูรณ์เท่านั้น หากภาพเบลอไปเล็กน้อยหรือมีส่วนมืดไปบ้าง แม้ระบบจะอ่านผลได้ความมั่นใจสูงเพียงใดก็จะคืนค่าว่าไม่อ่านผลทันทีเพื่อความมั่นใจ การเก็บผล 6 เดือนแรก มี 3 คลีนิกรายงานว่าระบบไม่ยอมอ่านผลบ่อยครั้งทีมงานเข้าไปตรวจดูพบว่าเครื่องปฎิเสธไม่อ่านผล 21% (393 ภาพจาก 1838 ภาพ) โดยหลายครั้งปัญหาคุณภาพภาพเกิดจากการถ่ายภาพดวงตาในห้องที่ไม่ได้มืดสนิท แต่เป็นสภาพแวดล้อมปกติที่คลีนิกทำงานอยู่ก่อน
เมื่อระบบระบุว่าภาพอ่านผลไม่ได้ ระบบจะแจ้งให้พยาบาลส่งตัวคนไข้ไปยังโรงพยาบาลทุกครั้ง บางครั้งพยาบาลถ่ายภาพดวงตาดวงเดียวสองครั้งโดยแต่ละครั้งชัดบางส่วน เพราะสามาราถควบคุมเครื่องให้โฟกัสได้บางส่วนเท่านั้นโดยพยาบาลคาดหวังให้ระบบเข้าใจว่าภาพทั้งสองคือตาดวงเดียวกันแล้วอ่านภาพได้ถูกต้อง ข้อจำกัดในสภาพแวดล้อมทำให้การถ่ายภาพคุณภาพสูงทำได้ยาก เพราะห้องถ่ายภาพดวงตานั้นอยู่ในห้องเดียวกับโต๊ะที่พยาบาลอธิบายผลการถ่ายภาพให้คนไข้อีกคนทำให้ปิดไฟมืดไม่ได้ ทีมวิจัยแนะนำให้ถ่ายภาพดวงตาสองข้างห่างกัน 60 วินาทีเพื่อให้ถ่ายภาพได้ง่ายขึ้นแต่ในสภาพแวดล้อมจริงก็ลำบากเพราะมีคนไข้รอคิวถึง 150 คน
รายงานของกูเกิลระบุว่าปัญญาประดิษฐ์ต้องถูกฝึกให้รองรับสภาพแวดล้อมจริงให้ได้ ขณะเดียวกันก็เห็นประโยชน์เพิ่มเติมของระบบปัญญาประดิษฐ์ที่เพิ่มความมั่นใจให้กับพยาบาลในการส่งคนไข้บางคนไปยังจักษุแพทย์ให้เร็วขึ้น
รายงาน A Human-Centered Evaluation of a Deep Learning System Deployed in Clinics for the Detection of Diabetic Retinopathy เผยแพร่ในงานประชุมวิชาการ CHI '20: Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems ที่จัดขึ้นระหว่างวันที่ 25-30 เมษายนในฮาวาย
ที่มา - Google Blog
Comments
ใช่ครับมนุษย์มีความสามารถในด้านการมองภาพเบลอ ไม่ว่าจะเซนเซอร์หนาขนาดไหนก็สามารถแปลผลได้ด้วยตาเปล่า ตรงนี้ AI ยังสู้ไม่ได้ครับ
อันนี้ไม่น่าจริงครับ ให้ AI แปลผลจริงๆ น่าจะแม่นกว่ามนุษย์อีก แต่เราจะยอมใช้ AI ที่ความแม่นยำลดลงไม่เป็นไปตามสเปคที่ประกาศไว้เพราะใส่ภาพเบลอ?
อย่างกรณีนี้เขาใส่ตัวป้องกันให้ปฎิเสธภาพทิ้งไปเลย
lewcpe.com, @wasonliw
ไม่จริงครับ หลายๆงานที่มนุษย์แปลผลไม่ได้ AI สู้ได้สบายมาก
จะเล่นมุกว่าคนเรามองทะลุ censor ได้ในหนังญี่ปุ่นใช่ป่ะ ฮา
พออ่านถึงบรรทัดนี้ก็ถึงบางอ้อเลย XD
AI ถ้า เทรนมากพอ จะแม่นกว่า ผิดพลาดน้อยกว่ามนุษย์ครับ
มนุษมีขีดจำกัดในการเทรนนิ่ง หมอคนนึงอาจจะมองภาพได้ หลักหมื่นภาพตลอดชั่วชีวิตที่เป็นหมอ
แต่ AI สามารถเทรนนิ่งภาพเป็นล้านได้ภายในไม่กี่ชั่วโมง
แต่ถึงกระนั้น การใช้ AI น่าจะเอาไว้วิเคราะห์เบื้องตนแต่คนตัดสินใจก็เป็นหมอ หรือคนปกติอีกที
มนุษย์มีความสามารถในด้านการทำนายข้อมูลที่ไม่สมบูรณ์ หรือไม่ครบถ้วนโดยใช้พลังงานประมวลผลน้อยกว่า AI น่าจะถูกต้องมากกว่านะครับ เช่น หากเรามีแบงค์ขาดเหลือแค่ 10% เอาไปให้คนอื่นดู อาจมีคนบอกได้ว่ามันคือแบงค์อะไร ในทางกลับกันถ้า AI ถูกเทรนมาด้วยแบงค์ที่สมบูรณ์ เจอแบงค์ขาดเหลือเท่านี้ อาจไปไม่เป็น ยกเว้นเก็บ Parameter ลักษณ์เฉพาะของวัตถุ เช่น สี เอาไว้ มันเป็นความสามารถที่ AI พยายามเลียนแบบ แต่ยังห่างไกล
ในทางกลับกันมนุษย์ก็มีข้อจำกัดเรื่อง Human Error แล้วก็ความเมื่อยล้านั่นแหล่ะครับ
โรงบาล -> โรงพยาบาล
คลีนิค -> คลินิก
ปัญญาประดิษฐ์จ้องถูกฝึก -> ปัญญาประดิษฐ์ต้องถูกฝึก
มาใช้ในการโรงบาล > มาใช้ในโรงพยาบาล
ขอบคุณทั้งสองท่านครับ
lewcpe.com, @wasonliw
ผมว่า AI ควรให้ข้อมูลกับหมอให้มากที่สุด มากกว่า
ใช้ Hw ที่มันช่วยแก้ปัญหาจุดนี้นี้ได้น่าจะดีนะ ภาพเบลอบราๆ Model ทำนายมันดีอยู่แล้วแค่สภาพแวดล้อมจำกัดมากๆ เข้าใจเลยทำไมผลออกมาแบบนั้น
มือใหม่!! ใหม่จริงๆนะ
ผมว่ามันแน่นจนน่าเกลียดครับ ระบบแบบนี้คงกะมาช่วยอำนวยความสะดวกให้รพ. แน่นๆ แต่พอเจอแน่นระดับที่ต้องมีคนไข้อยู่ในห้องพร้อมกันหลายๆ คน พยาบาลไม่กล้าถ่ายซ้ำเพราะเสียเวลา 4-5 นาที แล้วมีคนไข้รออีกเป็นร้อย
ถ้าแน่นแบบคิว 20-30 คนแบบนั้นใช้งานได้เต็มๆ คงไม่แย่ขนาดนี้
lewcpe.com, @wasonliw
paper เล่าเรื่อง deployment ใน real env. อ่านแล้วได้ความรู้ดีครับ