AlexNet ซอฟต์แวร์แยกแยะรูปภาพที่เคยเป็นจุดเปลี่ยนสำคัญของวงการ AI เมื่อปี 2012 ตอนนี้เปิดซอร์สโค้ดต่อสาธารณะ เข้าถึงได้บน GitHub
AlexNet พัฒนาโดย Alex Krizhevsky นักศึกษาปริญญาเอกชาวยูเครนที่มหาวิทยาลัย Toronto ในขณะนั้น ร่วมกับเพื่อนนักศึกษา Ilya Sutskever (ภายหลังเป็นผู้ร่วมก่อตั้ง OpenAI) และอาจารย์ของพวกเขาคือ Geoffrey Hinton (หลังจากนั้นแบ่งเวลาบางส่วนไปทำงานกับกูเกิลจนถึงปี 2023 และได้รางวัลโนเบลสาขาฟิสิกส์ในปี 2024)
Ilya Sutskever, Geoffrey Hinton, Alex Krizhevsky ในปี 2013 - University of Toronto
AlexNet ใช้เทคนิคใหม่ (ในยุคนั้น) คือ convolutional neural network (CNN) ที่เป็นจริงได้ในทางปฏิบัติด้วยการเทรนผ่านการ์ดจอเกมมิ่ง (ใช้ GeForce GTX 580 สองตัว) และสามารถแข่งขันแยกแยะภาพ ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ในปี 2012 ทำคะแนนชนะได้แบบทิ้งขาด (ความแม่นยำ 84.7% เพิ่มขึ้นจาก 74.2% ของผู้ชนะปี 2011) และกลายเป็นมาตรฐานใหม่ของวงการแยกแยะภาพ
ทีมพัฒนา AlexNet ทั้งสามคนไปตั้งบริษัทชื่อ DNNResearch แล้วขายให้กูเกิลในเวลาต่อมา และภายหลังก็แยกย้ายไปตามเส้นทางชีวิตของแต่ละคน ตัวซอร์สโค้ดต้นฉบับเวอร์ชันปี 2012 ของ AlexNet จึงกลายเป็นของกูเกิล
ในปี 2020 Alex Krizhevsky ได้แนะนำให้ Geoffrey Hinton รู้จักกับทีมของ Computer History Museum (CHM) ที่มีเป้าหมายอนุรักษ์ฮาร์ดแวร์และซอฟต์แวร์เก่า หลังจากนั้น Hinton ที่ยังทำงานอยู่กับกูเกิล ประสานให้ CHM ทำงานกับกูเกิลเพื่อค้นหาซอร์สโค้ดต้นฉบับของ AlexNet เพื่อนำมาเผยแพร่เป็นโอเพนซอร์ส ซึ่งทำสำเร็จในปี 2025
ตัวซอร์สโค้ดมีขนาดเพียงแค่ 200KB
ที่มา - Computer History Museum, University of Toronto, ZDNet
Comments
หมุดหมายนึงของมนุษยชาติ
ภาพถ่ายที่คนสาย com vison & neural network จะต้องกริ๊ตร้อง