บทความนี้ได้รับการสนับสนุนจากทางไมโครซอฟท์ เพื่อประชาสัมพันธ์เรื่อง Microsoft Openness ที่กล่าวถึงความเป็นมิตรของเทคโนโลยีของไมโครซอฟท์ต่อโอเพนซอร์ส
คำถามว่าคนที่ชนะการแข่งขันรายการต่างๆ แล้วไปไหนกันบ้าง วันนี้เราจะมาพบกับกลุ่มน้องๆ จากมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี ผู้ชนะเลิศ Imagine Cup Thailand 2014 ประเภท Innovation จากโครงการ Public Eye ซึ่งเป็นแอพพลิเคชั่นบน Windows Phone ที่เสนอแนวทางให้เราสามารถรับรู้เรื่องราวรอบข้างได้ข้อมูลทั่วๆ ไปที่เราโพสบนเครือข่ายสังคมออนไลน์กันอยู่ทุกวัน เช่น การโพสบ่นรถติด รายงานอุบัติเหตุ หรือติชมบริการต่างๆ โดยมีเอนจิน DOM ที่ประมวลภาษาไทยและอังกฤษเพื่อดึงข้อมูลออกมาจากข้อความที่เราต้องการ
หลายเดือนหลังจากชนะโครงการ Imagine Cup Thailand ตอนนี้ทีมงานทำอะไรกันอยู่ และโครงการยังคงเดินหน้าจากตอนที่เป็นโครงการเพื่อการส่งประกวดหรือไม่ ติดตามกันได้ในบทสัมภาษณ์นี้
ตอนนี้เราเรียนปริญญาโทกันต่อหลังจากเรียนจบปริญาตรี และส่วนหนึ่งก็ยังทำงานพัฒนา DOM
ตัว Ask DOM เองเป็นแอพพลิเคชั่นบนสมาร์ทโฟน ตอนนี้เราโฟกัสอยู่กับเอนจิน DOM ด้านหลังที่จะนำมาวิเคราะห์ข้อมูลจากเครือข่ายสังคมออนไลน์
ตอนแรกที่เราออกแบบ Ask DOM เรามุ่งให้มันตอบคำถามเชิงสังคม เช่นมีเหตุการณ์ในพื้นที่ไหนที่เราควรหลีกเลี่ยง แต่ตอนนี้เราก็พัฒนาให้มันสามารถดึงข้อมูลของแบรนด์ต่างๆ มาวิเคราะห์ได้ด้วย
เราพัฒนาบน Hadoop และใช้ระบบฐานข้อมูลอย่าง MongoDB และรันระบบวิเคราะห์บน Azure
ที่จริงแล้วโครงงานนี้เป็นโปรเจคจบปริญญาตรี จนถึงตอนนี้ก็ประมาณปีครึ่งแล้วที่เราพัฒนามา
ที่จริงแล้วเราได้ไอเดียโปรเจคนี้จากตอนไปฝึกงาน ที่ในกลุ่มเรามีสามคนที่ไปฝึกงานพร้อมกันที่[ศูนย์วิจัย IHPC] (http://www.ihpc.a-star.edu.sg/) ที่สิงคโปร์ ที่ร่วมมือกับห้องวิจัยที่มหาวิทยาลัย ที่ศูนย์วิจัยที่นั่นก็มีงานวิจัยด้านนี้อยู่ เราก็กลับมานั่งคุยกันว่าเมืองไทยควรจะทำอะไร
หลังจากเราเริ่มได้โครงไอเดียก็เริ่มคิดกันว่าจะส่งประกวดโดยก่อนหน้าก็ส่งประกวด NSC (National Software Contest โดย เนคเทค) มาก่อนเพราะประกวดก่อนหลายเดือน ตอนนั้นก็ยังไม่สมบูรณ์มาก ก็พัฒนากันต่อมาเรื่อยๆ ต่อมาถึงมาส่ง Imagine Cup หลังจากกลับมาแล้วก็ยังส่งประกวดเจ้าฟ้าไอที, Thailand ICT Award, และรายการ InnoServ: International
ตอนนี้เราอยู่ระหว่างช่วงเริ่มโครงการกับบริษัท G-ABLE ก็เข้าไปนั่งทำงานในออฟฟิศ และมีเงินก้อนแรกมาให้ ส่วนโครงการหากขายได้ก็เป็นรูปแบบการแบ่งรายได้กัน ทาง G-ABLE ช่วยให้พื้นที่ทำงาน ช่วยทำตลาด และให้คำแนะนำจากทีมวิจัยและพัฒนาว่าเราจะทำอย่างไรจึงจะปรับปรุงให้สินค้าพร้อมสำหรับใช้งานได้
ตอนนี้เราก็ยังส่งโครงการนี้ไปแข่ง ระหว่างเรียนปริญญาโทเราก็ยังอ่านงานวิจัยและเทียบความแม่นยำอยู่เรื่อยๆ โดยรวมตอนนี้น่าจะดีกว่าระบบอัตโนมัติทั่วไปพอสมควร
ตอนนี้เราก็ได้รับความสนับสนุนจากไมโครซอฟท์ผ่านโครงการ BizSpark ซึ่งให้การสนับสนุนสามารถใช้ Azure ฟรี
ได้ลองแล้ว แต่ปรากฎว่าบน Azure ให้บริการได้ยืดหยุ่นกว่า ความต้องการหนึ่งของเราคือฐานข้อมูล MongoDB ขนาดใหญ่ถึง 300GB ตอนที่เราลองเจ้าอื่นๆ บางเจ้าแม้จะมี MongoDB ก็ยังไม่มีแพลนเซิร์ฟเวอร์ที่ใหญ่ขนาดนั้น
ตอนนี้เป็นลินุกซ์ที่รันบน Azure ที่จริงแล้วเราเคยลองใช้งาน HDInsight ของ Azure เอง แต่พบว่าตัว HDInsight จะได้เปรียบมากตอนที่ฟาร์มมีขนาดใหญ่มาก เพราะ Azure จะจัดการให้เองทั้งหมด โดยเฉพาะการรันนานๆ ที่อาจจะมีข้อความเตือนมาว่าจะมีเครื่องดาวน์ในอีกสองวันข้างหน้า แต่ถ้าเป็น HDInsight ระบบก็จัดการให้เองทั้งหมด แต่ตอนนี้เรายังใช้งานทีละไม่กี่เครื่องเราจึงเลือกรันลินุกซ์เซิร์ฟเวอร์ด้วยตัวเองก่อน
[ข้อมูลเพิ่มเติม]: ตอนนี้เอง Azure ก็มีเซิร์ฟเวอร์ที่เป็นลินุกซ์รันอยู่ถึง 20% ของเซิร์ฟเวอร์ทั้งหมด สำหรับในไทยเอง เซิร์ฟเวอร์ที่เป็นลินุกซ์ทำงานกว่าครึ่งจากความนิยมของลูกค้า ตัวแทนของไมโครซอฟท์ให้ข้อมูลเพิ่มเติมว่างานรูปแบบหนึ่งที่ได้รับความนิยมสูงมากในการใช้คลาวด์คืองานประมวลผล Big Data รูปแบบเดียวกับโครงการ DOM นี้ เครื่องมือสำหรับ Big Data จำนวนมากยังทำงานบนลินุกซ์ ทางไมโครซอฟท์เองก็ทำงานร่วมกับหน่วยงานพัฒนามาตรฐานเปิดและหน่วยงานดูแลซอฟต์แวร์โอเพนซอร์ส เพื่อให้แน่ใจว่าระบบเหล่านี้สามารถทำงานร่วมกับ Azure ได้เป็นอย่างดี
เกินครับ เพราะ BizSpark เองสนับสนุนหลายส่วนแต่เราเน้นไปที่การใช้ Azure เป็นหลัก ทำให้เกินเครดิตที่ไมโครซอฟท์ให้ไปมาก
แต่ตอนนี้ก็กำลังคุยกับทางไมโครซอฟท์ไว้บ้าง ทางด้านไมโครซอฟท์เสนอว่ายังมีโครงการ BizSpark Plus ที่ให้ทุนเยอะกว่านี้ แต่มีระยะเวลาจำกัดที่ 12 เดือน คำแนะนำคือรอให้มีลูกค้าก่อน และค่อยเริ่มเข้าโครงการ BizSpark Plus
ตอนนี้มีลูกค้าใช้งานจริงแล้ว แต่ระหว่างนี้เราก็ยังต้องให้ลูกค้าช่วยให้ความเห็นเราอยู่เรื่อยๆ
Comments
300 GB ... ฟังแล้วแทบเป็นลม
ลงทุนสูงมากเลยครับ(ใช้ทรัพยากรสูง)อยากรู้จังว่ากลุ่มลูกค้าจะเป็นใคร ผมว่ามันเอาประมวลผลทางสถิติได้มากกว่านี้แหะ แล้วมันจะได้กับลูกค้าองค์กรด้วย
ตรง [ศูนย์วิจัย IHPC] (http://www.ihpc.a-star.edu.sg/) เคาะเกินมามันเลยไม่เป็นลิงก์อะครับ ศูนย์วิจัย IHPC
@ Virusfowl
I'm not a dev. not yet a user.