เดือนที่แล้วไมโครซอฟท์เปิดตัว Azure Databricks บริการใหม่ในเครือ Azure สำหรับการวิเคราะห์ข้อมูลขนาดใหญ่
Azure Databricks เป็นการนำ Apache Spark มารันบนคลาวด์ ความน่าสนใจคือบริการตัวนี้เป็นความร่วมมือระหว่างไมโครซอฟท์กับบริษัท Databricks ซึ่งก่อตั้งโดยหนึ่งในผู้สร้าง Apache Spark ด้วย
จุดเด่นของ Azure Databricks คือการขยายตัวแบบไม่จำกัดบนโครงสร้างพื้นฐานของไมโครซอฟท์ และการเชื่อมต่อกับบริการข้อมูลตัวอื่นในตระกูล Azure เช่น Azure Cosmos DB, Azure Data Lake Store, Azure IoT Hub เพื่อรวมข้อมูลหลายประเภทหลายแหล่ง มารันวิเคราะห์ใน Azure Databricks อีกทีหนึ่ง
การใช้เทคโนโลยี Big Data เพื่อจัดการข้อมูลสำหรับการตัดสินใจอย่างทันท่วงที หรือค้นพบโอกาสใหม่ๆ จากข้อมูลที่มีอยู่ในองค์กรคงเป็นเรื่องที่หลายองค์กรเริ่มใช้งานไปแล้ว หรือกำลังพัฒนาระบบเพื่อใช้งานในเร็วๆ นี้ แต่การนำ Big Data เข้ามาในองค์กรอาจจะไม่ง่ายเสมอไป
ผลสำรวจจาก GatePoint Research เมื่อปี 2016 พบว่าองค์กรที่ตอบการสำรวจถึง 63% เพิ่งเริ่มใช้งาน Hadoop เพื่อประมวลผล Big Data มาไม่ถึง 1 ปี ประสบการณ์ที่ไม่มากนักทำให้องค์กรถึง 81% ไม่พอใจกับการจัดการงานประมวลผลเหล่านี้นัก เพราะการจัดการที่แยกส่วนกันจำนวนมากทำให้กระบวนการทำงานไม่เป็นอันหนึ่งอันเดียวกัน, หลายครั้งงานไม่ได้รันโดยอัตโนมัติแต่ต้องอาศัยระบบประสานงานภายนอก, และการรวบรวมข้อมูลจากแหล่งต่างๆ ก็มีความยุ่งยาก
Pentaho ซอฟต์แวร์ด้านวิเคราะห์ข้อมูลธุรกิจ business intelligence ชื่อดัง (ปัจจุบันเป็นบริษัทลูกของ Hitachi Vantara) ออกเวอร์ชันใหม่ 8.0 โดยเน้นไปที่ฟีเจอร์ด้าน Big Data
เมื่อเร็วๆ นี้เราเพิ่งเห็น GE ประกาศความร่วมมือกับแอปเปิล ทำแอพที่ใช้ในวงการอุตสาหกรรม ล่าสุด GE ประกาศความร่วมมือกับไมโครซอฟท์ในด้าน IoT ตามมา
GE มีซอฟต์แวร์สำหรับวิเคราะห์ข้อมูล IoT ชื่อว่า Predix ทำตลาดมาได้สักระยะแล้ว ความร่วมมือกับไมโครซอฟท์จะเป็นการสร้างแอพ Predix บนคลาวด์ Azure เพื่อขยายบริการไปยังลูกค้าทั่วโลกได้ง่ายขึ้น เพราะ Azure มีศูนย์ข้อมูลกระจายอยู่ทั่วโลกแล้ว
GE บอกว่าโลกของ IoT มีขนาดใหญ่ มีอุปกรณ์หลักพันล้านชิ้น จึงต้องระมัดระวังเรื่องความปลอดภัยให้ดีตั้งแต่ต้นทางไปยังคลาวด์ โดยไมโครซอฟท์จะเป็นฝ่ายอยู่บนคลาวด์คอยรับข้อมูล แต่ระหว่างทางก็เป็นงานของ GE ที่ต้องออกแบบเรื่องนี้ให้ดีด้วย
Silicon Studio เป็นสตูดิโอเกมญี่ปุ่น ผู้พัฒนาเกม RPG ชื่อดังอย่าง Bravely Default, Bravely Second บน 3DS แต่บริษัทก็ยังมีเกมมือถืออีกหลายเกม เช่น Terra Battle 2, Grand Sphere ที่ใช้การทำเงินแบบ in-app purchase รวมถึงธุรกิจขายเอนจิน มิดเดิลแวร์หรือเฟรมเวิร์คในการพัฒนาเกมด้วย
สิ่งที่ไม่ธรรมดาคือ Silicon Studio มีระบบ AI ของตัวเองที่ใช้อัลกอริทึม deep learning เรียนรู้พฤติกรรมของผู้เล่นแต่ละคน ว่ามีรูปแบบการเล่นอย่างไร และควรทำเงินอย่างไร ในจังหวะไหน
ธนาคารไทยพาณิชย์ ตั้งบริษัทลูก SCB Abacus (เอสซีบี อบาคัส) เพื่อทำงานด้าน AI และ Big Data มาสนับสนุนธุรกิจในเครือให้มีประสิทธิภาพมากขึ้น
เป้าหมายของ SCB Abacus จะเน้นให้บริการเฉพาะบริษัทภายในเครือไทยพาณิชย์เป็นหลัก ตัวอย่างโครงการที่ SCB Abacus จะเข้ามามีบทบาทสนับสนุนธุรกิจของไทยพาณิชย์ ได้แก่พัฒนาระบบ Recommendation Engine ช่วยแนะนำบริการในแอพ SCB Easy, นำ AI มาช่วยออกแบบผลิตภัณฑ์ด้านประกันภัยที่เหมาะสมกับลูกค้าเป็นรายบุคคล โดยใช้อุปกรณ์ IoT มาช่วยเก็บข้อมูล, นำ AI มาช่วยคาดเดาปัญหาที่ลูกค้าจะโทรเข้ามายังคอลล์เซ็นเตอร์ เพื่อโอนสายไปยังผู้เชี่ยวชาญเฉพาะเรื่อง เป็นต้น
ผลิตภัณฑ์สตอเรจในปัจจุบันที่เป็นยุคของคลาวด์ จำเป็นต้องตอบสนองรูปแบบการใช้งานใหม่ๆ โดยเฉพาะการเก็บข้อมูลแบบ unstructured data ที่มีความสำคัญมากขึ้นเรื่อยๆ อีกทั้งการที่ข้อมูลมีปริมาณเติบโตอย่างรวดเร็ว การขยายขีดความสามารถของสตอเรจให้รองรับข้อมูลได้อย่างเพียงพอ ก็ถือเป็นความท้าทายอีกประการหนึ่ง
ยักษ์ใหญ่ของวงการสตอเรจองค์กร Dell EMC มีผลิตภัณฑ์ออกแบบมาเพื่อจับลูกค้ากลุ่มนี้ นั่นคือ Isilon
โซนีเตรียมเปิดบริการใหม่ในเดือนสิงหาคมนี้ จากการนำขยะอย่างภาพใบเสร็จจำนวนมากมาประมวลผลและวิเคราะห์ ก่อนจะนำข้อมูลที่วิเคราะห์แล้วขายให้กับกลุ่มอุตสาหกรรมที่เกี่ยวข้องและบริษัทวิจัย
ผลิตภัณฑ์และสินค้าที่โซนีคาดว่าจะดึงมาจากรายการบนใบเสร็จมีไม่ต่ำกว่า 4 แสนรายการทั้งของสด ของแห้ง ผลิตภัณฑ์นม หรือแม้แต่อาหารสำเร็จรูปจากร้านค้า ขณะที่การตรวจจับรูปแบบของใบเสร็จก็รองรับใบเสร็จจากร้านค้าและซูเปอร์มาร์เก็ตแล้วไม่ต่ำกว่า 200 ราย ซึ่งทางโซนีเองก้เล็งจะขยายจำนวนของร้านค้าและรายการสินค้าให้เพิ่มขึ้น รวมถึงมีแผนจะเชื่อมระบบกับบริการจ่ายเงินออนไลน์ FeliCa ในเครือของโซนีเองด้วย เพื่อการเก็บข้อมูลจากใบเสร็จที่ง่ายขึ้น
การใช้งาน Big Data เป็นแนวทางหนึ่งในการปรับองค์กรให้เข้าสู่ยุคดิจิตอล การวิเคราะห์ข้อมูลที่องค์กรเคยได้รับสามารถช่วยปรับแนวทางการทำงาน การให้บริการลูกค้าได้อย่างเหมาะสม ไปจนถึงการสร้างบริการและธุรกิจใหม่ๆ เช่นร้านค้าปลีกสามารถจัดสินค้าให้เหมาะสมกับพฤติกรรมการซื้อของลูกค้า บริการที่เห็นประโยชน์ในหลังเช่นแอปเรียกรถรับส่ง ที่สามารถใช้ Big Data เพื่อคาดการณ์ว่าช่วงเวลาใดจะมีผู้โดยสารจากที่ใดไปยังที่ใดบ้าง ทำให้ชักจูงให้คนขับรถเข้าไปรับผู้โดยสารในเขตที่มีโอกาสถูกเรียกสูง ผู้โดยสารเองได้รับบริการที่ดีขึ้น
Zanroo คือ สตาร์ทอัพไทย ผู้ให้บริการ Social Listening ที่ใช้ Big Data และซอฟต์แวร์ดึงข้อมูลที่พูดถึงแบรนด์บนโซเชียลมีเดียแบบเรียลไทม์ ให้แบรนด์นำไปจัดการแผนการตลาดและธุรกิจของตนเอง ตัวบริษัทก่อตั้งขึ้นในปี พ.ศ. 2556 ปัจจุบันมีสำนักงานสาขาในต่างประเทศแล้ว 15 ประเทศ ทางบริษัทระบุว่า มีอัตราเติบโต 200-400% ต่อปี และสามารถทำรายได้เร็วมากในช่วงก่อตั้งใหม่ๆ
ชิตพล มั่งพร้อม ผู้ก่อตั้ง Zanroo ระบุว่า บริษัทไม่ควรหยุดโตเพียงแค่นี้ ล่าสุดจึงได้ระดมทุนในซีรี่ส์ A จากบริษัทที่ปรึกษาธุรกิจ Shift Venture จำนวน 7.4 ล้านดอลลาร์ เพื่อเตรียมขยายผลิตภัณฑ์ซอฟต์แวร์ไปยังประเทศอื่นต่อไป โดยตั้งเป้าไว้ 40 ประเทศ สหรัฐฯ และจีนเป็นหนึ่งในเป้าหมายช่วงสิ้นปีนี้
ด้วยปัญหาการขาดแคลนผู้เชี่ยวชาญด้านปัญญาประดิษฐ์และ Data Analysis โดยเฉพาะในสาขาการพัฒนาตัวยา บริษัท Chugai Pharmaceutical, Ono Pharmaceutical, Kyowa Hakko Kirin และ Fujifilm ร่วมกับมหาวิทยาลัยโตเกียว ออกหลักสูตรปริญญาเอกสาขานี้โดยเฉพาะ
ปัญหาของอุตสาหกรรมยาในญี่ปุ่นปัจจุบันคือต้นทุนการผลิตยาแต่ละตัวแพงขึ้นเรื่อยๆ ขณะที่ยาตัวใหม่ยังคงออกสู่ตลาดยากเช่นเดิม (ต้องผ่านการทดสอบและทดลองหลายขั้น ไม่รวมความยากในการคิดค้น) จึงมองหาโอกาสในการนำข้อมูล Big Data มาเป็นโอกาสทางธุรกิจ แต่ทว่าก็ยังขาดแคลนผู้เชี่ยวชาญด้านนี้อยู่
หลักสูตรใหม่นี้ของมหาวิทยาลัยโตเกียวจะเริ่มในปี 2020 เป็นหลักสูตร 3 ปี รับสมัครนักศึกษาราว 20-30 คนเท่านั้น
หนังสือพิมพ์ Korea Herald ของเกาหลีใต้ อธิบายปัญหาความล่าช้าของ Samsung Bixby ภาคเสียงภาษาอังกฤษ (ภาษาเกาหลีเปิดบริการไปแล้ว) ว่าเกิดจากซัมซุงมีข้อมูล big data ภาษาอังกฤษไม่เยอะพอ ส่งผลให้ AI ของ Bixby เรียนรู้ไม่ได้ตามที่ต้องการ
ซัมซุงเคยประกาศไว้ว่า Bixby ภาคเสียงภาษาอังกฤษจะเปิดบริการในเดือนพฤษภาคม ตามด้วยเสียงจีนในเดือนมิถุนายน แต่มาถึงตอนนี้ก็ยังไม่เปิดตามที่ประกาศไว้ ตรงนี้โฆษกของซัมซุงยอมรับเองว่าพัฒนา Bixby ในภาษาอื่นล่าช้ากว่าแผน เพราะข้อมูลไม่เยอะพอ
Korea Herald ยังอ้างแหล่งข่าววงในว่า การสื่อสารและประสานงานระหว่างทีมของซัมซุงในเกาหลีใต้กับในสหรัฐ ก็เป็นอีกเหตุผลหนึ่งที่ทำให้ Bixby ภาษาอังกฤษล่าช้า
มีเรื่องราวของบริการจากภาครัฐที่ใช้เทคโนโลยีเข้ามาช่วยอย่างน่าสนใจมาฝากกัน ที่ญีปุ่นตอนนี้มีบริการหาคู่โดยหน่วยงานรัฐร่วมลงทุน เป็นศูนย์ชื่อ Matsuyama marriage support center ในเมืองมัตสึยามา จังหวัดเอะฮิเมะ เพื่อเพิ่มจำนวนประชากร
ศูนย์ดังกล่าวใช้ Big Data จากข้อมูลที่ผู้ใช้เข้ามากรอกรายละเอียดในโปรแกรมบนคอมพิวเตอร์ในศูนย์ฯ หากข้อมูลใดที่มีแนวโน้มว่าตรงกัน ระบบก็จะแนะนำคู่ที่เหมาะสมให้กับผู้ใช้ อัตราการได้คู่แบบสมหวังตอนนี้อยู่ที่ร้อยละ 13-29 ลงเอยแต่งงานแล้ว 228 คู่ในช่วงปี 2015-2016
หากนับรวมกับศูนย์ประเภทนี้ทั่วประเทศ มีคู่ได้กันแล้วรวม 7,749 คู่จากผู้ใช้กว่า 600,000 คน คาดว่ามีการใช้เม็ดเงินรวมกว่า 2.4 พันล้านเยนที่ญี่ปุ่นลงทุนไปในปีนี้
CFA หรือ Chartered Financial Analyst ซึ่งเป็นการทดสอบวัดมาตรฐานวิชาชีพด้านการเงินและการลงทุนสากล เตรียมเพิ่มหัวข้อในแบบทดสอบด้าน AI, ระบบตัดสินใจลงทุนอัตโนมัติ และการจัดการข้อมูลที่ไม่เป็นโครงสร้าง (Unstructured data) โดยจะเริ่มในปี 2019
ตัวแทนของ CFA กล่าวว่า สาเหตุที่เพิ่มหัวข้อดังกล่าว เนื่องจาก FinTech จะมีบทบาทมากขึ้นในแวดวงการเงินการลงทุน โดยผู้ทดสอบไม่ถึงกับต้องเขียนโปรแกรมได้ แต่ต้องสามารถแยกแยะความต่างของการวิเคราะห์ข้อมูลแบบเป็นโครงสร้าง กับแบบไม่มีโครงสร้าง ตลอดจนเข้าใจการลงทุนแบบอัลกอริทึม
CFA เป็นการทดสอบมาตรฐานในกลุ่มวิชาชีพการเงินการลงทุน โดยการจัดสอบในปีนี้มีผู้สมัครราว 190,000 คนทั่วโลก
DEPA ขานรับนโยบายภาครัฐ เร่งนำเทคโนโลยี Big Data รุกพัฒนาโครงการ Phuket Smart City อย่างบูรณาการ ตั้งเป้าให้ จังหวัดภูเก็ตเป็น Smart City ทั้งด้านการค้า การลงทุน
แนวทางการประมวลผลในโลกยุค IoT ค่อนข้างชัดเจนว่า เรามีเซ็นเซอร์จำนวนมาก ส่งข้อมูลค่าต่างๆ กลับมายังเซิร์ฟเวอร์กลางทุกระยะเวลาที่กำหนด จากนั้นค่อยนำข้อมูลไปใช้งานต่อ
การอิมพลีเมนต์ระบบข้างต้น จึงประกอบด้วยการเก็บข้อมูล วิเคราะห์ และนำมาแสดงผล (visualize) ซึ่งต้องพัฒนาองค์ประกอบเหล่านี้ซ้ำไปซ้ำมา ในขณะที่ระบบส่วนใหญ่มีลักษณะคล้ายๆ กัน ล่าสุดไมโครซอฟท์จึงออกบริการ Azure Time Series Insights มาเป็นบริการสำเร็จรูปสำหรับงานแบบนี้
SAP ผู้ให้บริการซอฟต์แวร์จากเยอรมัน เปิดตัว Digital Boardroom ในไทย เน้นกลุ่มองค์กรที่มีปริมาณข้อมูลมหาศาล และอาศัยการวิเคราะห์ข้อมูลเพื่อตัดสินใจและกำหนดทิศทางการดำเนินธุรกิจของบริษัท
Digital Boardroom เป็นหน้าจอใหญ่ มีตั้งแต่ 1 จอ ถึง 3 จอ ทำงานเชื่อมโยงกับฐานข้อมูลบนคลาวด์ (SAP BusinessObjects Cloud) และดาต้าเบสแพลตฟอร์มอื่นๆ ของ SAP (เช่น SAP S/4HANA, SAP HANA, และ SAP BusinessWarehouse หรือ เชื่อมต่อกับแหล่งข้อมูลอื่นผ่าน Smart Data Integration หรือ HANA Cloud Integration) โดยมี Machine Learning ทำงานเบื้องหลัง
สถาบันวิจัยเพื่อการพัฒนาประเทศไทย (TDRI) จัดงานสัมมนาประจำปีเรื่อง "ปฏิรูปรัฐ ปฏิวัติข้อมูล" หลักการโดยรวมคืออยากให้ภาครัฐกำหนดนโยบายสาธารณะเพื่อจัดการข้อมูล พร้อมทั้งเสนอแนวทางจัดเก็บและเชื่อมโยงข้อมูลข้ามหน่วยงานเพื่อความสะดวกในการให้บริการประชาชน เปิดข้อมูลเป็นข้อมูลอิเล็กทรอนิกส์ให้ภาคประชาชนนำข้อมูลไปประมวลผลต่อได้
ที่สำคัญ ระบบการศึกษาต้องสร้างผู้เชี่ยวชาญด้านการจัดการข้อมูลโดยเฉพาะออกมามากกว่านี้ เพราะปัจจุบันยังมีปัญหาคุณภาพคนกับความต้องการทักษะงานยังไม่สอดคล้องกัน
ในงานสัมมนาแบ่งเป็น 4 หัวข้อใหญ่ Blognone จะสรุปสาระสำคัญให้อ่านกันเป็นรายหัวข้อไป
ประเทศจีนอาจเป็นประเทศแรกในโลกที่ใช้เทคโนโลยี Big Data สุดล้ำแห่งศตวรรษที่ 21 มาใช้ปกครองคนเต็มรูปแบบ
Washington Post รายงานข่าวว่ารัฐบาลจีน กำลังทดลองระบบ Big Data เก็บข้อมูลประชากร มาใช้จัดอันดับหรือเครดิตประชากร เพื่อประโยชน์ในการคัดกรองคนเข้าสู่การกู้เงิน การศึกษา การประกันภัย การท่องเที่ยว เป็นต้น เป็นแผนการในชื่อว่า Social Credit System
IBM Watson เปิดตัวบริการใหม่ 2 ตัวสำหรับองค์กรที่ต้องการประมวลผลข้อมูลในยุค cognitive ได้แก่ IBM Watson Data Platform และ IBM Watson Machine Learning Service
IBM Watson Data Platform เป็นแพลตฟอร์มสำหรับเก็บข้อมูลจากแหล่งต่างๆ เพื่อนำไปใช้วิเคราะห์ต่อในอนาคต ตัวแกนกลางของระบบคือ Apache Spark ที่รันบน IBM Cloud และสามารถเข้าถึงแหล่งข้อมูลบางอย่างที่ IBM เคยไปลงทุนไว้ เช่น The Weather Company เพื่อนำข้อมูลไปผสมผสานกับข้อมูลที่องค์กรมีได้
ตัว Data Platform รองรับภาษาโปรแกรมหลากหลาย ทั้ง SQL, Python, R, Java, Scala และเชื่อมต่อกับบริการของพาร์ทเนอร์รายอื่นๆ เช่น Keen IO, RStudio ได้ด้วย
Jack Ma ออกมาแสดงความเห็นเรื่องการจัดการกับปัญหาอาชญากรรมในจีนว่า รัฐบาลต้องรู้จักใช้ Big Data จากข้อมูลบนโลกออนไลน์ให้เป็นประโยชน์ โดยบริษัทไอทีชั้นนำของจีนจะเข้ามามีบทบาทในการช่วยสร้างระบบตรงนี้
Ma ยกตัวอย่างในเมือง Hangzhou ที่มีกล้องวงจรปิดมากกว่าในนครนิวยอร์ค โดย Ma ระบุว่ามนุษย์ไม่สามารถรับมือกับข้อมูลจากกล้องวงจรปิดมหาศาลเหล่านี้ได้ ซึ่งตรงนี้เองที่ AI จะเข้ามาช่วย อย่างไรก็ตามซีอีโอของ Alibaba ไม่ได้ลงในรายละเอียดว่ารูปแบบการป้องกันและรับมือเหตุอาชญากรรมนั้นจะเป็นอย่างไร
Data Scientist of Wall Street
หากจะพูดถึงสายงานที่กำลังเป็นกระแสทั่วโลกในขณะนี้ ก็คงจะหนีไม่พ้นงานด้าน Data Science โดยหนึ่งในสาขาที่มีการเติบโตอย่างรวดเร็วในช่วงที่ผ่านมา ก็คือการนำมาประยุกต์ใช้กับการลงทุนในต่างประเทศ กองทุนต่างๆ ได้มีการใช้คอมพิวเตอร์ในการสร้าง Model คณิตศาสตร์เพื่อทำนายราคาหลักทรัพย์ในอนาคต และช่วยตัดสินใจในการลงทุนมานานแล้ว
Blognone เสนอข่าวสารผลงานของ EGA หรือ สำนักงานรัฐบาลอิเล็กทรอนิกส์ (สรอ.) มาเรื่อยๆ และเคยมีโอกาสสัมภาษณ์ ดร.ศักดิ์ เสกขุนทด ผู้อำนวยการ EGA ในหลากหลายประเด็น โดยเฉพาะเรื่องรัฐบาลอิเล็กทรอนิกส์ที่ EGA พยายามทำอยู่ขณะนี้
เมื่ออาทิตย์ก่อนทาง EGA จัดงานพบปะสื่อออนไลน์ บล็อกเกอร์ สตาร์ทอัพบางราย มีประเด็นพูดคุยเกี่ยวกับบริการอิเล็กทรอนิกส์และผลประโยชน์ที่ประชาชนจะได้รับ ทาง Blognone เห็นว่าน่าสนใจและมีประโยชน์ จึงเก็บประเด็นมาฝาก
ซอฟต์แวร์ด้าน Big Data ที่มาแรงมากในช่วงหลังคือ Apache Spark ซอฟต์แวร์ประมวลผลข้อมูลขนาดใหญ่ด้วยความเร็วสูง เพราะใช้เทคนิคการประมวลผลในแรมที่ต่างไปจาก MapReduce ของ Hadoop
ล่าสุด Spark ออกเวอร์ชัน 2.0 ซึ่งถือเป็นครั้งแรกในรอบสองปีที่ออกเวอร์ชันใหญ่ ของใหม่ในเวอร์ชันนี้มีจำนวนมาก เช่น
ไมโครซอฟท์ออกซอฟต์แวร์ด้านการวิเคราะห์ข้อมูลทั้ง Power BI และ Cortana Intelligence ชุดใหญ่ ดังนี้