ตอนที่สี่ของซีรีส์ "สัมภาษณ์คนไทยในซิลิคอนวัลเลย์" มาคุยกับคุณวิโรจน์ จิรพัฒนกุล คนไทยใน Facebook ที่ทำงานเป็น Data Scientist ตำแหน่งงานสุดฮ็อตของวงการไอทีในรอบไม่กี่ปีที่ผ่านมา
ในบทสัมภาษณ์นี้ คุณวิโรจน์จะมาแนะนำวงการวิทยาศาสตร์ข้อมูล (Data Science) รวมถึงงานในสาขาใกล้เคียงกันทั้ง Data Visualization, Machine Learning และประสบการณ์ทำงานใน Facebook ครับ หวังว่าคงเป็นประโยชน์กับน้องๆ ที่กำลังสนใจศึกษาในสาขาวิชาเหล่านี้
ชื่อต้าครับ วิโรจน์ จิรพัฒนกุล จบการศึกษาระดับปริญญาตรีสาขา วิศวกรรมคอมพิวเตอร์ จากจุฬาลงกรณ์มหาวิทยาลัย หลังจากนั้นมาศึกษาต่อระดับปริญญาโทและเอกที่ Massachusetts Institute of Technology (MIT) สาขา Transportation และ Operations Research
งานวิจัยที่ทำเกี่ยวกับการวางแผนระบบขนส่ง เช่น ตารางบินของสายการบิน, เส้นทางรถเมล์ รถไฟ, และเครือข่ายสถานีเช่าจักรยาน เป็นต้น
ตอนช่วงปริญญาตรี ได้เรียนวิชาแนวอัลกอริทึม เรียนเขียนโปรแกรมเพื่อแก้ปัญหาต่างๆ พบว่าตัวเองชอบงานแนวนี้ เลยอยากศึกษาเพิ่มเติมมากขึ้น
Operations Research เป็นสาขาวิชาที่นำความรู้หลายๆสาขา เช่น สถิติ คณิตศาสตร์ และคอมพิวเตอร์ มาประยุกต์ใช้เพื่อสร้างแบบจำลองทางคณิตศาสตร์ (mathematical models) และนำมาใช้ในการประกอบการตัดสินใจหรือแก้ปัญหาต่างๆ ในการดำเนินธุรกิจ เช่น การวางแผนการลงทุน (portfolio optimization) จะซื้อลงทุนในหุ้นหรือกองทุนไหนให้ได้กำไรมาก ความเสี่ยงน้อย, การกำหนดราคาสินค้าอย่างโรงแรม หรือ ตั๋วเครื่องบิน ที่ราคาจะเปลี่ยนแปลงไปตลอดเวลา (dynamic pricing), การวางแผนระบบลอจิสติกส์หรือเครือข่ายขนส่งสินค้า (scheduling, routing, network optimization) เป็นต้น
คนที่จบสาขานี้ส่วนใหญ่จะเป็นนักวิจัยหรือนักวิเคราะห์ ช่วยบริษัทวางแผนการดำเนินธุรกิจ
ยากอยู่ครับ โดยเฉพาะช่วงแรกที่ไป แถมเราไม่ได้เรียนสายนี้มาโดยตรงตอนปริญญาตรีด้วย เลยต้องปรับตัวพอสมควร
การเรียนถือว่าหนักมากเมื่อเทียบกับเมืองไทย การบ้านค่อนข้างเยอะ แต่เป็นประสบการณ์ที่ดีครับ ได้เรียน ได้ร่วมงานกับอาจารย์ที่มืชื่อเสียงระดับโลกหลายๆคน ได้รู้จักกับเพื่อนที่เก่งๆ จากทั่วโลก และได้เห็นนวัตกรรมใหม่ๆ ก่อนคนอื่น
ช่วงที่ทำงานวิจัยที่ MIT ได้ทำงานกับข้อมูลค่อนข้างเยอะ ประกอบกับช่วงตอนใกล้จบ งานตำแหน่งนักวิทยาศาสตร์ข้อมูล (Data Scientist) เป็นสายอาชีพที่กำลังต้องการมาก เลยลองสมัครงานทางด้านนี้ดู
ตอนนั้นสมัครไปหลายที่ เช่น Twitter, LinkedIn, Square, AirBnB แต่สุดท้ายเลือก Facebook เพราะส่วนตัวชอบผลิตภัณฑ์มากที่สุด และเพื่อนร่วมงานในทีมก็เรียกได้ว่าเป็นระดับแนวหน้าของวงการกันหลายคนทีเดียว
งานที่ทำมีหลากหลายรูปแบบครับ หลักๆ เป็นการวิเคราะห์ข้อมูล เพราะผู้ใช้งาน Facebook มีพฤติกรรมแตกต่างกันไป เราก็เอาข้อมูลการใช้งานมาศึกษาดูว่า ใครใช้งานผลิตภัณฑ์ตัวไหนอย่างไร ใครชอบอะไรไม่ชอบอะไร เพื่อปรับปรุงผลิตภัณฑ์ให้ดีขึ้น หรือได้แนวความคิดสำหรับไปใช้พัฒนาผลิตภัณฑ์ตัวใหม่ต่อไป
บางโปรเจคต์เน้นหนักไปทางพัฒนาเครื่องมือสำหรับใช้ภายในองค์กร เพื่อให้การวิเคราะห์ข้อมูลหรือสร้างโมเดลทำได้รวดเร็วและง่ายยิ่งขึ้น บางครั้งงานก็เป็นการทดลองเปรียบเทียบ (A/B testing) เพื่อทำความเข้าใจว่าตัวแปรไหนมีผลต่อการใช้งานอย่างไร
Data Science คือการนำเอาข้อมูลมาทำการวิเคราะห์ วิจัย และนำผลที่มาใช้ในการปรับปรุงผลิตภัณฑ์ ประกอบการตัดสินใจทางธุรกิจ หรือขับเคลื่อนทิศทางของผลิตภัณฑ์ในอนาคตต่อไป
การนำข้อมูลมาใช้ประกอบการตัดสินใจนั้นมีมานานแล้ว แต่ด้วยปริมาณข้อมูลจากผู้ใช้งาน (user generated contents) ที่มีมากขึ้น และความก้าวหน้าของเทคโนโลยีที่มารองรับข้อมูลมหาศาลเหล่านี้ ทำให้ Data Science ได้รับความสนใจอย่างมากในตอนนี้
สำหรับผู้สนใจสาขา Data Scientist ลองอ่านบทความ Data Scientist: The Sexiest Job of the 21st Century ซึ่งเป็นบทความชิ้นแรกๆ ที่พูดถึงสายอาชีพ Data Scientist แถมตอนนี้หนึ่งในคนเขียนคือ DJ Patil ก็ได้รับแต่งตั้งให้เป็น Chief Data Scientist of the United States ไปเรียบร้อยแล้ว
อันนี้เป็นวีดีโอที่ไปบรรยายที่งาน CodeMania เมื่อต้นปีที่ผ่านมาครับ ในวิดีโอมีตัวอย่างให้ดูนิดหน่อยว่า Facebook ทำอะไรกับ Data บ้าง
ส่วนคนที่สนใจว่า Facebook มีงานอะไรเรื่อง Data Science บ้าง ลองอ่านบทความเหล่านี้ได้
ผมคิดว่าน่าสนใจมากนะครับ ยิ่งช่วงนี้การพัฒนาเว็บและแอพทำได้ง่ายขึ้น มีผลิตภัณฑ์ออกมาให้เลือกใช้เป็นจำนวนมาก ผู้พัฒนาที่เข้าใจผู้ใช้งานมากกว่า ย่อมสามารถปรับปรุงผลิตภัณฑ์ของตัวเองให้น่าใช้งานได้มากกว่าคู่แข่ง เพราะฟีเจอร์ที่ต้องอาศัยข้อมูลจากผู้ใช้งานอย่าง recommender system เรียกได้ว่าเป็นสิ่งที่ขาดไม่ได้สำหรับเว็บในยุคนี้
ตามที่ได้บรรยายในวีดีโอ Data Science เป็นศาสตร์ที่ interdisciplinary (ผมเพิ่งรู้ว่าแปลเป็นภาษาไทยว่า สหสาขาวิชา!) คือเกิดจากการบูรณาการของหลายสาขาวิชา เช่น วิทยาการคอมพิวเตอร์ สถิติ และความรู้เฉพาะทางอื่นๆ อย่างเศรษฐศาสตร์หรือสังคมศาสตร์ ทีม Data Science ที่ Facebook ก็ประกอบไปด้วยผู้คนจากหลากหลายสาขาวิชามาก ผู้ที่สนใจศึกษาด้านนี้จึงต้องมีความรู้หลากหลาย รู้รอบ คุยกับคนสาขาอื่นได้
นอกจากความรู้พื้นฐานเหล่านี้แล้ว การนำข้อมูลที่มีอยู่มหาศาลมาใช้ให้เกิดประโยชน์ได้ ตัว Data Scientist ควรมีความคิดสร้างสรรค์และความเข้าใจในผลิตภัณฑ์เป็นอย่างดีด้วยเช่นกัน
Data Visualization คือการนำข้อมูลมานำเสนอด้วยภาพ เพื่อให้เราเข้าใจข้อมูลที่ซับซ้อนได้ง่ายยิ่งขึ้น หรือใช้ในการสื่อสารผลลัพธ์ที่ได้จากการวิเคราะห์ข้อมูล
หัวใจสำคัญของการทำ Data visualization คือการนำเสนอข้อมูลอย่างถูกต้องและมีประสิทธิภาพ ดังนั้นเราต้องมีความรู้พื้นฐานด้านการเลือกใช้รูปแบบการนำเสนอ การใช้สี ให้เหมาะสมกับประเภทข้อมูล เพื่อให้ผู้อ่านเข้าใจได้ง่าย และอ่านค่าได้อย่างถูกต้อง
กระแส Big Data บูม ทำให้ Data Visualization ได้รับความสนใจมากขึ้น โดยเฉพาะการนำเสนอในรูปแบบของ Interactive Data Visualization ช่วยให้นักวิเคราะห์ข้อมูลสามารถทำ Exploratory Data Analysis หรือการเลือกดูข้อมูลบางส่วน เปรียบเทียบข้อมูลหลายๆกลุ่ม หรือหาความสัมพันธ์ของข้อมูลหลายตัวได้ง่ายและรวดเร็วมากยิ่งขึ้น
สำหรับ tools นั้นมีให้เลือกเยอะมาก ขึ้นอยู่กับความต้องการว่าอยากได้ซับซ้อนขนาดไหน ส่วนตัวตอนนี้ผมใช้ d3.js เป็นหลักครับ
Machine Learning คือการเรียนรู้ข้อมูลของเครื่องคอมพิวเตอร์ เพื่อสร้างแบบจำลองไว้ใช้ทำนายค่าหรือจำแนกประเภทในภายหลัง
ยกตัวอย่างง่ายๆ เพื่อให้เข้าใจกระบวนการ ให้ลองเปรียบเทียบว่า เราต้องการสอนเด็กให้แยกแยะส้มกับมะนาวออกจากกัน เราต้องป้อนข้อมูลเด็กโดยเอาส้มกับมะนาวหลายแบบมาให้เด็กดู แล้วบอกเด็กว่านี่คือส้มนะ นี่คือมะนาว
เด็กจะเริ่มเรียนรู้และเข้าใจว่า ส้มมีสีส้มนะ ขนาดใหญ่กว่ามะนาว รสชาติเป็นแบบนี้ กลิ่นเป็นแบบนี้ ทีนี้พอเราเอามะนาวมาให้เด็กดูภายหลัง เค้าจะสามารถแยกแยะได้และบอกได้ว่านี่คือมะนาว
Machine Learning ในปัจจุบันถูกนำมาประยุกต์ใช้อย่างแพร่หลาย เช่น การแนะนำสินค้าหรือข้อมูลต่างๆ บนเว็บไซต์ (recommender system) เราต้องเรียนรู้ว่าผู้ใช้งานแต่ละคนชอบอะไร และกลุ่มผู้ใช้งานที่มีความชอบคล้ายกันนั้นสนใจอะไรกันบ้าง, การแยกแยะเมล์ขยะ (spam detection), การรู้จำเสียงหรือลายมือ (pattern recognition) เป็นต้น
เนื่องจากไม่เคยทำงานประจำที่เมืองไทย อาจเปรียบเทียบได้ไม่ดีเท่าไร แต่ที่ผมชอบโดยส่วนตัวคือบริษัทใส่ใจกับความเป็นอยู่ของพนักงานเป็นอย่างดี บริษัทเหล่านี้เชื่อว่าถ้าพนักงานมีความสุข ก็จะสามารถทำงานอย่างมีประสิทธิภาพ บริษัทจึงมีสิ่งอำนวยความสะดวกและบริการต่างๆ ให้พนักงาน เช่น
ผมคิดว่าเด็กไทยเก่งไม่แพ้ใครในโลกนะครับ แถมคนไทยขยัน (หรือถึก!) มากด้วย อุปสรรคอย่างเดียวของบ้านเราคือภาษาอังกฤษ เด็กไทยเรามักตกตั้งแต่สัมภาษณ์รอบแรก (screening interview) เพราะไม่สามารถสื่อสารได้ดี อธิบายความคิดได้ไม่ชัดเจนว่าทำไมถึงเขียนโค้ดออกมากแบบนั้น ถ้าภาษาดีแล้วทุกอย่างก็จะง่ายขึ้นครับ
Comments
ตั้งแต่อ่านมา จบจากจุฬาทั้งหมดเลย
ตั้งแต่ผมสัมภาษณ์มา เจอแต่คนจบ University of Southern California, Carnegie Mellon, University of California San Diego, MIT ซึ่งเป็นมหาวิทยาลัยระดับโลกด้านไอทีทั้งหมดเลยครับ
ทุกคนยังฝึกทักษะด้านภาษาให้คุยกับฝรั่งได้ ฝึกทักษะเทคนิคให้อยู่ในระดับที่บริษัทท็อปๆ ของโลกยอมรับครับ
มีระบบวิเคราะห์ข้อมูลดีดีแบบนี้นี่เองโฆษณาใน facebook ถึงได้ค่อนข้างที่จะตรงกับกลุ่มเป้าหมายมาก อย่างใน facebook ผมนี่มีแต่โฆษณาถุงยางนะครับแหม...
เท่าที่เคยอ่านมาก็ไม่มีใครที่จบจากไทยเพรียวๆ แล้วไปสมัครถึงจะผ่าน
อย่างดีก็ต่อนอกด้วยถึงจะโอเคสินะสินะ
ประมาณนั้นครับ
เอาจากที่ผมเห็นมานะครับ คนไทยที่ทำงานอยู่ในเมกาในสายคอม/ไอทีตอนนี้ โดยส่วนใหญ่ (แต่ไม่ทั้งหมด) ท้ายสุดคือจบมหาลัยในเมกา(หรือแคนาดา) บางคนมาเรียนที่นี่ตั้งแต่มัธยมเลยแล้วจบตรี/โท หรือไม่ก็จบตรีที่ไทยแล้วมาต่อโท/เอกที่เมกา (ฉะนั้นจะจุฬา, ธรรมศาสตร์, เกษตร, มหิดล, ลาดกระบัง, บางมด หรือที่อื่นๆ ไม่ค่อยมีผลครับ) และที่ผมบอกว่าไม่ทั้งหมดเพราะ มีบางคนมีผลงานหรือแข่งในระดับนานาชาติมา หรือบางคนทำงานบริษัทต่างชาติในไทยแล้วเขาเรียกตัวมาทำงานต่อหรือสมัครงานมา HQ ก็มี
มันมีเหตุผลอยู่ครับ เพราะมันเพิ่มโอกาสในหลายๆอย่าง
เครดิตของมหาลัย เพราะบริษัทที่นี่เขาไม่รู้จักตัวคุณและการตัดสินง่ายสุดคือปริญญาจากมหาลัยที่เขารู้จัก
เรื่องวีซ่า ถ้าไม่นับ green card และอื่นๆ โดยทั่วไปการมาทำงานในเมกาได้ต้องมีวีซ่า H1B ซึ่งตามกฏหมาย บ. ต้องเป็น sponser ค่าธรรมเนียม, ค่า training, ค่า lawyer รวมๆ แล้วราวๆ 5-6 พันเหรียญ ซึ่งทั้งหมดใช้เวลา เงิน และมีความลำบาก แต่นักเรียนไทยที่มามหาลัยที่นี่ด้วย F-1 (และ J-1) สามารถฝึกงาน/ทำงานในตำแหน่งงานในสายที่จบมาหรือใกล้เคียงด้วยสิทธิ์ OPT ได้ 1 ปี (และได้ต่ออีก 17 เดือนสำหรับสาย STEM) ซึ่งนั้นทำให้บ.ไม่ต้องยุ่งยากทำเรื่อง H1B ให้คุณตั้งแต่แรก แต่ใช้สิทธิ์ OPT แทนในช่วงแรกซึ่งทำให้บ.สามารถพิจารณาดูผลงานคุณ ว่าจะจ้างต่อและดำเนินเรื่อง H1B ให้ด้วยไหม ถ้าบ.ใหญ่จริงๆ เขาจะดำเนินเรื่อง H1B ให้เลยตั้งแต่ยังไม่เริ่มงาน (แต่มีบ.ใหญ่ๆ หลายๆแห่งประกาศตั้งแต่รับสมัครงานเลยว่าจะไม่ sponser วีซ่าให้ก็มี)
การสัมภาษณ์ แม้ว่าบางแห่งสัมภาษณ์ผ่านทางโทรศัพท์, Skype หรือแม้แต่ on-campus แต่โดยส่วนใหญ่แล้วเขามักจะส่งตั๋วเครื่องบิน/รถไฟ พร้อมที่พัก เรียกให้บินไปสัมภาษณ์ตัวต่อตัวมากกว่า ซึ่งแน่นอนว่าถ้าคุณเป็นนร ที่อยู่ในเมกาอยู่แล้ว มันง่ายกว่าที่เขาจะให้คุณบินมาจากไทย พร้อมต้องดำเนินเรื่องวีซ่า B1/B2 ให้อีก
ปสก.ทำงาน คือ บ.เมกาเขามีธรรมเนียมหนึ่งที่ว่า ถ้าคุณฝึกงานที่นั่นมาก่อน โอกาสที่คุณได้ทำงานที่นั่นหลังจบจะมีสูงมาก บางแห่งยื่นเปิด offer ค้างไว้ให้เลย (เช่น Google, Facebook, Microsoft, Cisco) คือรอให้คุณจบยื่นสมัครรับเลยโดยไม่ต้องสัมภาษณ์ต่อ ดังนั้นเรียนป.ตรีที่นี้ ก็เพิ่มโอกาสได้งานจากการฝึกงานบ.ดังๆ ตอนปี 2/3/4 เลยก็ได้ หรือถ้าโทก็ปี 1
ภาษา การมาเรียนและใช้ชีวิตอยู่นี่ มันบอกคร่าวๆ ว่าภาษาคุณต้องได้ในระดับหนึ่งอยู่แล้ว ไม่งั้นมหาลัยเขาก็คงไม่รับมาเรียนโดยวัดจาก TOEFL, GRE หรือ SAT
Idolสำหรับเลยๆคนเลยละครับ
มืชื่อเสียง => มีชื่อเสียง
video ที่นำมาทำให้ Data Science น่าสนใจมากทีเดียว
เก่งมากเลย ชื่นชมๆ
..: เรื่อยไป