เมื่อเดือนมีนาคมที่ผ่านมา Meta เปิดตัวโครงการ Velox เป็น unified execution engine กลางสำหรับฐานข้อมูลหรือระบบจัดการข้อมูลหลายรูปแบบ ตอบโจทย์ระดับโครงสร้างพื้นฐานของบริษัทใหญ่ระดับ Meta ที่ต้องใช้ฐานข้อมูลหลากหลาย และซับซ้อนขึ้นเรื่อยๆ
Velox จึงถูกสร้างขึ้นเพื่อจัดระเบียบวิธีการเก็บและเรียกใช้ข้อมูลที่แตกต่างกัน ช่วยลดความซ้ำซ้อนในการพัฒนา และรีดประสิทธิภาพของการเก็บข้อมูลให้ดีขึ้น แก้ปัญหาเอนจินแต่ละตัวมีวิธี optimized ที่แตกต่างกัน
เบื้องต้น Velox รองรับฐานข้อมูล 3 รูปแบบ ได้แก่ Apache Spark, Presto, PyTorch สำหรับงานปัญญาประดิษฐ์ ซึ่งทั้ง 3 แบบเป็นระบบที่ใช้บ่อยภายในบริษัท Meta
IBM ซื้อกิจการบริษัท Ahana ซึ่งทำซอฟต์แวร์คิวรี Presto โดยไม่เปิดเผยมูลค่า
Presto เป็นซอฟต์แวร์คิวรี SQL engine ที่ทำงานกับฐานข้อมูลได้หลากหลาย (ทั้ง MySQL, Hadoop, Cassandra, MongoDB, Amazon S3) แนวคิดของมันคือการทำงานแบบกระจายศูนย์เพื่อให้สเกลรองรับโหลดจำนวนมากได้ ซอฟต์แวร์ถูกนำไปใช้ในบริษัทไอทีใหญ่ๆ หลายแห่ง เช่น Netflix, Uber และ AWS นำไปให้บริการชื่อ Amazon Athena
ที่มาของ Presto เป็นโครงการภายในของ Facebook ที่โอเพนซอร์สในปี 2013 โดยสร้างขึ้นมาทดแทน Apache Hive ที่มีข้อจำกัดเรื่องการสเกล ภายหลัง Facebook ยกโครงการให้มูลนิธิ Presto Foundtion ใต้สังกัด Linux Foundation ดูแลต่อในปี 2019
อธิบายสั้นๆ มันคือคู่แข่งของ Apache Hive ที่พัฒนาโดย Facebook ครับ
อธิบายแบบยาวๆ คือบริษัทแบบ Facebook ที่ต้องยุ่งเกี่ยวกับข้อมูลจำนวนมหาศาลระดับ petabyte มีงานเบื้องหลังที่ต้องดึงข้อมูลเก่าที่เก็บใน data warehouse (ที่เก็บด้วย Hadoop/HFS) มาวิเคราะห์อยู่บ่อยๆ ปัญหาคือระบบคิวรีข้อมูลอย่าง Hive ที่พัฒนาอยู่บนแนวคิด MapReduce นั้นออกแบบโดยเน้นสมรรถภาพโดยรวม (overall throughput) เป็นสำคัญ แต่สิ่งที่ Facebook ต้องการคือระบบคิวรีข้อมูลที่มีการตอบสนองรวดเร็ว (low query latency)