Meta เปิดตัวโครงการ Velox ตัวปรับแต่งประสิทธิภาพฐานข้อมูล รองรับ Spark, Presto, PyTorch

By: mk

on 22 April 2023 - 20:08 Tags:

Topics:

เมื่อเดือนมีนาคมที่ผ่านมา Meta เปิดตัวโครงการ Velox เป็น unified execution engine กลางสำหรับฐานข้อมูลหรือระบบจัดการข้อมูลหลายรูปแบบ ตอบโจทย์ระดับโครงสร้างพื้นฐานของบริษัทใหญ่ระดับ Meta ที่ต้องใช้ฐานข้อมูลหลากหลาย และซับซ้อนขึ้นเรื่อยๆ

Velox จึงถูกสร้างขึ้นเพื่อจัดระเบียบวิธีการเก็บและเรียกใช้ข้อมูลที่แตกต่างกัน ช่วยลดความซ้ำซ้อนในการพัฒนา และรีดประสิทธิภาพของการเก็บข้อมูลให้ดีขึ้น แก้ปัญหาเอนจินแต่ละตัวมีวิธี optimized ที่แตกต่างกัน

เบื้องต้น Velox รองรับฐานข้อมูล 3 รูปแบบ ได้แก่ Apache Spark, Presto, PyTorch สำหรับงานปัญญาประดิษฐ์ ซึ่งทั้ง 3 แบบเป็นระบบที่ใช้บ่อยภายในบริษัท Meta

No Description

สิ่งที่ Velox ทำคือปรับแต่งเอนจินข้อมูลเหล่านี้ตอนรันไทม์ เช่น การเรียงลำดับข้อมูล ทำฟิลเตอร์ข้อมูล ทำ normalization ของอาร์เรย์ ฯลฯ โดยคำนึงถึงรูปแบบงานที่พบบ่อยในการประมวลผลยุคใหม่ ตัวอย่างเบนช์มาร์คของ Meta กับฐานข้อมูล Presto พบว่าการคิวรีข้อมูลเร็วขึ้นได้ถึง 6-7 เท่าเลยทีเดียว (ในหน้า GitHub ของโครงการให้นิยามว่าตัวเองเป็น database acceleration library)

No Description

โครงการ Velox เปิดเป็นโอเพนซอร์สบน GitHub และมีบริษัทอื่นเข้ามาช่วยพัฒนาแล้ว เช่น อินเทลมาทำตัวเชื่อมต่อกับ Spark ในชื่อโครงการ Gluten

เนื่องจาก Velox ไม่ได้ยุ่งกับระดับชั้นบนๆ ของฐานข้อมูล เช่น ตัวอ่านคำสั่ง SQL, ตัวปรับแต่งคิวรี จึงไม่ได้มีกลุ่มเป้าหมายคือผู้ใช้งานฐานข้อมูล แต่ออกแบบมาเพื่อนักพัฒนาใช้ปรับแต่งประสิทธิภาพของฐานข้อมูลที่ใช้งานอยู่ได้

ที่มา - Meta Engineering