Hydra สตาร์ตอัพด้าน data processing พัฒนาส่วนขยาย pg_duckdb ที่ฝัง DuckDB เข้าไปอยู่ใน PostgreSQL ในตัว ทำให้สามารถคิวรีข้อมูลในไฟล์ parquet หรือ CSV จากสตอเรจเช่น S3, R2, หรือ Google Cloud Storage ได้โดยตรง
โดยปกติ DuckDB ก็สามารถคิวรีด้วย SQL ได้อยู่แล้ว แต่ก็มีความต่างจาก PostgreSQL อยู่ส่วนหนึ่ง การนำข้อมูลเข้ามาคิวรีใน PostgreSQL จะทำให้นักพัฒนาสามารถใช้คิวรีเดิมๆ ได้ ส่วนขยายจะพยายามใช้ DuckDB คิวรีก่อน และหากใช้งานไม่ได้จะหันไปใช้ PostgreSQL คิวรีแทน แผนการพัฒนาส่วนขยายนี้จะพยายามรองรับชนิดข้อมูลทุกชนิดที่ PostgreSQL รองรับ
ก่อนหน้านี้ ParadeDB ก็เคยออกมาเปิดตัวส่วนขยาย pg_lakehouse ที่ทำงานคล้ายกัน แต่ pg_lakehouse นั้นใช้ไลเซนส์ AGPL ที่จำกัดกว่า และฝั่ง pg_duckdb มีแนวร่วม ตั้งแต่ DuckDB Labs เอง, MotherDuck ผู้ให้บริการ DuckDB แบบคลาวด์, Neon ผู้ให้บริการคลาวด์ PostgreSQL, และไมโครซอฟท์ที่มีนักพัฒนา PostgreSQL เป็นพนักงานประจำอยู่ และตัวโครงการจะอยู่ภายใต้ DuckDB โดยตรง
ที่มา - MotherDuck