Google Bigtable เป็นฐานข้อมูลแบบ NoSQL ของ Google Cloud ที่เปิดตัวมาตั้งแต่ปี 2015 และปัจจุบันมีฐานลูกค้าจำนวนมาก ตัวมันเองยังเป็นแรงบันดาลใจให้ฐานข้อมูลโอเพนซอร์สตัวอื่นๆ อย่าง HBase และ Cassandra ด้วย
ล่าสุดกูเกิลพัฒนาให้ Bigtable รองรับการคิวรี่ด้วย GoogleSQL ซึ่งเป็นภาษา SQL เวอร์ชันที่ใช้ในบริการตัวอื่นๆ เช่น BigQuery และ Cloud Spanner เพื่อให้ผู้ใช้สามารถคิวรีข้อมูลจาก Bigtable ได้ด้วยภาษา SQL ที่คุ้นเคย (GoogleSQL เข้ากันได้กับ ANSI SQL ที่ใช้กันทั่วไป)
IEEE Spectrum นิตยสารในเครือ IEEE รายงานการจัดอันดับภาษาโปรแกรมยอดนิยมประจำปี ซึ่งปีนี้จัดอันดับเป็นปีที่ 10 โดย Python ยังคงเป็นอันดับ 1 ในคะแนนภาพรวม หรืออันดับ Spectrum รวมทั้งอันดับ 1 ในด้านภาษาที่มาแรงเป็นกระแส (Trending) มี Java, C++ และ JavaScript ในอันดับรองลงมา
อย่างไรก็ตาม ผลการจัดอันดับด้านภาษาโปรแกรมสำหรับการหางาน (Jobs) SQL ยังครองอันดับที่ 1 ด้วยเหตุผลเพราะ SQL มักเป็นทักษะที่อยู่ในเงื่อนไขการรับสมัครงานร่วมกับภาษาอื่น โดยมี Python ตามมาในอันดับ 2 ด้วยคะแนนที่ไม่ห่างกันมากนัก
ในรายงานยังให้ข้อสังเกตของภาษา R ว่ามีประสิทธิภาพแต่ก็มีความเฉพาะตัว ได้รับความนิยมในระดับสูง แต่พอร์ตเป็นภาษาอื่นได้ยาก ซึ่งคล้ายกับสิ่งที่เกิดกับ Fortran และ Cobol
ISO ออกมาตรฐาน SQL 2023 ตัวจริงหลังจากมาตรฐานล่าสุดออกเมือปี 2016 โดยการปรับเปลี่ยนจำนวนมากเป็นการวางมาตรฐานกับจุดเล็กๆ น้อยๆ ที่ไม่ได้กำหนดพฤติกรรมไว้ก่อนหน้านี้ แต่ฟีเจอร์ชุดใหญ่ที่เพิ่มขึ้นมาคือการรองรับการคิวรีข้อมูลแบบ JSON และแบบ Graph
การคิวรีแบบ JSON นั้นรองรับตั้งแต่กำหนดประเภทฟิลด์เป็น JSON, การเข้าถึงฟิลด์ต่างๆ มีการกำหนด simplified accessor ให้สามารถอ้างถึงฟิลด์ในออปเจกต์ เช่น t.foo.bar
รวมถึงกำหนดฟังก์ชั่นที่ใช้กับ JSON จำนวนมาก
ฟีเจอร์อีกชุดคือ SQL/PGQ (Property Graph Queries) รองรับการกำหนดความสัมพันธ์แบบกราฟและคิวรีความสัมพันธ์กันได้โดยตรง
IBM ซื้อกิจการบริษัท Ahana ซึ่งทำซอฟต์แวร์คิวรี Presto โดยไม่เปิดเผยมูลค่า
Presto เป็นซอฟต์แวร์คิวรี SQL engine ที่ทำงานกับฐานข้อมูลได้หลากหลาย (ทั้ง MySQL, Hadoop, Cassandra, MongoDB, Amazon S3) แนวคิดของมันคือการทำงานแบบกระจายศูนย์เพื่อให้สเกลรองรับโหลดจำนวนมากได้ ซอฟต์แวร์ถูกนำไปใช้ในบริษัทไอทีใหญ่ๆ หลายแห่ง เช่น Netflix, Uber และ AWS นำไปให้บริการชื่อ Amazon Athena
ที่มาของ Presto เป็นโครงการภายในของ Facebook ที่โอเพนซอร์สในปี 2013 โดยสร้างขึ้นมาทดแทน Apache Hive ที่มีข้อจำกัดเรื่องการสเกล ภายหลัง Facebook ยกโครงการให้มูลนิธิ Presto Foundtion ใต้สังกัด Linux Foundation ดูแลต่อในปี 2019
IEEE Spectrum นิตยสารในเครือ IEEE รายงานถึงภาษาโปรแกรมยอดนิยม พบว่า Python ยังคงความนิยมสูงสุด แม้จะตามมาด้วย C และ C++ ด้วยคะแนนตามหลังไม่มากนัก และหากนับรวมเป็น C/C++ ก็จะแซง Python ไปเล็กน้อย
แต่หากให้น้ำหนักกับการหางานแล้ว ภาษา SQL และ Java จะแซง Python ไปพอสมควร โดยตัวภาษา SQL นั้นสำคัญเนื่องจากประกาศรับสมัครงานจำนวนมากมักระบุ SQL ควบคู่กับภาษาอื่นๆ ไปด้วย อีกสองอันดับหลัง Python คือ JavaScript และ C#
ภาษาที่เป็นข่าวมากขึ้นเรื่อยๆ อย่าง Rust นั้นอยู่ในอันดับ 12 ของการเรียงลำดับความสนใจ (trending) แต่กลับมีคะแนนต่ำลงมากเมื่อดูอันดับการหางาน
ที่มา - IEEE Spectrum
ทีมวิจัยความปลอดภัยของ Wiz ผู้ให้บริการรักษาความปลอดภัยบนคลาวด์ทดสอบความปลอดภัยของบริการฐานข้อมูลแบบ SQL บนคลาวด์โดยเจาะเฉพาะบริการ PostgreSQL ที่ได้รับความนิยมสูง โดยการออกแบบของ PostgreSQL นั้นไม่ได้คำนึงถึงการใช้งานพร้อมกันหลายองค์กร (multi-tenant) ผู้ให้บริการคลาวด์ต้องหาทางจัดการแยกข้อมูลออกจากกัน พร้อมกับจำกัดสิทธิ์ของลูกค้าไม่ให้เข้ามายุ่งกับระบบเกินความจำเป็น แม้บัญชีของลูกค้าจะมีสิทธิ์ผู้ดูแลฐานข้อมูลเต็มรูปแบบก็ตาม
Cloudflare เพิ่มบริการคลาวด์ตัวใหม่เป็นฐานข้อมูลแบบ SQL ในชื่อ D1 พัฒนาต่อมาจาก SQLite หลังจากก่อนหน้านี้บริการคลาวด์ของ Cloudflare มีเฉพาะฐานข้อมูลแบบ key-value เท่านั้น
สำหรับนักพัฒนา ตัว D1 จะกลายเป็นออปเจกต์ในอาร์กิวเมนต์ของฟังก์ชั่นใน Worker ตัว API สามารถคิวรีได้ทีละ statement หรือจะแพ็กเป็นอาเรย์ทีละหลายๆ statement เพื่อลดเวลาหน่วงที่ต้องติดต่อกับฐานข้อมูลก็ได้ และฐานข้อมูลจะกระจายไปตามเครือข่ายของ Cloudflare ให้เอง ทำให้กสารอ่านข้อมูลเร็วเพราะอยู่ใกล้กับ Worker ที่รันแอปพลิเคชั่น และตัวฐานข้อมูลจะสำรองข้อมูลลงสตอเรจ R2 เป็นช่วงๆ โดยอัตโนมัติ
Multiprocess Labs ผู้พัฒนา DataStation ที่เป็น IDE สำหรับการคิวรีข้อมูล โอเพนซอร์สโครงการ dsq สำหรับการคิวรีข้อมูลไฟล์ต่างๆ ด้วยภาษา SQL
โครงการโอเพนซอร์สสำหรับคิวรีข้อมูลในไฟล์ด้วย SQL นั้นมีมาก่อนหน้านี้แล้วหลายโครงการ แต่ไลบรารี DataStation นั้นมีจุดเด่นที่การรองรับไฟล์ฟอร์แมตหลากหลายกว่า เช่น Excel, OpenOffice Sheet, JSONL (JSON ที่แบ่งตามบรรทัด), Apache2 log, และ nginx log
เบื้องหลังของโปรแกรมในกลุ่มนี้ เช่น textql หรือ q มักใช้ SQLite เป็นเอนจินด้านหลัง และตัวโปรแกรมก็แปลงข้อมูลเพื่อส่งเข้าไปยัง SQLite ก่อนจะรันคิวรีอีกที แต่การมีโปรแกรมลักษณะนี้ก็ช่วยทำให้งานหลายประเภทที่ต้องการคิวรีเป็นครั้งคราวใช้งานได้สะดวกขึ้นมาก
โครงการฐานข้อมูลแบบฝังตัวในซอฟต์แวร์ SQLite ออกเวอร์ชั่น 3.37.0 ที่แม้จะเป็นอัพเดตย่อยแต่มีฟีเจอร์สำคัญเพิ่มเข้ามาคือการรองรับตารางแบบ STRICT ที่ทำให้ผู้สร้างตารางกำหนดชนิดข้อมูลได้จริงๆ
พฤติกรรมของ SQLite ก่อนหน้านี้แม้คอลัมน์ในฐานข้อมูลจะกำหนดชนิดข้อมูลเอาไว้ แต่ตัว SQLite จะไม่ได้บังคับจริงๆ หากชนิดข้อมูลที่ใส่เข้ามาไม่ตรงกันก็จะพยายามแปลงข้อมูลให้ เช่น หากคอลัมน์เป็นเลขจำนวนเต็ม (INT) แต่ใส่ข้อความ "123" ก็จะพยายามแปลงเป็นตัวเลข 123 ให้เอง แม้จะสะดวก แต่เมื่อใส่ข้อมูลที่แปลงเป็นตัวเลขไม่ได้ เช่น "xyz" ตัว SQLite ก็จะยอมใส่ข้อมูลเป็นสตริงลงไปในคอลัมน์แม้จะกำหนดชนิดข้อมูลเป็นตัวเลขก็ตาม
Google เปิดตัวระบบ Database Migration Service หรือ DMS สำหรับไมเกรตฐานข้อมูลภาคองค์กรขึ้นสู่ Google Cloud อย่างราบรื่น ลดปัญหาต่าง ๆ รวมถึงใช้เวลาดาวน์ไทม์ที่น้อยที่สุดในขณะไมเกรตระบบ
Google DMS ใช้ระบบทำสำเนาข้อมูลจากต้นทางทั้ง MySQL, PostgreSQL และ SQL Server ไปยังระบบ Cloud SQL โดยก่อนหน้านี้ Google จะให้บริการไมเกรตฐานข้อมูลผ่านพาร์ทเนอร์ (ในขณะที่คู่แข่งอย่าง AWS และ Azure มีมานานแล้ว) แต่เนื่องจากทุกวันนี้มีผู้สนใจย้ายมาคลาวด์มากขึ้น การออก DMS เองจะช่วยอำนวยความสะดวกให้ลูกค้าที่ต้องการไมเกรตระบบ ลดเวลาและขั้นตอนที่ใช้ในการไมเกรตระบบได้มาก
บริษัทวิจัยตลาดแรงงาน Buring Glass วิเคราะห์ตลาดแรงงานไอทีในสหรัฐฯ ช่วง 30 วันที่ผ่านมา พบว่าภาษา SQL ยังคงเป็นภาษาอันดับหนึ่งที่นายจ้างต้องการ คิดเป็นจำนวนตำแหน่งงาน 56,272 ตำแหน่ง ตามมาด้วยภาษาจาวา 48,949 ตำแหน่ง, ไพธอน 34,426 ตำแหน่ง, และจาวาคริปต์ 33,619 ตำแหน่ง
ความสามารถด้านซอฟต์แวร์อื่น เช่น ลินุกซ์ 28,562 ตำแหน่ง ออราเคิล 24,218 ตำแหน่ง, และ SQL Server 14,299 ตำแหน่ง แสดงให้เห็นว่างานฐานข้อมูลยังคงเป็นความสามารถสำคัญ
ทีมวิจัยความปลอดภัย Tencent Blade ในสังกัด Tencent เปิดเผยข้อมูลช่องโหว่ Magellen 2.0 เปิดให้ยิงโค้ด SQL เข้าไปยัง Chrome ได้
กูเกิลแก้ไขช่องโหว่นี้แล้วใน Chrome 79.0.3945.79 ที่ออกตัวจริงเมื่อช่วงต้นเดือนธันวาคม ผู้ที่ใช้ Chrome/Chromium เวอร์ชันก่อนหน้านี้ (รวมถึงเว็บเบราว์เซอร์ที่พัฒนาบน Chromium อย่าง Opera) ควรอัพเดตเป็นเวอร์ชันล่าสุด
Microsoft ประกาศปรับปรุง Azure SQL Data Warehouse ระบบฐานข้อมูลบนคลาวด์สำหรับงานประเภทบิ๊กดาต้า โดยเน้นที่การปรับปรุงความเร็วในการ query โดยการใช้เทคโนโลยี instant data movement แบบใหม่ ซึ่งทำให้การ query เร็วขึ้นได้ 2 เท่า
ปกติแล้วเมื่อเรากระทำการ query ในรูปแบบใดก็ตาม หากตารางที่ต้องการอยู่ต่างโหนดกันก็ต้องย้ายข้อมูลไปมา ซึ่งอาจจะต้องใช้ Data Movement Service (DMS) คัดลอกข้อมูลออกจาก SQL Server Engine จากนั้นทำการแฮชและส่งไปยัง DMS บนโหนดอื่น ๆ ซึ่ง DMS จะคัดลอกข้อมูลไปยังตารางชั่วคราวโดยใช้ SQL Server BulkCopy API ซึ่งการอ่านข้อมูลออกมาจาก SQL Server นั้นเป็นแบบเทรดเดียวและทำให้เกิดคอขวดได้ง่าย
ไมโครซอฟท์เปิดตัวบริการใหม่ Azure Data Lake แพลตฟอร์มสำหรับจัดเก็บและประมวลผลข้อมูลขนาดใหญ่ (big data) บนกลุ่มเมฆ
Azure Data Lake ประกอบด้วยชิ้นส่วนย่อย ดังนี้
เพื่อให้ธุรกิจสามารถเดินหน้าได้ต่อเนื่อง ธุรกิจจำนวนมากต้องลงทุนกับฮาร์ดแวร์จำนวนมากเพื่อเตรียมพร้อมสำหรับช่วงเวลาลูกค้าสูงสุด สร้างค่าใช้จ่ายให้กับองค์กรทั้งตัวฮาร์ดแวร์เองและค่าดำเนินการบำรุงรักษา การใช้บริการกลุ่มเมฆ เช่น Azure ช่วยให้การจัดการกับโหลดของระบบที่ไม่แน่นอนทำได้ง่ายขึ้น
Google Cloud SQL เปิดบริการเป็นส่วนเสริมสำหรับ Google App Engine เพื่อให้นักพัฒนาที่ต้องการเข้าถึง MySQL เต็มรูปแบบสามารถใช้บริการที่ขยายไปได้เรื่อยๆ แต่ก่อนหน้านี้บริการนี้อยู่ในสถานะการให้บริการอย่างจำกัด (limited preview) ตอนนี้ Cloud SQL ก็เข้าสู่สถานะมีให้บริการทั่วไป (generally available - GA) แล้ว
การให้บริการเป็นการทั่วไปครั้งนี้กูเกิลจะรับประกัน uptime ให้ 99.95% และขยายขนาดฐานข้อมูลใหญ่ที่สุดเป็น 500 กิกะไบต์
อธิบายสั้นๆ มันคือคู่แข่งของ Apache Hive ที่พัฒนาโดย Facebook ครับ
อธิบายแบบยาวๆ คือบริษัทแบบ Facebook ที่ต้องยุ่งเกี่ยวกับข้อมูลจำนวนมหาศาลระดับ petabyte มีงานเบื้องหลังที่ต้องดึงข้อมูลเก่าที่เก็บใน data warehouse (ที่เก็บด้วย Hadoop/HFS) มาวิเคราะห์อยู่บ่อยๆ ปัญหาคือระบบคิวรีข้อมูลอย่าง Hive ที่พัฒนาอยู่บนแนวคิด MapReduce นั้นออกแบบโดยเน้นสมรรถภาพโดยรวม (overall throughput) เป็นสำคัญ แต่สิ่งที่ Facebook ต้องการคือระบบคิวรีข้อมูลที่มีการตอบสนองรวดเร็ว (low query latency)