Databricks ผู้ให้บริการแพลตฟอร์มสำหรับจัดการข้อมูล เปิดตัว Databricks AI/BI เครื่องมือด้าน Business Intelligence สำหรับรวบรวมข้อมูล วิเคราะห์ และค้นหา Insight สำหรับลูกค้าองค์กร
Databricks AI/BI รวมเครื่องมือที่สำคัญคือ Dashboards ทำงานบน AI ที่สามารถสร้างแดชบอร์ดขึ้นมาได้แบบโลว์โค้ด ตามที่ระบุ และเป็นแดชบอร์ดที่โต้ตอบเลือกดูข้อมูลเพิ่มได้ กับ Genie ระบบสนทนาถามตอบเพื่อค้นหาข้อมูลที่ต้องการ โดยใช้ภาษาธรรมชาติ ทั้งสองส่วนนี้เรียนรู้จากข้อมูลทั้งหมดในองค์กรที่เผยแพร่มา
เครื่องมือ AI/BI เปิดให้ใช้งานสำหรับลูกค้า Databricks SQL Pro และลูกค้า Serverless โดยไม่ต้องจ่ายเงินเพิ่มตั้งแต่วันนี้เป็นต้นไป โดยส่วนของ Genie ยังมีสถานะเป็นพับลิกพรีวิว
Databricks ปล่อยโมเดล DBRX ที่เป็น LLM ระดับความสามารถใกล้เคียงกับ Gemini Pro 1.0 แต่ชูจุดเด่นด้านความเร็วในการตอบคำถาม และความสามารถด้านการเขียนโปรแกรมหรือแก้ปัญหาคณิตศาสตร์
DBRX อาศัยโครงสร้างแบบ mixture-of-experts (MoE) ภายในมีโมเดลย่อยเชี่ยวชาญแต่ละหัวข้อทั้งหมด 16 ชุด และระหว่างการทำงานจะรันทีละ 4 ชุด รวมโมเดลรวม 132 พันล้านพารามิเตอร์แต่รันจริงทีละ 36 พันล้านพารามิเตอร์ ชุดข้อมูลที่ใช้ขนาด 12 ล้านล้านโทเค็น ฝึกด้วย context windows ขนาด 32k โทเค็น
Databricks บริษัทซอฟต์แวร์วิเคราะห์ข้อมูล (ก่อตั้งโดยทีมผู้สร้าง Apache Spark และมีโมเดลธุรกิจทำดิสโทรเชิงพาณิชย์ของ Spark แต่ภายหลังก็ขยายไปยังซอฟต์แวร์สายข้อมูลอื่นๆ เช่น Redash) ประกาศซื้อกิจการ MosaicML สตาร์ตอัพด้าน generative AI ด้วยมูลค่า 1.3 พันล้านดอลลาร์
MosaicML เป็นผู้พัฒนาโมเดลภาษาขนาดใหญ่ (LLM) ชื่อ MPT มีขนาดใหญ่ที่สุด 3 หมื่นล้านพารามิเตอร์ (MPT-30B) ตัวโมเดลเป็นโอเพนซอร์สและใช้ในเชิงพาณิชย์ได้
Databricks ผู้ให้บริการแพลตฟอร์มข้อมูล เข้าซื้อบริษัท MosaicML แพลตฟอร์มการเทรนและรันโมเดลปัญญาประดิษฐ์ ผู้สร้างโมเดลโอเพนซอร์ส MPT-7B และ MPT-30B ที่สามารถใช้งานในองค์กรได้
ซอฟต์แวร์ของ MosaicML ช่วยให้การฝึกปัญญาประดิษฐ์ขนาดใหญ่ใช้เวลาน้อยลง และรับมือกับปัญหาที่เกิดขึ้น เช่น บางเครื่องในระบบตายไประหว่างการฝึกได้ ทาง Databricks บอกแนวทางชัดเจนว่าจะใช้เทคโนโลยีของ MosaicML มารวมไว้ใน Databricks Lakehouse Platform เพื่อให้องค์กรสามารถฝึกโมเดลปัญญาประดิษฐ์ได้ด้วยตัวเอง
Databricks เปิดตัวโมเดลปัญญาประดิษฐ์ Dolly 2.0 ที่ใช้โมเดล EleutherAI ขนาด 12 พันล้านพารามิเตอร์เป็นฐาน พร้อมกับฝึกเพิ่มเติมด้วยชุดคำถามตอบจำนวน 15,000 คำถามเพื่อให้ทำงานคล้าย ChatGPT มากขึ้น
ทาง Databricks ให้พนักงาน 5,000 คนช่วยกันสร้างคำถามและคำตอบออกมาเป็นชุดข้อมูล databricks-dolly-15k
ที่ใช้สัญญาอนุญาตแบบ Creative Commons (BY-SA) ทำให้องค์กรอื่นๆ สามารถนำชุดข้อมูลนี้ไปพัฒนาต่อได้
หลังจากเมื่อคืนนี้ศูนย์ข้อมูลโซน South Central US ของ Azure ดับไป วันนี้ทางไมโครซอฟท์ก็แจ้งสาเหตุว่าเกิดจากฟ้าผ่าลงมาใกล้ศูนย์ข้อมูล ทำให้ความต่างศักย์เพิ่มสูงขึ้นจนระบบปิดตัวเองไป บริการสำคัญอย่าง Azure Active Directory พยายาม fail over ไปยังศูนย์ข้อมูลอื่นแล้ว แต่ปริมาณทราฟิกสูงจนทำให้ระบบเกิดคอขวด ทำให้ผู้ใช้อาจจะใช้งานไม่ได้บางช่วง
ตอนนี้ในศูนย์ข้อมูล South Central US ทีมวิศวกรกำลังกู้ระบบสตอเรจขึ้นมา เพื่อให้ระบบอื่นๆ ที่ใช้งานสตอเรจกลับมาทำงานได้ แต่ปัญหาก็ทำให้ Azure Databricks และ Batch มีปัญหาไปทั่วโลก
ที่มา - Azure Status
เดือนที่แล้วไมโครซอฟท์เปิดตัว Azure Databricks บริการใหม่ในเครือ Azure สำหรับการวิเคราะห์ข้อมูลขนาดใหญ่
Azure Databricks เป็นการนำ Apache Spark มารันบนคลาวด์ ความน่าสนใจคือบริการตัวนี้เป็นความร่วมมือระหว่างไมโครซอฟท์กับบริษัท Databricks ซึ่งก่อตั้งโดยหนึ่งในผู้สร้าง Apache Spark ด้วย
จุดเด่นของ Azure Databricks คือการขยายตัวแบบไม่จำกัดบนโครงสร้างพื้นฐานของไมโครซอฟท์ และการเชื่อมต่อกับบริการข้อมูลตัวอื่นในตระกูล Azure เช่น Azure Cosmos DB, Azure Data Lake Store, Azure IoT Hub เพื่อรวมข้อมูลหลายประเภทหลายแหล่ง มารันวิเคราะห์ใน Azure Databricks อีกทีหนึ่ง