ประเด็นสำคัญของแวดวงคลาวด์คือการให้บริการได้ต่อเนื่อง (availability) ซึ่งบางครั้งก็ไม่สามารถทำได้เพราะเหตุสุดวิสัยบางอย่าง ล่าสุด Google Compute Engine ในยุโรปต้องล่มไปเพราะเหตุ "ฟ้าผ่า"
เหตุเกิดที่ศูนย์ข้อมูลของกูเกิลในเมือง St. Ghislain ที่ประเทศเบลเยียม (ให้บริการโซน europe-west1-b) เกิดเหตุฟ้าผ่าที่โครงข่ายไฟฟ้าท้องถิ่น 4 ครั้งติดต่อกัน ทำให้ระบบไฟฟ้าของศูนย์ข้อมูลใช้งานไม่ได้ชั่วขณะ ระบบสตอเรจของกูเกิลมีแบตเตอรี่สำรองในตัว สามารถทำงานต่อได้ตามปกติ แต่มีสตอเรจส่วนน้อยที่กลับมีปัญหาแบตเตอรี่ไม่ทำงานจนล่มไป ซึ่งวิศวกรของกูเกิลสามารถแก้ไขให้กลับมาทำงานได้ในภายหลัง
ปัญหาคือข้อมูลที่กำลังถูกเขียนบนดิสก์ในจังหวะที่ระบบไฟล่มกลับหายไปด้วย และไม่สามารถกู้คืนได้ ถือเป็นปัญหา data loss ที่รุนแรง แม้ว่าจะมีสัดส่วนแค่ 0.000001% ของพื้นที่เก็บข้อมูลทั้งหมดก็ตาม
กูเกิลยอมรับว่าเป็นความรับผิดชอบของตัวเองที่ปล่อยให้เกิดปัญหานี้ และทยอยอัพเกรดระบบสตอเรจให้เป็นรุ่นที่ทนทานต่อปัญหาระบบไฟฟ้าล่มมากกว่าเดิม
Comments
ไฟดับ แต่ตัว Storage ไม่ดับแล้วพวก Compute อื่นๆ ดับเปล่าหว่า
คุ้นๆ มีเจ้าที่นำ Batt จากเดิมที่ติดตั้งที่ UPS ข้างนอกใหญ่ๆ มาติดกับ Server ใช่กูเกิลเปล่านะจำไม่ได้แล้ว
"ยอมรับว่าเป็นความผิดชอบ" แค่นี้แหละ...... ตรบมือดัง แล้วเราค่อยมาร่วมกันหาทางแก้ไขอีกที
กลุ่มเมฆล่มสลายเพราะฟ้าผ่า...
ธรรมชาติชนะตลอด
มีเมฆ (Cloud) เกาะกลุ่มกันหนามากก็ต้องเจอกับ ฟ้าคะนอง ฟ้าผ่า เป็นธรรมดา
0.000001% นี่มันกี่ Tb หว่า