ภัยพิบัติและเหตุการณ์ที่กระทบกับโลกไอทีไทยในช่วงไม่กี่ปีที่ผ่านมาทำให้ธุรกิจจำนวนมากรวมไปถึงกลุ่มธุรกิจที่เกี่ยวข้องกันได้รับผลกระทบจนเกิดความเสียหายใหญ่หลวง ธุรกิจเหล่านี้จำเป็นที่จะต้องวางระบบสำรอง สำรองไฟล์ หรือซื้อเซิร์ฟเวอร์วางไว้ในศูนย์ข้อมูลที่สองเพื่อความปลอดภัย
กระบวนการเหล่านี้อาจจะทำตามประสบการณ์ที่เคยมีมา เช่น เมื่อเกิดเหตุการณ์น้ำท่วมเราอาจมีเวลาเตรียมตัวสักระยะหนึ่ง การซื้อเครื่องมาวางสำรองไว้โดยไม่เปิดใช้งานและสำรองข้อมูลออกมาสม่ำเสมออาจจะเพียงพอ แต่กับเหตุการณ์ที่เกิดขึ้นอย่างไม่ทันตั้งตัวเช่นศูนย์ข้อมูลเกิดใช้งานไม่ได้กะทันหันหรือระบบสำรองที่วางไว้กลับไม่สามารถทดแทนระบบจริงได้อย่างเต็มประสิทธิภาพ
การวางระบบเพื่อให้ตอบสนองต่อธุรกิจที่ต้องการความต่อเนื่องเช่นนี้ จำเป็นต้องมีการศึกษาและวางแผนอย่างเป็นกระบวนการชัดเจน เรียกว่า Business Continuity Planning (BCP) หรือการวางแผนเพื่อความต่อเนื่องของธุรกิจ
กระบวนการ BCP ทำขึ้นมาเพื่อวิเคราะห์จุดที่อาจจะเป็นปัญหาของธุรกิจและวางแผนสำรองในกรณีที่เกิดเหตุฉุกเฉิน เมื่อได้แผนและกระบวนการแล้วจึงบำรุงรักษาระบบให้เป็นไปตามที่วางไว้ และซักซ้อมทดสอบความพร้อมของพนักงานให้ทำได้ตามแผนจริงเมื่อเกิดเหตุ โดยมีกระบวนการดังนี้
เริ่มต้นกระบวนการจากการวิเคราะห์ความเสี่ยงขององค์กร ด้วยการวิเคราะห์กระบวนการทางธุรกิจว่ายอมรับความเสียหายได้มากน้อยเพียงใดในกรณีที่เกิดเหตุ บางระบบอาจจะยอมให้ข้อมูลสูญหายได้หนึ่งวันล่าสุด เช่นระบบตรวจนับสินค้าในร้านสะดวกซื้อ ที่อาจจะสร้างความลำบากให้เจ้าหน้าที่เพียงแค่ต้องตรวจนับซ้ำอีกครั้งหากข้อมูลหายไป ขณะที่ข้อมูลการโอนเงินในธนาคารไม่สามารถยอมรับความเสียหายของข้อมูลได้แม้แต่น้อย เพราะการโอนที่สูญหายแม้แต่ครั้งเดียวก็อาจจะสร้างความเสียหายได้มหาศาล
นอกจากวิเคราะห์ถึงความเสียหายที่ยอมรับได้ ยังต้องวิเคราะห์ว่าจะยอมให้ใช้เวลากู้คืนระบบนานเพียงใด ธุรกิจที่ต้องการความต่อเนื่องสูงเช่นระบบซื้อขายหลักทรัพย์อาจยอมรับระยะเวลาหยุดระบบได้เพียงไม่กี่วินาทีต่อวัน ระบบจุดจ่ายเงินอาจจะขอให้ลูกค้ารอซ่อมได้เพียงไม่กี่นาทีก่อนลูกค้าจะเปลี่ยนใจไปซื้อสินค้าร้านอื่น มูลค่าความเสียหายที่เกิดขึ้นทำให้เราต้องวิเคราะห์ถึงระยะเวลาที่ใช้กู้ระบบว่าควรออกแบบระบบที่กู้คืนได้ในเวลาเท่าใด
สุดท้ายวิเคราะห์ความเสี่ยงที่อาจเกิดขึ้นกับธุรกิจ นับตั้งแต่ความเสี่ยงที่เกิดจากความเลินเล่อของพนักงานที่ทำงานผิดพลาด หรือเซิร์ฟเวอร์เสียหายไปเองตามอายุการใช้งาน ไปจนถึงภัยธรรมชาติเช่นพายุหรือแผ่นดินไหว และภัยสงคราม จลาจล กระทั่งการก่อการร้าย
เมื่อวิเคราะห์อย่างรอบด้านแล้ว BCP จะออกแบบระบบให้ได้ตามความต้องการ ระบบที่ต้องการความต่อเนื่องสูงมากๆ อาจจะต้องวางศูนย์ข้อมูลคู่ขนานในระดับ Active-Active ทั้งสองศูนย์จะได้รับข้อมูลตรงกันตลอดเวลา และทำงานทดแทนกันได้ในเวลาไม่นานหลังเกิดปัญหา ขณะที่ระบบที่ยอมรับระยะเวลากู้ระบบได้สูงกว่านั้นอาจส่งไฟล์สำรองไปเก็บไว้ที่ศูนย์ข้อมูลสำรองโดยไม่ต้องเตรียมพร้อมตลอดเวลา เซิร์ฟเวอร์จริงอาจจะปิดเครื่องเอาไว้พร้อมใช้งาน (cold backup)
นอกจากระบบสำรอง กระบวนการออกแบบต้องระบุกระบวนการทำงานอย่างละเอียด บุคคลที่ต้องรับผิดชอบเมื่อเกิดเหตุการณ์จริง และการสำรองข้อมูลสำคัญ เช่นรหัสผ่านระบบและรหัสของไฟล์ที่เข้ารหัสเอาไว้ ต้องมีกระบวนการเปิดรหัสนั้นออกมาในกรณีที่ผู้รับผิดชอบไม่อยู่
การเตรียมการศูนย์สำรองเป็นอีกเรื่องหนึ่งที่ต้องวางแผน ศูนย์ข้อมูลสำรองควรมีระยะห่างจากศูนย์หลักพอสมควรเพื่อไม่ให้เจอกับภัยพิบัติแบบเดียวกันในเวลาเดียวกัน เช่น ก่อนหน้านี้เราอาจจะวางศูนย์สำรองให้ไกลกว่าศูนย์หลักระดับ 20-30 กิโลเมตร แต่หลังจากเหตุการณ์น้ำท่วมในกรุงเทพฯ ธุรกิจจำนวนมากเริ่มศึกษาความเป็นไปได้และค่าใช้จ่ายในกรณีต้องวางศูนย์ข้อมูลสำรองห่างจากศูนย์หลักระดับร้อยกิโลเมตรเพื่อความมั่นใจ
จัดซื้ออุปกรณ์ เตรียมสถานที่ และฝึกบุคคลากรให้มีความชำนาญตามแผนที่ออกแบบไว้
ระบบที่สามารถกู้คืนได้ภายในเวลาไม่นาน มีการออกแบบที่ดี แต่ในความเป็นจริงอาจไม่สามารถทำงานได้ตามที่วางไว้เลยหากไม่มีการทดสอบอย่างจริงจัง กระบวนการ BCP ต้องยืนยันด้วยการทดสอบว่าในกรณีเกิดเหตุ เราสามารถกู้คืนระบบได้ภายในเวลาที่กำหนด และข้อมูลมีความเสียหายไม่เกินที่ออกแบบไว้ พนักงานทุกคนรู้หน้าที่และสามารถปฎิบัติงานแทนกันได้ในกรณีที่จำเป็น
กระบวนการทดสอบนี้ต้องดำเนินการเป็นระยะเพื่อยืนยันว่าระบบยังคงทำงานได้ตามสถานะปัจจุบัน
กระบวนการ BCP เป็นกระบวนการที่ไม่มีวันจบลง ตราบเท่าที่ธุรกิจของเรายังคงเดินหน้าต่อไป และมีความเปลี่ยนแปลงในระบบไอทีตลอดเวลา กระบวนการต้องกลับไปวิเคราะห์ความต้องการและความเสี่ยงใหม่ๆ วางแผนเพื่อรองรับความต้องการ มาจนถึงการอิมพลีเมนต์และการทดสอบกระบวนการนี้ เป็นวงจรเรื่อยไปเพื่อให้ธุรกิจพร้อมรับมือกับอุปสรรคได้ตลอดเวลา
บทความนี้ได้รับการสนับสนุนโดย CAT cyfence ผู้ให้คำปรึกษาและจัดทำแผนเพื่อรองรับการดำเนินธุรกิจอย่างต่อเนื่อง สนใจข้อมูลเพิ่มเติม คลิก CAT cyfence: BCM Consulting
Comments
บุคคลากร => บุคลากร
ปฎิบัติงาน => ปฏิบัติงาน
BCM สร้างมาก่อนโดนม็อบปิดหรือหลังปิดอะครับ สมมุติว่าโดนม็อบปิด BCM จะช่วยได้เหมือนภัยพิบัติทั่วไปไหมอะครับ???
ผมคิดว่า BCM ควรจะต้องทำขึ้นมาก่อนครับ เพราะไม่รู้ว่าจะมีเหตุการณ์เกิดขึ้นเมื่อไร ถ้าทำแผน BCM ขึ้นมาจะทำให้สามารถรองรับและมีแนวทางในการแก้ไขปัญหาในสถานการณ์ต่างๆ ได้ดีกว่า เพื่อให้เรามีแผนในการทำงานตามสถานการณ์ฉุกเฉิน เช่น พนักงานมีหน้าที่อย่างไรเมื่อเกิดเหตุการณ์, มีการ Back up ข้อมูลสำคัญที่งานใช้ได้ทันที หรือมีไซต์งานสำรองไว้ติดต่อลูกค้าครับ ช่วยลดผลกระทบหรือความเสียหายทางธุรกิจ ส่วนตัวคิดว่า BCM สามารถใช้ได้ในทุกเหตุการณ์ ตามแผน BCM ที่เรากำหนดขึ้นมาครับ
ถ้าวางแผนไว้ก่อนล่วงหน้า เวลาเกิดเหตุจริงๆมันจะช่วยทุเลาความวุ่นวายได้เยอะเลย