DR Drill Sebagai Simulasi Preventif Saat Bencana pada Perusahaan Switching
- June 30, 2022
- Posted by: Equine Global
- Categories: Articles, IT Consulting
DR Drill Sebagai Simulasi Langkah Preventif Ketika Terjadi Bencana pada Perusahaan Switching Company
Disaster Recovery Plan (DRP)
Ketika terjadi bencana seperti kebakaran, tentunya akan membuat kerugian besar terhadap komponen-komponen yang mengalami bencana. Belum lagi kita membutuhkan pemulihan atas dampak terjadinya bencana, seperti pemulihan operasional kerja dan Infrastruktur TI. Jika kita belum memiliki rencana pemulihan ketika terjadinya bencana, hasilnya akan membuat risiko operasional yang terhambat dan hal ini juga akan menyebabkan resiko kerugian semakin besar. Belum lagi dampak lain karena bencana ini akan berefek pada Infrastruktur TI, dimana kita perlu mengganti server yang rusak dan alat-alat penunjang kebutuhan aplikasi lainnya yang tentunya biayanya tidaklah sedikit. Maka dari itu kita perlu menerapkan rencana pemulihan atas terjadinya bencana dengan menerapkan Disaster Recovery Plan (DRP), guna meminimalisir resiko terhambatnya operasional pasca terjadinya bencana.
Dilansir dari IBM, Disaster Recovery Plan (DRP) adalah petunjuk terperinci tentang cara menanggapi insiden yang tidak direncanakan, seperti bencana alam, pemadaman listrik, serangan dunia maya, dan insiden lainnya. Terdapat 2 (dua) poin penting yang menjadi manfaat dari DRP ini kepada perusahaan yaitu mampu mencegah kerugian dan menaikan reputasi perusahaan.
Manfaat pertama adalah mampu mencegah kerugian. Jika kegiatan bisnis tertunda maka revenue akan hilang, sehingga perusahaan berpotensi mengalami kerugian besar. Pemulihan pasca bencana yang cepat akan meminimalkan bertambahnya kerugian yang dialami sebuah perusahaan secara signifikan. Manfaat lainnya adalah mampu menaikan reputasi perusahaan, karena dapat menaikkan kepercayaan partner dari klien kami, sekaligus meningkatkan rasa nyaman mereka untuk menitipkan kepercayaan.
DR Drill
Salah satu aktivitas dari DRP adalah DR Drill, dan kami berkesempatan untuk melakukan DR Drill ini pada salah satu klien kami. DR Drill adalah simulasi yang dilakukan ketika terjadinya bencana, sekaligus memastikan bahwa skenario yang sudah dibuat berjalan efektif dan efisien ketika terjadi bencana secara riil. Target aplikasi dari klien kami yang akan dilakukan simulasi DR Drill adalah aplikasi SAP dan Non SAP.
DR Drill yang dilakukan pada klien kami adalah langkah pemulihan untuk Server Utama yang mengalami bencana dan memindahkan operasional sementara ke server DRC (Disaster Recovery Center). Ketika server utama sudah pulih kembali, maka operasional dapat berjalan kembali di Server Utama. Waktu maksimum toleransi atau Maximum Tolerable Period of Disruption (MTPD) dari simulasi ini adalah 6 (enam) jam. Sedangkan waktu Recovery Point Objective (RPO) 6 (enam) jam dan Recovery Time Objective (RTO) 4 (empat) jam.
Crisis Management System
Simulasi diawali dengan pemberitahuan dari Crisis Management System bahwa terjadinya kebakaran pada server, lalu dilanjutkan oleh kepala koordinator DRP untuk menginstruksikan skenario pemulihan yang pertama yaitu melakukan assessment dampak. Dalam kegiatan ini, tim melakukan assessment terhadap titik bencana, Infrastruktur apa saja yang mengalami kerusakan, penyebab terjadi bencana dan dampak lingkungan yang terjadi. Setelah seluruh assessment telah dilakukan, maka pelaporan disampaikan kepada Kepala DRP dan juga Koordinator DRP untuk dilakukan approval oleh seluruh stakeholder yang terlibat.
Kemudian, skenario selanjutnya adalah dilakukan proses pemulihan Infrastruktur Sistem TI, dari segi aplikasi maupun data. Karena dalam hal ini DRP yang dilakukan menggunakan server cloud, maka skenario mobilisasi tim tidak diperlukan. Singkat cerita, dalam aktivitas ini dimulai dengan pengecekan koneksi dan environment dari DRC yang nantinya akan digunakan sebagai infrastruktur TI sementara selama masa pemulihan Server utama atau Data Center (DC) sedang dilakukan. Secara parallel, seluruh tim juga melakukan Backup dan Restore pada Server Aplikasi SAP dan Non SAP. Tak lupa tim juga melakukan dokumentasi dari setiap aktivitas yang dilakukan, karena dari setiap aktivitas yang sudah dilakukan akan dipantau dan harus mendapat approval dari Kepala DRP, Koordinator DRP dan Crisis Management System sebagai pimpinan proses DR Drill ini. Jika pemulihan tidak berhasil maka Koordinator akan menginstruksikan seluruh Tim Network & Security, Infrastruktur dan Aplikasi untuk kembali melakukan pemulihan TI.
Validasi Sistem TI, Aplikasi dan Data
Skenario selanjutnya adalah melakukan Validasi Sistem TI, Aplikasi dan Data. Skenario ini diawali dengan instruksi dari Koordinator DRP. Maka tim melakukan seluruh validasi dari mulai Network dan Security, Infrastruktur, Aplikasi hingga Data, untuk memastikan data yang sudah dipulihkan sudah lengkap dan sesuai. Koordinator DRP melakukan konsolidasi dan evaluasi terhadap hasil validasi yang sudah dilakukan oleh seluruh tim. Setelah proses pemulihan berhasil, Koordinator DRP melakukan approval atas proses pengujian/validasi pemulihan. Jika pemulihan tidak berhasil maka Koordinator akan menginstruksikan seluruh Tim Network & Security, Infrastruktur dan Aplikasi untuk kembali melakukan pengujian/validasi pemulihan.
Berikutnya adalah tahap prosedur pemulihan data transaksi, artinya tim Aplikasi melakukan pengujian pemulihan terhadap data, lalu menyusun hasil validasi data serta pengujian pemulihan. Setelah melakukan validasi, Koordinator DRP melakukan evaluasi dan melakukan approval apabila proses validasi berhasil. Jika proses ini tidak berhasil, maka Koordinator DRP akan menginstruksikan seluruh Tim yang terlibat untuk kembali melakukan pengujian/validasi.
Kondisi Minimum Operasional Unit Kerja
Skenario selanjutnya adalah melanjutkan operasional unit kerja dalam kondisi minimum. Kepala tim DR melakukan instruksi kepada tim untuk melakukan kegiatan pemulihan data pada lokasi alternatif. Dalam hal ini tim DR melakukan validasi terhadap data backlog Aplikasi. Apabila data tersebut sudah valid maka tim DR menyusun laporan hasil validasi dan Kepala tim DR akan melakukan konsolidasi terhadap hasil validasi yang nantinya akan dilanjutkan ke Koordinator DRP. Setelah hasil validasi sudah dievaluasi dan disetujui oleh Koordinator DRP, maka selanjutnya Koordinator DRP bersama dengan Crisis management System melakukan publikasi bahwa data backlog telah selesai di input, dan operasional bisnis yang bergantung pada aplikasi sudah dapat berjalan kembali.
Yang terakhir adalah skenario aktivitas Transisi DRC ke DC (Return Home). Dalam hal ini Koordinator DRP akan memutuskan apakah infrastruktur memerlukan proses Restorasi atau tidak. Karena jika memerlukan proses restorasi, maka proses Return Home belum dapat dilakukan. Dan Koordinator DRP yang memimpin aktivitas restorasi dari Infrastruktur terhadap lokasi terjadinya bencana.
Tantangan DR Drill
Tantangan yang kami hadapi saat melakukan simulasi ini adalah simulasi ini dilakukan di luar office hour, karena klien kami khawatir dapat mengganggu operasional apabila dilakukan di dalam office hour. Tetapi kami dapat menjamin bahwa simulasi DR Drill ini dapat menggambarkan proses DRP secara nyata, karena kami menggunakan server Production dan melibatkan beberapa user atau pengguna dari aplikasi. Dan dengan pelaksanaan DR Drill ini diharapkan mampu meminimalisir resiko kerugian dari klien kami.