Pada 19 Juli 2024, upaya CrowdStrike untuk memperbarui “Falcon Sensor” yang digunakan untuk deteksi ancaman real-time dan perlindungan endpoint mengakibatkan kerusakan sistem yang mempengaruhi 8,5 juta perangkat Microsoft Windows. Insiden ini menyebabkan gangguan IT dan operasional yang luas di seluruh dunia. Meskipun kejadian ini tidak disebabkan oleh serangan siber atau malware, hal ini menekankan pentingnya memiliki strategi cadangan dan pemulihan bencana yang komprehensif dan andal untuk mencegah gangguan pada operasi bisnis. CrowdStrike Menyebabkan Dampak Global yang Langsung Pemadaman pertama kali terdeteksi di Australia, di mana tampilan layar biru kematian menyebar ke perangkat Windows di seluruh dunia, mengakibatkan gangguan besar bagi pengguna, perusahaan, dan penyedia layanan kritis. Pada sore hari, sekitar 2.600 penerbangan di AS dibatalkan, sementara lebih dari 4.200 penerbangan di seluruh dunia terpengaruh dan terpaksa beralih ke proses check-in manual, menurut laporan Wall Street Journal. Dampak Durasi Waktu Pemulihan Operasional (RTO) terhadap Kegiatan Bisnis Setelah insiden tersebut, CrowdStrike menyediakan dukungan teknis dan merilis pembaruan untuk membantu memulihkan operasi sistem. Namun, banyak sistem yang digunakan oleh organisasi tidak dapat dipulihkan secara otomatis melalui program perbaikan. Dalam kasus tersebut, administrator TI harus mem-boot setiap perangkat yang terkena dampak ke mode aman dan menghapus pembaruan bermasalah dari CrowdStrike secara manual. Meskipun Microsoft memperkenalkan solusi “minimasi proses” pada hari berikutnya yang membantu menghapus file yang cacat secara otomatis, proses mem-boot perangkat individu ke WinPE melalui drive USB masih memerlukan tenaga kerja yang besar, memperpanjang proses pemulihan data. Waktu henti ini menyebabkan gangguan operasi, kehilangan produktivitas, biaya tambahan, peningkatan risiko kepatuhan, dan akhirnya, pengalaman pelanggan yang negatif serta reputasi perusahaan yang tercemar. Membangun Rencana Perlindungan Data yang Kuat untuk Kelangsungan Operasional Cadangan Menyeluruh : Penting bagi bisnis, terutama yang beroperasi di berbagai platform atau alat, untuk menerapkan strategi cadangan yang secara teratur mencakup semua sumber data dan perangkat tanpa adanya data yang terisolasi. Latihan Pemulihan Berkala: Mengingat kegagalan peralatan dan sistem yang sulit diprediksi, penting untuk secara rutin menguji kemampuan pemulihan data cadangan guna memastikan efektivitas dan ketersediaan rencana pemulihan bencana organisasi. Pemulihan VM Instan : Virtualisasikan layanan dan pulihkan operasi secepat mungkin untuk meminimalkan waktu henti dan memastikan kelangsungan bisnis. Pemulihan Lintas Platform : Dalam kasus CrowdStrike, hanya satu platform yang terdampak. Untuk meminimalkan risiko kehilangan data, bisnis harus memastikan bahwa semua data, aplikasi, dan sistem dapat dipulihkan dan dikembalikan di berbagai lingkungan. Cadangan dan Pemulihan Off-Site : Selain mencadangkan data di lokasi, menerapkan cadangan off-site membantu mengurangi risiko kehilangan data. Dengan adanya cadangan cloud off-site selama insiden CrowdStrike, perusahaan bisa dengan mudah melanjutkan layanan dari lokasi cadangan tersebut. Cadangan Data: Kunci untuk Ketahanan yang Optimal Memiliki rencana cadangan dan pemulihan bencana yang solid adalah kunci untuk memastikan ketahanan data dan merupakan langkah krusial bagi setiap perusahaan yang sedang menjalani transformasi digital. Insiden CrowdStrike dengan jelas menekankan pentingnya menerapkan strategi cadangan yang kuat dan melakukan uji coba cadangan secara berkala untuk menjaga kelangsungan operasional di tengah situasi yang tidak terduga. Ingin tahu lebih banyak mengenai nas synology , silahkan hubungi [email protected]