2024. július 19-én a CrowdStrike egy frissítést adott ki a Windows rendszerekre. Ez a frissítés tartalmazott egy logikai hibát a Channel File 291 nevű konfigurációs fájlban, amely a Windows rendszerben a Falcon szenzor kliensében hibát váltott ki. Ez a hiba a rendszer összeomlását és a "blue screen of death" megjelenését eredményezte, több millió eszköz világszerte érintett volt.
A Microsoft becslése szerint körülbelül 8,5 millió eszközt érintett a probléma, amely különösen a repülési, banki, egészségügyi és segélyhívó szolgáltatásokat sújtotta leginkább. Ez az incidens jelentős leállásokat okozott, ami rávilágított az IT-biztonság és az üzletmenet-folytonossági menedzsment fontosságára.
Hogyan lehetett volna elkerülni a problémát?
Alaposabb tesztelés:
A frissítés kiadása előtt széleskörű tesztelést kellett volna végezni különböző környezetekben és konfigurációkban, hogy azonosítsák a potenciális hibákat. A Falcon szenzor által támogatott összes környezetben (Mac, Linux és Windows) regressziós tesztek elvégzését, adott esetben a meglévő regressziós tesztek bővítését az új funkcióknak megfelelően.
Rollback mechanizmusok:
Gyors és hatékony rollback mechanizmusok biztosítása, amelyek lehetővé teszik a frissítés azonnali visszavonását és a szoftver visszaállítását egy korábbi, jól működő verzióra, ha hibát észlelnek. Bár a CrowdStrike visszavonta a frissítést 05:27-kor, a probléma már addigra széleskörű károkat okozott – derült ki a CrowdStrike közleményéből.
Magasabb szintű katasztrófaelhárítási terv:
A katasztrófaelhárítási terv (DRP) és üzletmenet-folytonossági terv (BCP) protokollok megléte, amelyek segítenek minimalizálni a kárt és gyorsan helyreállítani a rendszereket egy ilyen incidens után. A megfelelően kialakított, szimulációs gyakrolatokon is bizonyított tervekkel szinte automata mechanizmus indul be a krízis helyzetekben, így a cég magabiztosan képes reagálni még pánik hangulatban is.
Megelőzés és felkészülés a Neuron Software Takeover módszertannal
A Neuron Software által kínált Software Takeover (STO) módszertan kifejezetten arra fókuszál, hogy a nem megfelelő támogatással, támogatás nélkül maradt, illetve az üzlet szempontjából kiemelten fontos rendszereket, részlegesen, vagy akár teljeskörűen átvegye, stabilizálja és továbbfejlessze. A STO módszertan biztosítja, hogy csak az elvárt minőségbiztosítási kritériumoknak megfelelően tesztelt verziók kerüljenek át az ügyfeleink éles működésébe.
Azoknál a rendszereknél, ahol üzletileg és az alapműködés szempontjából különösen fontos a szoftverek 7/24-es rendelkezésre állása, a szoftverek elemzését és átvételét követően kidolgozzuk a vészhelyzeti protokollokat. Ezek a protokollok biztosítják az ügyfeleink számára a lehető leggyorsabb helyreállást és a szoftverek stabil, biztonságos működését a CrowdStrike botrányhoz hasonló helyzetekben is.
Software Takeover szolgáltatásról bővebben
Mik ennek a globális IT krízisnek a tanulságia?
A CrowdStrike-botrány rávilágított arra, hogy mennyire fontos a vállalati rendszerek folyamatos működésének biztosítása, azokra megelőző jelleggel végzett minőségbiztosítási folyamatok megléte és betartása, illetve a gyors helyreállításra való felkészülés. Mindezek mellett fontos ezen rendszerek biztonságának folyamatos felügyelete és fejlesztése. A Neuron Software STO módszertana hatékony megoldást nyújt a biztonsági kihívások kezelésére, és segít megőrizni a rendszerek üzembiztonságát a jövőben is. Az IT-biztonság és üzletfolytonosság terén a megelőzés és a folyamatos fejlesztés kulcsfontosságú, és ebben a Neuron Software megbízható partner lehet.