Co się dzieje, gdy infrastruktura informatyczna jest zbyt duża, aby mogła ulec awarii?

cyberfeed.pl 2 miesięcy temu


Dzisiejsze awarie w systemie Microsoft, związane z Aktualizacja Crowdstrike’a, pokazuje ogromne ryzyko, na jakie się narażamy, gdybyśmy włożyli wszystkie jaja do jednego, wielkiego, obejmującego cały świat koszyka.

Niektórzy współpracownicy początkowo sugerowali, iż było to częścią skoordynowanego ataku na infrastrukturę Microsoftu, co choć okazało się nieprawdą, było uzasadnionym przypuszczeniem, biorąc pod uwagę ciągłe problemy z hakerami sponsorowanymi przez państwo.

Jednak zamiast masowego ataku hakerskiego, przyczyną awarii są jedynie problemy administracyjne i związane z łataniem błędów IT – które w rzeczywistości odpowiadają za większość awarii Microsoft Azure i M365, choć rzadko mają tak rozległy wpływ. Ironią tego konkretnego incydentu jest to, iż tym razem problemy nie są spowodowane działalnością Microsoft, ale są związane z Falcon z Crowdstrike’a aktualizacja zabezpieczeń została odkryta na dużej liczbie komputerów stacjonarnych i serwerów z systemem Windows.

Nie chodzi więc o to, iż Microsoft strzelił sobie w stopę (ponownie), ale o to, iż tym razem zrobił to bliski i zaufany przyjaciel. Wątpię, aby to wyróżnienie dało Redmondowi wiele pocieszenia.

Fakt, iż „niewłaściwie zastosowane środki ochronne” doprowadziły do ​​tak natychmiastowego chaosu w wielu krajach i sektorach przemysłu, może być dla wielu zaskoczeniem. Prawda jest jednak taka, iż ​​infrastruktura chmury publicznej jest niezwykle złożona i zaskakująco delikatna.

Numery pojawiły się po raz pierwszy Strona aktualizacji Azure wczoraj wieczorem z awarią w regionie Azure US Central około 22:00 UTC, chociaż nie jest w 100% jasne, iż jest to ten sam problem, który w tej chwili widzimy, ponieważ później zgłoszono, iż problemy z Azure zostały naprawione do 6:30 rano czasu brytyjskiego dzisiaj. To było niedługo przed tym, jak Wielka Brytania zaczęła się budzić, łączyć się z siecią i odkrywać, iż w ciągu nocy uniknęliśmy dość dużej kuli. Daleki Wschód, a choćby części Europy, które działają w strefach czasowych przed nami, nie poradziły sobie tak dobrze, a wiele linii lotniczych, lotnisk, usług transportowych, banków i usług przetwarzania finansowego zostało dotkniętych.

Nawet w Wielkiej Brytanii odnotowano wpływ na pociągi, NHS, usługi finansowe i szereg usług komercyjnych, a także zagadkową i bardzo publiczną przerwę w transmisjach Sky News na kilka godzin. Jednak w chwili pisania tego tekstu strona aktualizacji Azure zaczęła informować, iż problemy dotyczą głównie samych maszyn wirtualnych. Microsoft zaleca, aby firmy przywracały wersje kopii zapasowych sprzed godziny 19:00 UTC 18 lipca.

Potwierdza to, iż problem wynika z automatycznej poprawki lub wdrożenia wykonanego po tym czasie, ale który mógł rozprzestrzenić się globalnie, praktycznie do każdego regionu globalnego firmy Microsoft – jedynie w Meksyku, środkowej Hiszpanii i Chinach nie zaobserwowano zakłóceń.

Ponadto tym razem rząd USA najwyraźniej został oszczędzony, potencjalnie dlatego, iż korzysta z innej infrastruktury informatycznej – chociaż w nazwie swojej chmury używa słowa „Azure”, to nie jest to ta, której używa reszta świata (oraz rząd Wielkiej Brytanii).

Ryzyko dla brytyjskich usług publicznych

Computer Weekly niedawno poinformował, iż Microsoft ujawnienie, iż pomimo zapewnień składanych przez wiele lat, iż jej usługi są w 100% hostowane, obsługiwane i wspierane w Wielkiej Brytanii, w rzeczywistości tak nie jest.

Powodem do zmartwień dla obywateli Wielkiej Brytanii powinien być fakt, iż w ciągu ostatnich 10 lat brytyjski rząd przeniósł podstawowe usługi bezpośrednio na platformy chmurowe Microsoftu, które nie są przeznaczone wyłącznie do użytku rządowego, ani choćby nie są zlokalizowane w 100% na terenie Wielkiej Brytanii — jest to ta sama usługa dostępna dosłownie dla wszystkich klienta Microsoftu mieszkającego w dowolnym miejscu na świecie.

Oznacza to, iż w brytyjskim sektorze publicznym nie obowiązują żadne specjalne warunki, żadne szczególne środki ochrony bezpieczeństwa, a co najważniejsze, nie ma on priorytetu w zakresie obsługi klienta nad sklepem osiedlowym, który ma roczną subskrypcję M365.

Policja, służby 999, służba zdrowia, a choćby sama tkanka naszego społeczeństwa publicznego, wszystkie znajdują się w chmurze Microsoft Cloud lub są od niej w pewnym stopniu zależne. W końcu usługi w chmurze mają pewne powiązania, co wyjaśnia również ograniczone raporty o problemach z AWS i Google Cloud dzisiaj – są one niemal na pewno powiązane z ich kanałami Microsoft Connected Feeds lub urządzeniami Windows.

Ważne jest, abyśmy zdali sobie sprawę, iż platformy Azure i M365 nigdy nie zostały zaprojektowane do tego typu usług, do których poprzedni rząd używał chmury Microsoft. W rzeczywistości warunki korzystania z usługi ostrzegają przed poleganiem na dostępności platformy Microsoft i surowo zabraniają jej używania do przetwarzania o wysokiej wartości, gdzie zakłócenia mogłyby spowodować szkody dla osób lub znaczne straty finansowe.

Pomimo tego, kierując się zasadą „najpierw chmura” obowiązującą w poprzedniej administracji, liderzy IT w rządzie Jego Królewskiej Mości bez wahania rzucili się na chmurę Microsoftu, nie podejmując żadnych lub prawie żadnych działań, aby potwierdzić, czy rozwiązanie to rzeczywiście odpowiada ich potrzebom.

Ten wyraźny punkt odłączenia mógłby zostać wykorzystany do zwolnienia Microsoftu z odpowiedzialności, gdyby nie był zbyt szczęśliwy, pozwalając na włączenie usług krytycznej infrastruktury narodowej (CNI). Czy nowy rząd będzie kontynuował tę praktykę, pozostaje do sprawdzenia, ale przynajmniej jeden z niedawno ogłoszonych środków z Kings Speech przyniósłby korzyści w naszej obecnej sytuacji, z obowiązkiem powiadamiania o problemach cybernetycznych.

Jest bardzo mało prawdopodobne, iż kiedykolwiek adekwatnie zrozumiemy naturę, skalę i wpływ tego incydentu, ponieważ istnieje niewielka zachęta i brak konieczności zgłaszania tych informacji. To coraz większy problem, ponieważ nasze zobowiązania krajowe i narażenie na ryzyko są niemożliwe do określenia bez tych informacji. W tej chwili naprawdę nie wiemy, jakie informacje przechowujemy w chmurze ani w jakiej chmurze się znajdują.

Podczas gdy poprzedni rząd uważał, iż „agregację” można zignorować, właśnie dzisiaj dowiedzieliśmy się, iż trzymanie wszystkich jajek w jednym koszyku może być złym pomysłem.

Jako kraj jesteśmy narażeni jak nigdy wcześniej i jest to ostrzeżenie, na które powinniśmy zwrócić uwagę. Chociaż nie chcę być zwiastunem złych wieści, to jest to kolejny możliwy obszar kryzysu, który nowy rząd musi traktować priorytetowo.



Source link

Idź do oryginalnego materiału