Mylić się to rzecz ludzka, propagować automatycznie te błędy to DevOps... Tym razem na tapet bierzemy historie o tym, jak to produkcja płonęła i jakie wnioski zostały z tego wyciągnięte.
Dziś moimi gośćmi w podkaście są Jarek Pałka i Wojtek Ptak, a w takim gronie nie wypada zamiatać spraw pod dywan. A iż warto uczyć się na błędach, a najlepiej tych popełnianych przez innych, wyciągniemy parę naszych błędów z przeszłości. Oprócz tragikomicznych aspektów niektórych z przytoczonych tu sytuacji, będzie to bardzo dobry wstęp do znacznie ważniejszych wątków.
W tym odcinku rozmawiamy m.in. o:
- naszych błędach i wyciągniętych wnioskach,
- różnych źródłach problemów i ich typach, od błędów ludzkich po limity infrastrukturalne,
- mierzeniu rzeczy, by określić wpływ fuckupu na otaczający nas świat,
- przygotowywaniu się na incydenty, bo to nie kwestia czy wystąpią, tylko kiedy,
- jakie działania podejmować w trakcie problemu,
- kulturze postmortems, lessons-learned i upewnianiu się, iż wnioski,
- jak i kiedy komunikować o problemach,
- co zrobić, gdy fala sztormu odpłynie w dal...
Będę bardzo zobowiązany za wypełnienie krótkiej ankiety na temat tego odcinka.
Materiały dodatkowe:
- Death March - Edward Yourdon
- The Phoenix Project: A Novel About IT, DevOps, and Helping Your Business Win - Gene Kim, Kevin Behr, George Spafford
- The Facebook Outage - postmortem problemu Facebooka
- Root Cause Analysis: A Quick Guide - opracowanie na temat wspomnianego w odcinku RCA
- Software Testing Lessons Learned From Knight Capital Fiasco - analiza przypadku Knight Capital i utraty ponad 400M USD