J-Santa 2019 | Taking first steps into Site Reliability Engineering Marcin Deryło (DataArt)

youtube.com 4 lat temu


Jako programiści chcemy gwałtownie dokonywać iteracji i zmieniać oprogramowanie, nad którym pracujemy. Z drugiej strony chcemy również, by było niezawodne, a w wyniku wprowadzanych zmian często coś się psuje. Kiedy tak się dzieje i nie da się tego uniknąć, zespoły operacyjne są niezadowolone, poniewaz skupiają się na niezawodności, a zmiany są jej wrogiem numer 1.
Pojawia się luka, tarcie pomiędzy zmianą a stabilnością. Musimy zbudować most nad przepaścią, by móc ją przekroczyć. Czas obalić schematy, posiąść i uruchomić to, co stworzyliśmy. Przenieśmy inżynierię systemu do operacji. Co może pójść nie tak?
Podczas mojej prezentacji podzielę się tym, czego nauczył mnie pierwszy rok pracy jako Site Reliability Engineer, w tym tematami takimi, jak:
• określenie, czym jest niezawodność systemu i dlaczego nie jest to takie proste, jak mogłoby się wydawać,
• pomiar niezawodności, wyznaczanie celów dotyczących niezawodności, praca z SLI, SLO i budżetem błędów,
• w jaki sposób oddanie operacji w ręce programistów może ulepszyć oprogramowanie,
• zadania, którymi na co dzień zajmują się specjaliści SRE,
• triki i wzorce, które mogą zwiększyć niezawodność naszych serwisów,
• umiejętności przydatne w pracy SRE.

_____________________________________
IT NonStop: J-Santa to konferencja poświęcona Javie, JVM i Craftsmanship w Lublinie. Wysoki poziom wystąpień, znani prelegenci, solidna dawka informacji, najnowsze technologie. Organizatorzy: DataArt Poland oraz Lublin Java User Group