Porting kodów ze Splunka na Pysparka

Tytuł projektu: Porting kodów ze Splunka na Pysparka
Klient: globalny lider w bankowości korporacyjnej
Branża: Banking, Finance & Insurance
Ekspertyza: Cloud & Infrastructure
Zakres projektu: projektowanie infrastruktury
Narzędzia: Databricks, Pyspark, Python, Azure
Porting kodów to proces przepisywania skryptów z jednego języka programowania na inny. Nowoczesne języki programowania, biblioteki i platformy oferują bardziej zaawansowane funkcjonalności, lepszą wydajność i niższe koszty utrzymania. Z tego powodu technologie początkowo używane w projekcie mogą okazać się niewystarczające wobec rosnących wymagań dotyczących szybkości obliczeń, pojemności baz danych czy obsługi dużych wolumenów danych.
Dlaczego wybrano Pysparka, Databricks i Azure?
Te technologie zapewniają rozproszone obliczenia, efektywne przetwarzanie dużych wolumenów danych oraz elastyczność w przechowywaniu zarówno danych surowych, jak i przetworzonych. Wykorzystanie Delta Tables w Data Lake umożliwia łatwe odtwarzanie danych i ponowne kalkulacje metryk, czego brakuje w tradycyjnych bazach danych.
Zadanie ALTEN Polska
Klient stanął przed wyzwaniem przepisania setek skryptów napisanych w języku Splunk. Istniejąca baza danych nie była przystosowana do obsługi dynamicznie rosnących wolumenów danych ani wielu równoczesnych użytkowników. ALTEN Polska podjął się realizacji tego zadania, przenosząc skrypty na Pysparka w środowisku Databricks, zintegrowanym z platformą Azure.
Przebieg projektu
Projekt rozpoczął się od analizy istniejącej infrastruktury oraz zrozumienia potrzeb biznesowych klienta. Opracowano podejście ogólne i wykonano proof of concept (PoC) na wybranych danych. Następnie utworzono workspace’y na platformie Databricks oraz skonfigurowano połączenia z Azure Storage i Data Lake. Po akceptacji standardów kodowania zespół inżynierów rozpoczął przepisywanie skryptów z języka Splunk na Pysparka.
Efekt końcowy
- Wszystkie skrypty zostały przepisane i zintegrowane z workflowami Databricks.
- Czas obliczeń znacząco się skrócił.
- Skalowalne klastry pozwoliły zmniejszyć koszty operacyjne.
- Ujednolicony format kodów ułatwia wdrażanie nowych inżynierów.
Rozwiązanie umożliwia dalszy rozwój w obrębie tego samego środowiska, z możliwością integracji dodatkowych języków programowania, takich jak Scala czy SQL. Platforma Databricks, dzięki stałemu wsparciu i rozwojowi, zapewnia klientowi długoterminowe korzyści technologiczne i operacyjne.

Banking, Finance & Insurance
Poznaj ekspertyzę ALTEN Polska w branży bankowej!

Poszukujesz podobnego rozwiązania?
Skontaktuj się z nami!