Jaki zawód Harvard wskazał za najbardziej atrakcyjny w XXI wieku? Tak, tak: data scientist. A czym konkretnie zajmuje się data scientist?
Data scientist, często tłumaczony jako „naukowiec ds. danych” albo analityk big data, zajmuje się przede wszystkim danymi. Tacy specjaliści wywodzą się jednak z wielu różnych środowisk edukacyjnych i zawodowych, natomiast większość z nich powinna być silna w czterech podstawowych obszarach. Jakich? Konkretnie: biznes, matematyka (w tym statystyka i prawdopodobieństwo), informatyka (np. architektura oprogramowania), komunikacja (zarówno pisemna, jak i ustna).
Są też inne umiejętności i specjalizacje, które są ważne dla data scientist, niemniej te powyższe należy uznać za podstawowe.
W praktyce zdecydowana większość specjalistów będzie mogła pochwalić się świetnymi osiągnięciami w jednym lub dwóch z tych filarów, np. w matematyce i komunikacji.
Czym zajmuje się data scientist
Jeśli oprzemy się na tych filarach, definicja analityka big data czy analityka danych będzie dość prosta do sformułowania. To osoba, która powinna być w stanie wykorzystać istniejące źródła danych. I tworzyć w razie potrzeby nowe zbiory, w celu wyodrębniania istotnych informacji i praktycznych wniosków. Data scientist wykonuje te zadania dzięki fachowej wiedzy w dziedzinie biznesu, skutecznej komunikacji i interpretacji wyników. Do tego wykorzystuje odpowiednie techniki statystyczne, języki programowania, pakiety systemu i biblioteki.
Efekty pracy data scientist to spostrzeżenia, które powinny być wykorzystywane do podejmowania decyzji biznesowych. I takich, które pozwalają podejmować konkretne działania, przybliżające do realizacji celu.
Stephan Kolassa ma odpowiedni diagram
Stephan Kolassa, ceniony data scientist z SAP, a także autor książki „Demand Forecasting for Managers”, przygotował swojego czasu świetny diagram Venna. Taki diagram jest schematem ilustrującym zależności między zbiorami. Oto diagram, o którym mowa:
Autor: Stephan Kolassa
Diagram Kolassy określa doskonałego analityka danych jako osobę, która jest równie silna w biznesie, programowaniu, statystyczne i komunikacji.
Jakie cele realizuje data scientist? Oto typowe zadania i działania takich specjalistów:
- Przewidywanie (na podstawie danych wejściowych)
- Klasyfikacja
- Rekomendacje
- Wykrywanie i grupowanie wzorców
- Wykrywanie anomalii
- Rozpoznawanie
- Analizy praktyczne (za pośrednictwem pulpitów nawigacyjnych, raportów, wizualizacji itp.)
- Zautomatyzowane procesy i podejmowanie decyzji (np. zatwierdzanie kart kredytowych)
- Punktacja i ranking
- Segmentacja
- Optymalizacja
- Prognozy (np. prognozowana sprzedaż)
Zależnie od firm, w której będzie pracował data scientist, jego zadania i główne cele mogą być różne. Niemniej właśnie tego typu działania będzie realizował.
IT-Leaders.pl to pierwsza w Polsce platforma łącząca Specjalistów IT bezpośrednio z pracodawcami. Anonimowy, techniczny profil i konkretnie określone oczekiwania finansowe to tylko niektóre z cech wyróżniających platformę. Zarejestruj się i zobacz jak Cię widzi pracodawca.