Co to jest Data Science?

blog.strefakursow.pl 2 lat temu

Według najprostszej definicji, płynącej z bezpośredniego tłumaczenia z języka angielskiego, Data Science jest nauką o danych. Wikipedia nadała choćby temu pojęciu polskobrzmiące określenie, a mianowicie danologia. Tak przedstawione wyjaśnienie nie odpowiada jednak na najważniejsze pytania: o jakich danych mowa i dlaczego potrzebna jest odrębna dziedzina do ich badania? Aby zrozumieć, co to jest Data Science, trzeba się bliżej przyjrzeć otaczającej nas rzeczywistości.


Kurs Data Science w Python - wprowadzenie do analizy danych
5.0
(2 opinii)

Dowiedz się jak wykorzystać wszechstronność Pythona w analizie danych. Poznaj narzędzia, które pozwolą Ci pewnym krokiem wejść w świat Data Science. Dowiedz się więcej



Czym jest data w Data Science

Już od kilku lat naukowcy badają ilość informacji, które dziennie przyswaja człowiek i ich wpływ na funkcjonowanie ludzkiego organizmu. Z roku na rok liczba ta rośnie, a wraz z nią coraz głośniej się mówi o konsekwencjach zdrowotnych przeładowania danymi. Tworzymy, przetwarzamy, przesyłamy i przechowujemy ogromne ilości informacji, co stwarza liczne problemy również dla świata biznesu. Obszerne zasoby danych trudniej jest przetworzyć, trudniej też jest wyselekcjonować informacje niosące pożyteczne wartości. Pod pojęciem danych kryje tu się wszelki ślad, jaki użytkownik po sobie pozostawia - dane rejestracyjne w serwisie, wybór środka płatności lub opcji przesyłki, polubienia zdjęć, filmów, produktów… Każda z tych informacji może mieć decydujący wpływ na dalsze plany rozwojowe firmy, serwisu lub platformy. Warunkiem jest jednak umiejętne przetworzenie i wykorzystanie danych, co jest czołowym zadaniem Data Science.


Czym jest science w Data Science?

Data Science jest dziedziną interdyscyplinarną, łączącą w sobie informatykę, statystykę, matematykę, uczenie maszynowe, a także wiedzę branżową. Integracja wielu dyscyplin naukowych umożliwia precyzyjną selekcję i uporządkowanie danych, zaprojektowanie niezbędnych algorytmów oraz wysnucie celnych wniosków. Specjalista Data Science, czyli Data Scientist, musi posiadać umiejętności tworzenia narzędzi na własne potrzeby, gdyż często rozmiar lub duża różnorodność danych wykraczają poza możliwości ogólnodostępnych narzędzi biznesowych.

Gdzie wykorzystuje się Data Science?

Najwięcej korzyści z Data Science czerpie marketing. Dzięki zrozumieniu szeregów związków przyczynowo - skutkowych firmy starają się optymalizować swoją ofertę, by jak najprecyzyjniej odpowiadać na potrzeby klientów. Przyświecającym celem są tu, oczywiście, rozwój i monetyzacja. Z pomocą Data Science można zidentyfikować źródła określonych problemów i znaleźć sposoby na ich rozwiązanie - co tyczy się nie tylko zagadnień z dziedziny marketingu, ale ogólnie pojętego zarządzania przedsiębiorstwem. Data Science stoi także przykładowo za określeniem prawdopodobieństwa, czy klient spłaci kredyt, zaciągnięty w banku.

Użyteczność Data Science służy jednak nie tylko w biznesie. Analiza danych pozwala na tworzenie zaawansowanych modeli predykcyjnych, które z kolei są podstawą do powzięcia odpowiednich kroków zapobiegawczych. Przykładem są tu algorytmy przepowiadające pogodę lub potencjalne zagrożenie klęskami żywiołowymi. Przykłady można mnożyć bez końca, co jedynie uzasadnia wszechogarniający boom na Data Science i Data Scientist.

Data Science a Big data

Dwa pojęcia, które doczekały się wielu porównań i opracowań, a przez cały czas budzą wątpliwości, czym adekwatnie się różnią? Data Science dąży do wyselekcjonowania bardzo specyficznych, indywidualnych danych, do których projektuje i tworzy odpowiednie narzędzia. Owocem pracy są tu precyzyjne analizy, szacunki, modele i wizualizacje możliwych scenariuszy.

Tymczasem, Big Data operuje masami danych - ogromnymi zasobami informacji, nieuporządkowanych i zróżnicowanych. Big Data odpowiada również za gromadzenie i przechowywanie danych, które w kolejnych etapach mogą zostać spożytkowane w określony sposób. Przykładem mogą tu być gigantyczne pokłady danych, dokumentujące wszelkie ruchy klientów na kontach bankowych - wpłaty, wypłaty, a choćby miejsce zakupu i rodzaj kupowanych towarów.


Etapy pracy w Data Science

Jak w praktyce wygląda proces pozyskiwania i przetwarzania danych przez Data Scientist? Potrzeba przeprowadzenia odpowiednich analiz sygnalizowana jest przez wybraną komórkę w przedsiębiorstwie. Może to być dział sprzedaży, marketingu, logistyki lub choćby produkcji. Data Scientist musi zidentyfikować i zrozumieć zgłaszany problem, a także określić priorytety. Samodzielnie typuje rodzaj i źródło danych, które zamierza wykorzystać, po czym musi je pozyskać i uporządkować. Sam również musi dobrać adekwatne metody, stosownie do specyfiki rozwiązywanego problemu. Wyniki wykonanych badań i analiz są następnie przenoszone na modele, dostarczające potrzebnej wiedzy do realizacji wyznaczonego celu biznesowego.

Kurs Jak zacząć karierę w Data Science

Zobacz kurs

Kurs Język R od podstaw

Zobacz kurs

Kurs Język R - analiza i wizualizacja danych

Zobacz kurs

Jakie modele, przykładowo, można przygotować? Wszelkie kalkulacje, opierające się o rachunek prawdopodobieństwa, np. szacunkowe zapotrzebowanie na określony produkt w określonej lokalizacji lub czynniki, stwarzające ryzyko rozwiązania umowy przez klienta.

Czy Data Science to chwilowa moda, czy trend, który się utrzyma? Biorąc pod uwagę potężne możliwości, jakie ma do zaoferowania, spodziewać się można, iż jest to trend, który będzie się umacniał. Ogromne zasoby danych są i będą kopalnią wiedzy, z której można czerpać zbyt wiele korzyści, by z nich zrezygnować. Interesująco wyglądają również możliwości kariery w Data Science - sprawdź tutaj.

Idź do oryginalnego materiału