Newsletter Dane i Analizy, 2024-07-29

blog.prokulski.science 5 miesięcy temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Po zakończonym turnieju piłkarskim czas na igrzyska olimpijskie. Tu przynajmniej Polacy mają większe szanse. Ale w dzisiejszym numerze newslettera znajdziecie coś o analizie (głównie jako przestawieniu wyników w graficznej formie) spotkań piłkarskich - rozkładzie gorących miejsc czy siatce podań.

W sekcji związanej z wizualizacją danych jest też tekst, który ma na celu inspirację. Jak pokazać dane biznesowe? A może coś widać po ich pokazaniu (trendy, kierunki w których należy działać?)? Zobacz koniecznie!

Poza dość standardowymi tutorialami (jak przystało na newsletter Dane i Analizy; tu się zapisz, jeżeli ktoś podesłał Ci tego maila) - dzisiaj dawka porządnych i darmowych kursów. O computer vision od Hugging Face (zobaczcie też ich inne kursy) oraz o Bashu i pisaniu w nim skryptów.


#ai_ml

ML system design: 450 case studies
Jak najlepsze firmy stosują ML? Baza danych składającą się z 450 studiów przypadków z ponad 100 firm z praktycznymi przypadkami użycia ML i wnioskami z projektowania systemów ML.

Hugging Face Community Computer Vision Course
Darmowy kurs computer vision - brzmi dobrze? Proszę bardzo, o to jest. Hugging Face to aktualnie chyba najlepsze miejsce w internecie związane z AI - modele, zbiory danych, a teraz też nauka.

Deep Dive into LSTMs and xLSTMs
Jak działają sieci typu LSTM? Oraz czym są Extended Long-Short Term Memory (xLSTM)?

#analiza_danych_koncepcje

Spatial Index: Grid Systems
Znajdziesz tutaj opis systemu siatek w indeksowaniu przestrzennym. Czyli jak gwałtownie dotrzeć do punktu na mapie (np. zapisanych w bazie danych)

#architektura

How to Design a Hotel Booking System?
Jak zbudować aplikację pozwalającą na rezerwowanie miejsc w hotelu? Jak zaprojektować model danych? Jakie metody REST API?

#big_data

How Canva collects 25 billion events per day
Z jakiej architektury korzysta Canva przy obsłudze swoich użytkowników? A jest ich niemało...

#devops

Introduction to Bash Scripting
W dziale o AI/ML darmowy kurs computer vision, zaś tu - darmowe szkolenie z pisania skryptów w Bashu.

13 Docker Performance Optimization You Should Know
Kilkanaście sposobów ma przyspieszenie pracy z obrazami dockera. Szybsze budowanie, mniejsze obrazy, wygodne zarządzanie zależnościami - to główne tematy poruszone w tym artykule

#excel

How to Setup and Create Excel dashboards in Grafana
Grafana to jedno z bardziej popularnych narzędzi do przygotowywania wykresów (głównie w monitoringu, gdzie mamy do czynienia z danymi zmieniającymi się w czasie). A czy można użyć Grafany do pokazania danych z Excela (a adekwatnie z Google Sheets)? YouTube, 20 minut

#python

5 Python Boolean Things
Podstawy logiki w Pythonie - jak działają warunki w IF-ach?

10 Best Python EDA Tools
Nie zawsze trzeba dane wczytywać Pandasem i serią kolejnych printów przeglądać jak wyglądają. Są gotowe narzędzia, które tą serię printów zrobią za nas. Oto one. Czasem też warto sięgnąć po narzędzie BI (PowerBI, Tableau itd).

Automate Your Presentation with Python
Jak zrobić prezentację PowerPoint z poziomu Pythona? Nie jest to najbardziej optymalny sposób (lepszym wydaje się np. framework Quarto), ale działa.

Interactive Map to Display Time Series of Satellite Imagery
"Dymki" na mapie z opisami wskazanych punktów to nie jest coś wielkiego. Ale co jeżeli chcemy zaimponować i w dymku pokazać wykres? Wówczas sięgamy po tutorial taki jak ten!

Visualizing Road Networks
Jak wyrysować sieć drogową miasta? Korzystając z Pythona. pakietu OSMnx oraz (za jego pomocą) danych z Open Street Map.

A Practical Guide to using Pydantic
Dataclasses rozbudowane o walidację i serializację danych - to w uproszczeniu Pydantic. Niby tylko tyle, ale daje to ogromne możliwości. Dodatkowo FastAPI mocno korzysta z Pydantic i na przykład list zagnieżdżonych obiektów w odpowiedzi REST API to bułka z masłem - na wejściu i na wyjściu!

Fast(er)API: Optimizing Processing Time
API napisane w FastAPI może być jeszcze szybsze. Hint: TypeAdapter z Pydantic

#r

Creating a Gantt Chart in R Using Kaggle
Jak narysować wykres Gantta w R?

#spark

Apache Spark 4.0 Everything You Must Know
Nowa wersja Sparka - co nam daje? W środku wideo oraz spora (ponad 130 slajdów) prezentacja z najważniejszymi zmianami. Uwaga - domyślnym PySparkiem jest w tej chwili 3.5.1 - więc przy instalacji (na przykład do testów) trzeba wskazać odpowiednią wersję.

#wizualizacja_danych

Swiggy Resturant Analysis
Analiza danych przykładowej sieci restauracji. Źródło inspiracji do budowania dashboardów, zadawania pytań "do danych" oraz wyciągania na podstawie danych wniosków, które mają na celu rozwój biznesu. W tekście podano link do surowych danych - można spróbować zatem samodzielnej analizy

Analyzing UEFA EURO 2024 Final using Python
Analiza finałowego meczu minionych Mistrzostw Europy w Piłce nożnej. Dane pozyskane z użyciem pakietu mplsoccer.

Passing Sonars Football Viz in Python
Podobna analiza co wyżej, tym razem w innym podejściu i dane z innego źródła (pakiet StatsBomb)


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału