Newsletter Dane i Analizy, 2024-10-07

blog.prokulski.science 3 miesięcy temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj w newsletterze mały eksperyment. Być może każdego tygodnia Ty, jako odbiorca tego maila, cierpisz na nadmiar materiału, klęskę urodzaju. Jest tyle (zwykle około 20-25) tekstów, każdy chciałoby się przeczytać (wierzę w to... nawinie?), ale w sumie otwierasz te kilkanaście zakładek i nie czytasz niczego. Bo za dużo, bo po angielsku (hint: wtyczka Google Translate do Chrome daje radę, serio - chociażby po to, żeby przeskanować tekst na szybko, czytać lepiej w oryginale - chociażby nazwy zmiennych nie są wówczas tłumaczone). Zatem jak w dobrej restauracji: krótkie menu oznacza większą selekcję.

Być może jednak czegoś Ci zabrakło? Jakiegoś zagadnienia, jakiegoś obszaru? Może widząc tego maila od razu go kasujesz? Odpisz na niego i daj znać jak powinno być. Czego nie ma, czego brakuje, czego jest za dużo. To pomoże... przede wszystkim Tobie (bo przecież jak nie wyrazisz swojego zdania to nikt nie będzie mógł na nie zareagować).

A co z ponad 100 przeglądanych tekstów dzisiaj przeszło przez sito? Trochę materiałów o wizualizacji danych, ale nie tyle "jak narysować wykres", a "jak pokazać wykresem historię" (ostatni tekst w dzisiejszym newsletterze - zobaczcie jakie proste sztuczki, a jak efektowne!). Na deser ciekawostka o zwierzakach na okładkach O’Reilly, a w między czasie coś dla szykujących się do wystąpień publicznych przed gronem IT.


#ai_ml

The Comprehensive Guide to Training and Running YOLOv8 Models on Custom Datasets
Jak wiecie YOLO to szybki algorytm do rozpoznawania obiektów na obrazach. A gdybyśmy chcieli go dotrenować naszymi danymi? To korzystamy z tego przepisu.

Cleaning Data With AI Denoisers
"Odszumiacze" (obrazów albo innych danych) z wykorzystaniem ML/AI - przegląd metod i pomysłów.

#analiza_danych_koncepcje

Explaining Anomalies with Isolation Forest and SHAP
Isolation Forest to nienadzorowana metoda wykrywania anomalii oparta na drzewach. Zobacz na jej przykładzie jak można użyć KernelSHAP i TreeSHAP do wyjaśnienia wyników działania modeli.

#bazy_danych

Finally JSON_TABLE() is here
JSON w czasach mikroserwisów i komunikowania się RESTami to adekwatnie standard. PostgreSQL w wersji 17 wprowadza JSON_TABLE()

#ciekawostki

A short history of the O’Reilly animals
Dlaczego wydawnictwo O’Reilly umieszcza na swoich okładkach charakterystyczne ryciny zwierząt z XIX wieku?

Speaking for hackers
Przygotowujesz prelekcję na konferencję, a może masz po prostu wystąpić przed ludźmi z firmy? Nie ma znaczenia, bo i tak będziesz walczyć o to, aby utrzymać uwagę słuchaczy. Autor poradnika dzieli się swoimi sposobami na wciągnięcie słuchaczy w prezentację, dobre przygotowanie się do niej i dorzuca kilka porad, które mogą być dla Ciebie super cenne, zwłaszcza gdy występujesz na scenie po raz pierwszy.

#devops

18 Weird and Wonderful ways I use Docker
NetworkChuck (gość jest specyficzny, ale kanał ma całkiem dobry) pokazuje, w jaki sposób wykorzystuje kontenery Dockera w swojej codziennej pracy i dzieli się inspiracjami na użycie tego rozwiązania w kilku innych scenariuszach. YT, 26 minut

A Deep Dive into Docker Compose
Ten dość rozbudowany poradnik pokazuje, jak przenieść parametry startowe używane przy odpalaniu zdokeryzowanej aplikacji do pliku docker-compose.yaml. Poradnik zwraca również uwagę na definiowanie zmiennych środowiskowych, przedstawiając kilka metod ich deklaracji, co ma na celu ułatwienie konfiguracji usług.

#python

Building a Real-Time System Monitoring Dashboard with Python
Zróbmy sobie aplikację monitorującą nasz system (CPU, RAM itd.) i pokazującą wszystko na dashboardzie. Biblioteka Dash i wykresy Plotly w praktyce. Lepiej (praktyczniej, luźniej architektonicznie) byłoby wystawić te dane np. Prometeuszem i pokazać w Grafanie. Albo pchać na Kafkę i z niej łapać do bazy, z której byłyby prezentowane - chociażby przez aplikację z Dash (albo w Streamlit) odpytującą API zwracające wyniki z bazy. Napisz sobie te różne rozwiązania!

Hands-On Optimization Using Genetic Algorithms, with Python
Kompletny (czytaj: wystarczający, żeby zacząć) przewodnik po algorytmach genetycznych, czym one są i jak ich używać

A Quick Start Guide to Plotly Express
Chyba najczęściej gwałtownie robione wykresy (żeby zobaczyć jak wyglądają dane) to Matplotlib albo Seaborn. A może warto przychylić się do Plotly (w wersji Experss), chociażby dlatego iż daje interaktywny wynik, a w składni kilka ustępuje Seabornowi?

#wizualizacja_danych

Why They Leave: Using Data to Uncover Employee Attrition
A gdyby tak pokazać zagadnienia związane z HR na wykresach? Kilka inspiracji.

Sequential storytelling
Cztery wykresy zaprezentowane jako historia. Świetny przykład jak opowiadać dane, a nie tylko je prezentować!


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału