Newsletter Dane i Analizy, 2024-06-17

blog.prokulski.science 3 miesięcy temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W minionym tygodniu miało swoją premierę narzędzie, które w ramach GenAI potrafi ożywić zdjęcia. Mowa o Luma. Oczywiście pojawiło się już kilka ożywionych memów albo okładek płyt. W ciekawą idzie to stronę... Pamiętajcie jednak, iż zanim wrzucicie w tego typu maszynki swoje prywatne zdjęcia żeby przeczytać regulamin (ten z LumaLabs AI na wiele im pozwala).

W minionym tygodniu rozpoczęło się też Euro 2024 i to pewnie części z Was zajmuje sporo czasu. Szkoda tylko, iż FiveThirtyEight.com przestało się zajmować sportem - bardzo fajne modele predykcyjne mieli na temat sportu. Za to (przed startem turnieju) swoje predykcje przygotował Eurosport.


#ai_ml

PyTorch vs TensorFlow
Proste porównanie dwóch frameworków do pracy z sieciami neuronowymi.

How to Build NLP Applications with Hugging Face?
Jak zbudować aplikacje do pracy z tekstem korzystając z gotowych projektów (głównie modeli) z Hugging Face?

Turning YouTube Videos into Summaries with GPT-4
TL;DV - czyli tutorial pokazuje jak korzystając z sieciowych usług zbudować narzędzie, które podsumuje filmy na YouTube. Najpierw z tekstu mówionego w filmie budowany jest zapis, który da się mechanicznie podsumować.

#analiza_danych_koncepcje

Data Validation with PyTest
Testy jednostkowe zastosowane do testowania czy dane dostarczane do modeli się nie zmieniają.

Analyzing and Visualizing Event Sequence Data
W swoim wykładzie autor omawia, jak bezpośrednio pracować z sekwencjami zdarzeń, koncentrując się na analizie eksploracyjnej i generowaniu hipotez. YT, 20 minut

Two Correlation Coefficients You May Not Have Heard
Dwa podejścia do korelacji, nieco inne niż znane dotychczas. Inspirujące.

Model Interpretability Using Credit Card Fraud Data
Jak działa model? Które cechy mają wpływ? Kilka podejść do tzw. wyjaśnialności modelu

#architektura

Domain-Driven Design w świecie Heroes III
O DDD i Event Modelingu na przykładzie znanej gry. Świetna seria!

The Granularity Conundrum
Kiedy monolit, moduł, a kiedy mikroserwis? Propozycja podziału aplikacji na mniejsze.

#bazy_danych

MongoDB at Kubernetes
Wdrożenie MongoDB na klastrze Kubernetesa, a dodatkowo w gratisie - wykorzystanie MongoDB z poziomu Javy.

#devops

Automating Docker Image Builds and Deployment with GitHub Actions and Watchtower
Prosta wersja prostego przepływu budującego obrazy Dockera dla naszej aplikacji po każdym wypchnięciu kodu do głównego brancha.

#python

Simplifying the Python Code for Data Engineering Projects
Kilka sztuczek, pomysłów i uproszczeń w kodzie związanym z przetwarzaniem danych - na całym jego procesie, razem z testami jednostkowymi.

Data pipeline recipes in Python
I jeszcze jeden - dość spory - pakiet wskazówek jak ułatwić sobie pisanie kodu w Pythonie służącego przekształcaniu danych

How to Make Python Forms as a Pro
Przygotowanie i obsługa formularzy przez WWW przy wsparciu Flask-WTF i Jinja

Deploy a LightGBM ML Model With GitHub Actions
GitHub Actions zamiast na przykład AirFlow. Akcje zapewniają cykliczne uruchomienie skryptu skorującego dane i automatycznie wrzucającą do repo wynik.

#sql

Anatomy of Windows Functions
Teoria i praktyka SQLowych funkcji działających na oknach czyli grupach. Skumulowana suma w czasie w ramach grupy produktów? Właśnie do tego można ich użyć

How to Pivot Tables in SQL
Jak zrobić znaną z Excela tabelę przestawną w SQL?

#wizualizacja_danych

Visualizing music
Jak pokazać muzykę? Można pokazać zapis nut na pięciolinii, można też nieco bardziej fantazyjnie.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału