Newsletter Dane i Analizy, 2022-08-22

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Czy mniejsza liczba artykułów (nie wiem czy to zauważalne...) to dla Was lepiej czy gorzej? Przeczytacie w związku z tym więcej (wszystkie?) czy tak samo jak zwykle 2-3, a reszta to nuda?

Dzisiejszy numer to nieco eksperyment ale - przyznajmy to szczerze - wynik sezonu wakacyjnego. Oj ciężko się zebrać do roboty, ciężko...


#AI_ML

MLU-Explain
Jak działają lasy losowe? Co to jest krzywa ROC i AUC? jeżeli nie wiesz to ten serwis w przystępny, graficzny sposób pomoże to zrozumieć

Multi-Task Learning for Classification with Keras
Multiple-Task Learning - czyli krótko mówiąc jeden model do dwóch zadań. Jedno z zadań (w przykładzie) to rozpoznawanie czy na obrazku jest zwierze czy pojazd (klasyfikacja binarna), a drugie - co konkretnie jest na obrazku (tutaj: samolot, auto, ptak, kot itd)

#analiza_danych_koncepcje

How Autoencoders Outperform PCA in Dimensionality Reduction
Autoenkodery to modne ostatnio pojęcie. Zobaczcie na przykładzie redukcji wymiarów dlaczego

#analiza_danych_projekty

Time Series Prediction using Spark
Jak za godzinę będzie wyglądał ruch w mieście? interesujące zagadnienie, Spark (i Kafka Streams) przychodzą z pomocą

#big_data

Building CQRS Views with Debezium, Kafka, Materialize, and Apache Pinot
Jak budować szybkie, adekwatnie realtime’owe widoki na ciągle zmieniające się dane? Poznajcie Apache Pinot

Spark Tips: optimizing JDBC data source reads
Sprytny trick przyspieszający odczytywanie danych przez Sparka ze źródeł JDBC (w przykładzie z PostgreSQL)

#ciekawostki

Build Your Own Mobile Proxy for Web Scraping
Rozwiązanie bazuje na Raspberry Pi i modemie GSM: Malinka steruje modemem, cyklicznie zmieniając sobie adresy IP i uruchamia aplikacje do pobierania danych ze stron docelowych

Control all GPIOs with the Raspberry Pi REST API via Python
API do sterowania podłączoną do Raspberry płytką (i na przykład znajdującymi się na niej diodami)

Generate regular expressions from test cases
Podaj próbki tekstów, które powinny przechodzić przez Twoje wyrażenie regularne, rozdzielając je spacją lub pipem. Generator przygotuje dla Ciebie wyrażenie, do którego pasują jedynie podane przez Ciebie próbki

#devops

VSCode Extensions for DevOps
DevOps Engineer też może używać VSCode. I choćby znajdzie do swojej pracy kilka przydatnych rozszerzeń (Ansible, Docker, Kubernetes)

#kafka

Understanding Kafka key concepts
Po co są klucze w komunikatach przesyłanych przez Apache Kafka? Ostatnio pytamy na to na rozmowach kwalifikacyjnych, więc to może się okazać przydatna wiedza. Ale nie tylko z tego powodu

#python

FastAPI Best Practices and Conventions
Świetne repo ze zbiorem najlepszych praktyk przy używaniu FastAPI. Zebrane z konkretnego projektu, więc można ufać

#wizualizacja_danych

The Magic of Matplotlib Stylesheets
Wykresy generowane w pythonowej bibliotece matplotlib nie należą do najpiękniejszych. Ale biblioteka ta umożliwia w pewnym sensie "stylowanie" wszystkich wykresów poprzez zmianę domyślnych parametrów

Visualize Gender-Specific Tweets with Scattertext
Scattertext to biblioteka dla Pythona pozwalająca na przedstawienie na interaktywnym wykresie danych tekstowych


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału