Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
W dzisiejszym wydaniu najwięcej miejsca poświęcam wizualizacji danych i okolicach.
Kalibracja obrazu jest okolicą (bardzo odległą - w sumie oba tematy łączy tylko to, iż mamy do czynienia z obrazem), jest też więc coś o tym. Kalibracja jest potrzebna przy problemach natury computer vision, a takowy - w postaci maskowania obiektów na obrazie - też dzisiaj poruszamy.
W poprzednim tygodniu dużym powodzeniem cieszył się tekst o MLOps (jeśli boisz się, iż umknęło - zerknij do archiwum), więc dzisiaj kontynuacja, niejako na fali z poprzedniego tygodnia.
Chyba dawno nie było przypomnienia o Kartach Data Science i bezterminowym rabacie 15%?
Jeśli jeszcze nie wiesz, Karty Data Science to zestaw, który pozwoli Ci uporządkować wiedzę z zakresu data science. Sesja egzaminacyjna co prawda się skończyła, więc studenci zdobywają nową wiedzę na bieżąco i systematycznie, ale na przykład przed rozmową rekrutacyjną - jak znalazł! Lepsza pigułka wiedzy niż nie jeden bootcamp, na pewno taniej.
Pozdrawiam serdecznie, do przeczytania za tydzień. A jeżeli Ci tęskno - zawitaj po (zazwyczaj) codzienne posty na Facebooku, Twitterze czy też LinkedIn.
#AI_ML
Mask R-CNN for Instance Segmentation
Jak działa segmentacja i maskowanie obiektów na obrazach? Na przykładzie sieci neuronowej o architekturze Mask R-CNN rozpisanej w PyTorchu
#analiza_danych_projekty
Mastodon usage - counting toots with Kafka, DuckDB & Seaborn
Wiecie o tworze Mastodon? Zobaczmy czy jest popularny! API dostarczy nowych komunikatów, Apache Kafka je przerzuci, a notebook w Python pokaże wyniki analizy.
#big_data
Decentralized Data Mesh
Działający w 12 krajach Raiffeisen Bank zbudował data mesh choćby o tym nie wiedząc
#ciekawostki
Creating Conway’s Game of Life in C++
Znacie te zasady? 1. Każda żywa komórka z mniej niż dwoma żywymi sąsiadami umiera. 2. Każda żywa komórka z dwoma lub trzema żywymi sąsiadami przeżywa. 3. Każda żywa komórka z więcej niż trzema żywymi sąsiadami umiera. 4. Każda martwa komórka z dokładnie trzema żywymi sąsiadami staje się żywą komórką
#management
5 Career Lessons for Data Engineers
Jak rozwijać swoją karierę jako data engineer? Ale nie o wiedzy i twardych umiejętnościach, a o rzeczach miękkich
#mlops
MLOps Automation
Podejście DevOps do wdrażania zmian w projektach ML - czyli Continuous Integration (CI) / Continuous Delivery (CD) / Continuous Training (CT)
Model Monitoring for Time Series
Monitorowanie modelu jest istotną częścią procesu CI/CD w uczenia maszynowego (czyli w MLOps). Zapewnia spójność i zapewnia solidność wdrożonej aplikacji. Tutaj trochę o modelu dla szeregów czasowych w PyTorch oraz jego monitorowaniu
#python
Camera Calibration on a Chessboard
Kalibracja kamery jest kluczowym krokiem w przetwarzaniu obrazu. Ma na celu oszacowanie parametrów aparatu w celu skorygowania zniekształceń przechwyconych obrazów. Biblioteka OpenCV ma do tego odpowiednie narzędzia
4 Faster Pandas Alternatives
Czy są alternatywne do Pandas rozwiązania? A czy są szybsze?
#r
Here, I collect some tricks I’ve learned about the {ggplot2} R package
Trochę sztuczek w ggplot2 i upiększania wykresów albo wręcz łączenia pół-boxplota z pół-violinem. Co to daje? Nie wiem, ale skoro można to dlaczego nie... dlaczego nie wiedzieć jak?
Zasadność użycia "dla społeczeństwa" znikoma, "dla branży" może bardziej, ale zakrawa o fetysz ;-)
#sql
Running SQL Queries in Jupyter
Jupyter Notebook to popularne środowisko do pracy dal data scientistów, a czy da się w nim bezpośrednio pisać zapytania w SQLu? Tak jak na przykład Zeppelinie?
#wizualizacja_danych
Visualization Tips for Data Story-Telling
Dobrych rad o "oczyszczaniu" wizualizacji danych nigdy dość. Tym razem głównie o kolorach, ale nie tylko
Master DataViz with Seaborn
Lead mówi o 30 typach wykresów w pythonowym Seabornie ale chyba tyle ich nie ma. Jest sporo, na szybkie resume (albo w ogóle zapoznanie się) w sam raz
Plotting Venn Diagrams in Python
Nie ma chyba prostego sposobu z użyciem Matplotlib czy innej równie popularnej biblioteki na rysowanie diagramów Venna a Pythonie, ale jest małe rozszerzenie, które rozwiązuje ten problem
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)