Newsletter Dane i Analizy, 2023-02-27

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W dzisiejszym wydaniu najwięcej miejsca poświęcam wizualizacji danych i okolicach.

Kalibracja obrazu jest okolicą (bardzo odległą - w sumie oba tematy łączy tylko to, iż mamy do czynienia z obrazem), jest też więc coś o tym. Kalibracja jest potrzebna przy problemach natury computer vision, a takowy - w postaci maskowania obiektów na obrazie - też dzisiaj poruszamy.

W poprzednim tygodniu dużym powodzeniem cieszył się tekst o MLOps (jeśli boisz się, iż umknęło - zerknij do archiwum), więc dzisiaj kontynuacja, niejako na fali z poprzedniego tygodnia.

Chyba dawno nie było przypomnienia o Kartach Data Science i bezterminowym rabacie 15%?

Jeśli jeszcze nie wiesz, Karty Data Science to zestaw, który pozwoli Ci uporządkować wiedzę z zakresu data science. Sesja egzaminacyjna co prawda się skończyła, więc studenci zdobywają nową wiedzę na bieżąco i systematycznie, ale na przykład przed rozmową rekrutacyjną - jak znalazł! Lepsza pigułka wiedzy niż nie jeden bootcamp, na pewno taniej.

Pozdrawiam serdecznie, do przeczytania za tydzień. A jeżeli Ci tęskno - zawitaj po (zazwyczaj) codzienne posty na Facebooku, Twitterze czy też LinkedIn.


#AI_ML

Mask R-CNN for Instance Segmentation
Jak działa segmentacja i maskowanie obiektów na obrazach? Na przykładzie sieci neuronowej o architekturze Mask R-CNN rozpisanej w PyTorchu

#analiza_danych_projekty

Mastodon usage - counting toots with Kafka, DuckDB & Seaborn
Wiecie o tworze Mastodon? Zobaczmy czy jest popularny! API dostarczy nowych komunikatów, Apache Kafka je przerzuci, a notebook w Python pokaże wyniki analizy.

#big_data

Decentralized Data Mesh
Działający w 12 krajach Raiffeisen Bank zbudował data mesh choćby o tym nie wiedząc

#ciekawostki

Creating Conway’s Game of Life in C++
Znacie te zasady? 1. Każda żywa komórka z mniej niż dwoma żywymi sąsiadami umiera. 2. Każda żywa komórka z dwoma lub trzema żywymi sąsiadami przeżywa. 3. Każda żywa komórka z więcej niż trzema żywymi sąsiadami umiera. 4. Każda martwa komórka z dokładnie trzema żywymi sąsiadami staje się żywą komórką

#management

5 Career Lessons for Data Engineers
Jak rozwijać swoją karierę jako data engineer? Ale nie o wiedzy i twardych umiejętnościach, a o rzeczach miękkich

#mlops

MLOps Automation
Podejście DevOps do wdrażania zmian w projektach ML - czyli Continuous Integration (CI) / Continuous Delivery (CD) / Continuous Training (CT)

Model Monitoring for Time Series
Monitorowanie modelu jest istotną częścią procesu CI/CD w uczenia maszynowego (czyli w MLOps). Zapewnia spójność i zapewnia solidność wdrożonej aplikacji. Tutaj trochę o modelu dla szeregów czasowych w PyTorch oraz jego monitorowaniu

#python

Camera Calibration on a Chessboard
Kalibracja kamery jest kluczowym krokiem w przetwarzaniu obrazu. Ma na celu oszacowanie parametrów aparatu w celu skorygowania zniekształceń przechwyconych obrazów. Biblioteka OpenCV ma do tego odpowiednie narzędzia

4 Faster Pandas Alternatives
Czy są alternatywne do Pandas rozwiązania? A czy są szybsze?

#r

Here, I collect some tricks I’ve learned about the {ggplot2} R package
Trochę sztuczek w ggplot2 i upiększania wykresów albo wręcz łączenia pół-boxplota z pół-violinem. Co to daje? Nie wiem, ale skoro można to dlaczego nie... dlaczego nie wiedzieć jak?
Zasadność użycia "dla społeczeństwa" znikoma, "dla branży" może bardziej, ale zakrawa o fetysz ;-)

#sql

Running SQL Queries in Jupyter
Jupyter Notebook to popularne środowisko do pracy dal data scientistów, a czy da się w nim bezpośrednio pisać zapytania w SQLu? Tak jak na przykład Zeppelinie?

#wizualizacja_danych

Visualization Tips for Data Story-Telling
Dobrych rad o "oczyszczaniu" wizualizacji danych nigdy dość. Tym razem głównie o kolorach, ale nie tylko

Master DataViz with Seaborn
Lead mówi o 30 typach wykresów w pythonowym Seabornie ale chyba tyle ich nie ma. Jest sporo, na szybkie resume (albo w ogóle zapoznanie się) w sam raz

Plotting Venn Diagrams in Python
Nie ma chyba prostego sposobu z użyciem Matplotlib czy innej równie popularnej biblioteki na rysowanie diagramów Venna a Pythonie, ale jest małe rozszerzenie, które rozwiązuje ten problem


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału