Newsletter Dane i Analizy, 2024-01-22

blog.prokulski.science 8 miesięcy temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

YOLO. Nie tylko "you only live once" ale - w kontekście ML/AI i computer vision - przede wszystkim modele do rozpoznawania obiektów na zdjęciach.
Doczekaliśmy się już kilku wersji algorytmu YOLO, każda kolejna jest szybsza, sprawniejsza, rozpoznająca więcej i lepiej. Na to właśnie idzie klikanie w światła drogowe albo autobusy w obrazkowych captcha ;-)
Więcej o kolejnych wersjach YOLO i ich architekturach dowiesz się z tekstu, w którym dodatkowo znajdziesz linki do tego jak trenować i używać tych modeli.

W sekcji #devops niniejszego newslettera często można znaleźć rzeczy związane z wdrażaniem systemu i całym procesem CI/CD. Ale - chyba z braku lepszego miejsca - trafiają tam też wszelkie teksty o "przydasiach" ułatwiających pracę w konsoli/terminalu. Tak jest i dzisiaj: między innymi szybki poradnik o Tmux.


#analiza_danych_koncepcje

Spotting Spatiotemporal Patterns in Earthquake Data
Czy można użyć algorytmów klasyfikacji opartych na gęstości (np. DBSCAN) do przewidywania czy w określonym miejscu wystąpi trzęsienie ziemi?

#bazy_danych

DuckDB vs ClickHouse performance comparison for structured data serialization and in-memory TPC-DS queries execution
DuckDB vs ClickHouse - który z silników jest bardziej wydajny?

Intro to SQL Indexes
Indeksy dla wszystkich! I wszystko o indeksach w bazach SQL

SQL for Google Sheets with DuckDB
DuckDB jako narzędzie do analizy i przetwarzania danych wprost z GoogleSheets? No bo dlaczego nie?

Can PostgreSQL with its JSONB column type replace MongoDB
PostgreSQL to chyba najpopularniejsza baza danych. Ma dodatki dla danych geograficznych, a natywnie ma wbudowany typ JSONB - czy więc możne zastąpić bazy NoSQL typu Mongo?

Vector Databases: A Technical Primer
68 slajdów o wektorowych bazach danych - co to, po co to, co mamy do dyspozycji? Kopalnia wiedzy do slajdów dla managementu

#bezpieczeństwo

Bezpieczeństwo API
Bezpieczeństwo API jest równie ważne co design i przydatność biznesowa. Sprawdź, o jakie aspekty bezpieczeństwa API należy zadbać.

#ciekawostki

The 5×5 Productivity Hack That Revolutionised My Day
Jak zarządzić swoim czasem aby być bardziej efektywnym, wykonać wszystkie zaplanowane zadania i... mieć więcej wolnego czasu? interesująca metoda 5×5

#devops

Gitting Things Done - A Visual and Practical Guide to Git
O co chodzi w tym całym Gicie? Duuuuża książka z obrazkami (i zrzutami ekranu).

You need to learn tmux RIGHT NOW!!
Pan w swoim specyficznym stylu pokazuje czym jest tmux i dlaczego warto go używać. YouTube, 18 minut. Kanał pana polecamy bardzo.

How to use Prometheus for web application monitoring
Wielokrotnie w tym newsletterze przewijało się hasło "wrzuć do Prometeusza" w kontekście monitorowania aplikacji. Ale chyba nie było jeszcze tak, żeby pokazać jak to działa i co konkretnie oznacza owo "wrzuć".

#powerbi

A Comprehensive Guide to Connecting Power BI with Databricks
Gdyby dane przetwarzać w Databricks a prezentować w PowerBI? Można, oto jak to zrobić.

#python

Unlocking Excel’s Power: Leverage Python for Streamlined Data Analysis and Automation
Co nie co o współpracy Pythona z Excelem (ale nie w kontekście współpracy Excela z Pythonem) - jak czytać, zapisywać i ogólnie współpracować z arkuszami Excela.

Working with live data streams in Jupyter
Korzystając z biblioteki bokeh można przygotować "biegnący na żywo" dashboard, który prezentuje dane real time, tak jak napływają.

Hands-on Python Debugging using Visual Studio Code
VSCode to nie tylko świetny i wygodny edytor kodu (w znaczeniu: narzędzie które koloruje i podpowiada składnie) ale też całkiem przydatny program do debugowania programów pisanych w Pythonie. A jak to robić? Zamiast wstawiać co linijkę printy?

Visualizing Routes on Interactive Maps with Python
Wszystko czego potrzebujesz o prezentacji danych na interaktywnych mapach z użyciem Folium

Use PyQt5 to Create a Music Player
W tym obszernym tutorialu autor pokazuje jak zbudować własny odtwarzacz plików audio w Pythonie. Razem z interface’em graficznym. YouTube, niecałe 7 godzin.

Yet Another Password Reset Tutorial in Flask
Jak zaimplementować funkcję resetu hasła we Flasku?

5 Jupyter Hacks That You Never Knew Even Existed
Kilka dodatków do Jupyter Notebook które ułatwią życie

A Comprehensive Guide to Python Docstrings
O dokumentowaniu w kodzie na przykładzie Pythona

7 Python Memory Optimization Tricks To Enhance Your Code’s Efficiency
Bardziej zaawansowane metody oszczędzania pamięci w Pythonie.

#r

Modern Data Visualization with R
Wszystko (serio!) czego potrzeba, żeby w R przygotowywać wykresy


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału