Newsletter Dane i Analizy, 2025-01-06

blog.prokulski.science 1 dzień temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W dniu, gdy tradycyjnie Trzej Mędrcy dotarli do celu swojej podróży kierując się gwiazdą, ja przybywam z kolekcją wartościowych znalezisk ze świata Pythona i analizy danych. Mędrcy przynieśli złoto, kadzidło i mirrę - dzisiejsze wydanie niesie pakiet różnorodnych artykułów, które (mam nadzieję) okażą się równie cennymi darami dla Twojego rozwoju zawodowego.

W tym wydaniu znajdziesz standardowo kilka praktycznych materiałów z zakresu data science: od budowania systemu tradingowego opartego na średniej kroczącej, przez analizę szeregów czasowych, aż po wykorzystanie biblioteki statsmodels.
Dla osób zainteresowanych automatyzacją wdrożeń (i nie tylko) mamy podstawową dawkę wiedzy o GitHub Actions i skryptach bashowych, a na koniec dość klasyczna integracja FastAPI z Reactem.

Na szczególną uwagę zasługuje temat wydajności i optymalizacji - zobacz jak radzić sobie z miliardami rekordów przy użyciu SQL (i wsparciu DuckDB), a także poznaj uv - szybkie narzędzie do zarządzania środowiskami Pythona, o którym mamy dwa artykuły i kwadrans w wideo od Arjana.

Koniecznie rzuć okiem na raport od Jetbrains "Software Developers Statistics 2024".

Czy to podsumowanie jest lepsze niż zwykle? Praca nad stylem wstępniaków trwa! A i tak nie czytasz tego :P


#analiza_danych_projekty

Building a Mean Reversion Trading System
Czy maszyna może sama handlować akcjami? A jak wypracować odpowiednią metodę? W tym tutorialu dowiesz się jak wykorzystać wskaźniki analizy technicznej do optymalizacji "ruchów w portfelu"

A Hands-On Guide to Exploratory Data Analysis for Time Series
W tym artykule Autor przedstawia ustrukturyzowane i praktyczne podejście do eksploracyjnej analizy danych (EDA) dla szeregów czasowych.

Unlocking Python’s Statsmodels: A Comprehensive Guide
Modelowanie statystyczne i analizę dzięki bibliotece Statsmodels - wszystko co jest potrzebne na początek.

#bezpieczeństwo

Exploiting McDonald’s APIs to hijack deliveries and order food for a penny
Autor odkrył luki w systemie McDelivery w Indiach, które umożliwiały realizację zamówień za jednego centa, a w dodatku przejmowanie i śledzenie cudzych zamówień. Wykorzystanie API pozwoliło na dostęp do danych wrażliwych i manipulowanie zamówieniami w czasie rzeczywistym. Dobra lektura dla wielbicieli tematyki websecurity ale też dla projektantów publicznego API

#ciekawostki

Software Developers Statistics 2024
Co roku powstaje raport "State of Developer Ecosystem Report", w którym Jetbrains łapie migawkę świata programistów. W 2024 raport powstał na podstawie odpowiedzi ponad 23 tysięcy deweloperów z całego świata. Pokazuje on co jest najważniejsze dla środowiska: od języków programowania, narzędzi i technologii, na których polegają, po najważniejsze kwestie kształtujące branżę.

Amsterdam as seen by a weather model
Jak modele przewidujące pogodę widzą miasta?

#data_engineering

Handling Billions of Records in Minutes with SQL
Konkursy na przetważanie miliardów rekordów już były prezentowane na łamach niniejszego newslettera (zobacz stronę 1brc.dev). Tutaj mamy podobnie duże dane i w dodatku dane przestrzenne. Oraz demonstrację możliwości DuckDB

#devops

10 Essential Scripting Constructs for Every Engineer
O pisaniu skryptów Bash było sporo, a kolejna dawka nie zaszkodzi. Tym bardziej, iż to co znajdziesz w tym tekście jeszcze chyba na łamach newslettera nie zaistniało (a przynajmniej część z tego)

10 Essential GitHub Actions to Automate Your Workflow
Szybkie wprowadzenie w GitHub Actions - jak zaprojektować konkretne czynności, jakie YAMLe napisać?

#llm_&_chatgpt

How to Build a Graph RAG App
Ten artykuł dotyczy tworzenia prostej aplikacji Graph RAG i użycia danych do zbudowania grafów wiedzy, aby potem móc wyszukiwać, filtrować i podsumowywać artykuły (tutaj pobranych z czasopism medycznych).

#programowanie_ogólnie

Exploring alternatives to UUIDv4; Enter ULIDs.
Tworząc nową aplikację, już niewielu programistów zastanawia się, jak budować unikalne identyfikatory zasobów. Wybór pada najczęściej na UUIDv4, bo to popularny format unikalnych identyfikatorów wykorzystywany w systemach rozproszonych. Na UUID jednak świat się nie kończy i istnieją nowe formaty, takie jak np. ULID, oferujące swoje korzyści, których nie ma UUID. Jakie są plusy i minusy tego rozwiązania i dlaczego i kiedy warto się na nie zdecydować?

#python

Integrating FastAPI with React
Klasyczne podejście: rozdzielenie frontu i backendu. Front w React, backend w Pythonie. Jak serwować z Pythona dane do frontendu?

Transforming Data into Solutions: Building a Smart App with Python and AI
Autor opisuje jak przygotował swój system rekomendacji przepisów kulinarnych w oparciu o Pythona i zbiór danych w MongoDB

Lazy self-installing Python scripts with uv
uv do zarządzania pakietami (i nie tylko) w Pythonie jest bardzo szybki. Więc, może skorzystać z okazji i wykorzystać tę cechę do instalacji potrzebnych pakietów w locie, przy uruchomieniu skryptu? W dodatku w ramach skryptu shellowego?

Managing Python Virtual Environments with UV: A Comprehensive Guide
A jeżeli nie znasz jeszcze uv to ten tekst pokaże Ci w mega skróconej wersji o co chodzi. jeżeli masz doświadczenia z pip oraz środowiskami wirtualnymi to adekwatne ten mini-przewodnik jest wystarczający do poznania podstaw pracy z uv.

#środowisko_pracy

Full Neovim Setup from Scratch in 2025
Przeglądając wiele (oj wiele) źródeł w przygotowaniu newslettera widzę, iż Neovim przybiera na popularności. Ludzie budują całkiem potężne narzędzie z tego - jak by się mogło wydawać - prostego edytora. Tutaj materiał o tym jak skonfigurować ten edytor [YT, godzina]


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału