Newsletter Dane i Analizy, 2025-02-03

blog.prokulski.science 4 godzin temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj różnorodne tematy: od pracy z bazami danych, przez harmonogramowanie zadań w Dockerze, aż po integrację nowoczesnych modeli LLM w aplikacjach Python. Nie zabraknie także praktycznych wskazówek dotyczących testowania kodu oraz efektywnego zarządzania danymi w projektach ML.

Warte zwrócenia uwagi w tym wydaniu:

Getting Started with ChromaDB - Odkryj możliwości bazy danych ChromaDB i naucz się, jak efektywnie jej używać. Docker + Cron - Dowiedz się, jak zintegrować harmonogramowanie zadań w Dockerze. Getting Started with fzf - Poznaj fzf i jego zastosowania w codziennej pracy. Integrating DeepSeek into your Python Applications - Przewodnik po integracji DeepSeek w aplikacjach Python. Unit Testing for Data Science with Python - Wprowadzenie do testów jednostkowych w kontekście nauki o danych. Dynamic Forms with Flask - Jak tworzyć dynamiczne formularze w aplikacjach webowych przy użyciu Flask.

Jedna uwaga, bo piszecie w listach, iż znowu teksty z płatnego Medium.com... Ale 5 dolarów na miesiąc to nie jest dużo. Zawsze można próbować bokiem przez jakieś Freedium, ale tego nie mówiłem.

W zeszłym tygodniu najchętniej czytaliście:

How Spotify Streams 5.5 Billion + Songs Daily: A Deep Dive Into the Tech Stack 10 Tips to Become REALLY Good at Python (to akurat wideo, Arjan zawsze na propsie!) Predicting Bitcoin Price in Real-Time using MLOps


#bazy_danych

Getting Started with ChromaDB
ChromaDB to baza danych typu open source zaprojektowana do wydajnego obsługiwania osadzenia i wyszukiwania wektorowego. Jak z nią współpracować

#devops

Docker + Cron
Artykuł pokazuje jeden z wielu sposobów wbudowania harmonogramu uruchamiania zadań (cron) do obrazów Dockera.

Getting Started with fzf
Poznaj podstawy fzf (fuzzy finder) i dowiedz się, jak łączyć fzf z innymi poleceniami, aby tworzyć przydatne narzędzia!

#llm_&_chatgpt

Integrating DeepSeek into your Python Applications
DeepSeek w ostatnich dniach szturmem zdobył rynek, a jak pewnie wiesz, można go uruchomić lokalnie. Sprawdź, jak to zrobić. jeżeli potraktujesz ten artykuł jako ogólny przewodnik (nie tylko o DeepSeek), dowiesz się, jak korzystać z różnych modeli LLM ze wsparciem Ollama i Hugging Face.

Complete hardware + software setup for running Deepseek-R1 locally
Pełna konfiguracja sprzętowa i programowa do lokalnego uruchamiania DeepSeek-R1. Oryginalny model, bez destylacji, z kwantyzacją Q8 dla pełnej jakości. Linki do pobrania i lista komponentów. Całkowity koszt: 6000 USD.

Full-stack RAG: FastAPI Backend (Part 1)
Artykuł rozpoczyna dwuczęściową serię w ramach naszej podserii Full-Stack RAG. W tej pierwszej części stworzymy podstawowe rozwiązanie full-stack, które posłuży do integracji naszego potoku RAG. W kolejnym artykule autor stworzy prosty front-end w React.

#management

O analizie biznesowej i systemowej z Moniką Perendyk
Mało który temat wywołuje tyle skrajnych emocji, co kooperacja analityków i deweloperów. W prawie półtoragodzinnej rozmowie (YT, po polsku) Monika Perendyk opowiada o roli analityka - biznesowego, systemowego czy inżyniera wymagań - oraz o wyzwaniach i różnicach w podejściu na styku z innymi specjalistami.

#mlops

Unit Testing for Data Science with Python
Pisząc swoje kody ML testujecie je? jeżeli nie to macie tutaj dobre w prowadzenie do testów jednostkowych w Python

How to Log Your Data with MLFlow
Jednym z kluczowych komponentów MLflow jest moduł mlflow.data, który umożliwia rejestrowanie zestawów danych w eksperymentach uczenia maszynowego. Dzięki niemu możesz śledzić wersje danych, co ułatwia replikację wyników i analizę wpływu różnych zestawów danych na modele. Jak go wykorzystać? W artykule znajdziesz praktyczne przykłady pokazujące, jak rejestrować dane w MLflow, integrować je z eksperymentami i analizować ich wpływ na trenowanie modeli.

#python

Sorting Data in Excel with Python
Sortowanie danych w Excelu dzięki Pythona. Być może pomysł na około, jakieś udziwnienie i fanaberie, ale jest to możliwe. Tekst przedstawia jak to zrobić i posortować jedną lub wiele kolumn.

Deep Dive into Multithreading, Multiprocessing, and Asyncio
Wykonywanie wielu zadań na raz w Pythonie - jakie mamy możliwości, jaką metodę wybrać?

Dynamic Forms with Flask
Dynamiczne formularze to częsty element aplikacji webowych - pozwalają użytkownikowi wprowadzać listę elementów, której długość nie jest z góry określona. Takie rozwiązanie sprawdza się m.in. przy wpisywaniu numerów telefonów czy adresów, ale ma też wiele innych zastosowań. Jak to obsłużyć we Flasku? Zarówno od strony kodu w Pythonie, jak i szablonu (HTML+JS wchodzą w grę)

Geocomputation with Python - online book
Książka Geocomputation with Python (geocompy) powstała z myślą o tych, którzy chcą rozpocząć pracę z danymi geograficznymi w najpopularniejszym języku programowania. Jej unikalną cechą jest spójne podejście do zarówno wektorowych, jak i rastrowych modeli danych, co zapewnia płynną i przewidywalną ścieżkę nauki. Książka jest dostępna online.

Taking Geospatial Data Analytics to the Next Level with Panel, DuckDB and MapLibre
W tym artykule pokazano, jak przygotować i przeszukiwać dane dzięki DuckDB. Zbudowano niestandardowy komponent od podstaw, wykorzystując Python Panel zintegrowany z MapLibreGL JS. Na koniec krok po kroku omówiono, jak dynamicznie aktualizować dane mapy w zależności od poziomu powiększenia.

Exploring Python GUI Frameworks in 2025
Przegląd frameworków do przygotowywania graficznego interface’u aplikacji tworzonych w Pythonie. Tkinter, Kivy, wxPython, PySide6 oraz Dear PyGui.

#wizualizacja_danych

Clustering on Plotly mapboxes
Jeśli mamy bardzo dużo punktów na mapie (na przykład wszystkie sklepy Żabki albo wszystkie paczkomaty) to ich pokazanie na mapie może być trudne. Plotly pozwala na łączenie punktów w grupy, a ten przewodnik pokazuje jak to zrobić.

Building the Walmart Navigator
Właśnie - na przykład sieć sklepów czy paczkomatów. Zobacz jak zbudować wygodny dashboard w PowerBI dla takiego zestawu danych.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału