Newsletter Dane i Analizy, 2024-05-06

blog.prokulski.science 1 tydzień temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Witamy po majówce. Akumulatory naładowane? Głowy przewietrzone? Karkóweczka zjedzona? :)
Zatem czas na kolejną porcję rozwijających treści.

Jakoś tak wyszło, iż w tym tygodniu mamy kilka zagadnień związanych z Kubernetesem, ale nie odpuszczamy programowania jako takiego (z przewagą Pythona, wiadomo). Poza tym - chyba masz zaległości z poprzedniego numer, prawda?


#ai_ml

GenAI Demo with Kafka, Flink, LangChain and OpenAI
Architektura i demo procesu przesyłania danych Kafką i użycia modeli LLM na tychże danych. W treści tekstu znajdziesz też link do nagrania na YT

Unboxing Loss Functions in YOLOv8
Co sprawia, iż YOLOv8 jest tak skuteczne? O funkcji kosztu tego modelu

The Math Behind LSTM
Zbuduj sieć LSTM od zera... i zobacz jak to dokładnie "w środku" działa

#analiza_danych_koncepcje

Airbnb Brandometer: Powering Brand Perception Measurement on Social Media Data with AI
Jak mierzyć postrzeganie marki korzystając z opinii pozostawionych przez użytkowników? Na przykładzie tego, jak robi to Airbnb (a mają dużo "marek" oferowanych lokali i jeszcze więcej komentarzy o tych lokalach)

#bazy_danych

My First Billion (of Rows) in DuckDB
450 gigabajtów tekstowych danych przerobionych w rozsądnym czasie do agregatów i swego rodzaju kostki OLAP

20 Advanced Techniques for Efficient Data Management
MongoDB to wiodąca baza NoSQL z językiem zapytań różniącym się od SQLa znacznie. Zobacz 20 typowych (ale jednocześnie niebanalnych) zapytań do tej bazy

#ciekawostki

Why Does Windows Really Use Backslash as Path Separator?
Dlaczego Windows, w odróżnieniu od innych systemów, używa backslasha jako separatora ścieżki? Aby poznać odpowiedź na to pytanie, trzeba wrócić w czasie do pierwszych wersji systemu DOS. Artykuł dla osób lubiących stare technologie i odrobinę historii informatyki. A dla tych, którzy mają problem z / i \ w Pythonie - jest coś odpowiedniego w sekcji poświęconej temu językowi, szukaj niżej

#devops

10 Best Practices for Optimizing Your Kubernetes Deployments
Zbiór dobrych praktyk związanych z Kubernetesem - wchodząc w ten świat warto się z nimi zapoznać, ale jednocześnie mogą stanowić mapę obszarów K8s które warto poznać

Monitoring a Kubernetes Cluster using Prometheus and Grafana
Posiadanie klastra Kubernetesowego to fajna sprawa, ale warto wiedzieć co te nasze obrazy w ramach zajmowanych przez siebie podów tam robią. O tym jak monitorowa K8s na przykładzie Minikube, Promethesua i Grafany - idealne do domowych rozwiązań"

A Guide to GCP Services and Solutions
Co jest czym w ramach Google Cloud Platform (GCP)?

#java

Expiration Date
Jak zapanować nad datą ważności karty i na jakie pułapki można wpaść?

How to Convert Excel to JSON
Jak wczytać plik Excela w Javie i użyć zawartych w nim danych?

Spring Boot & Databases: The Perfect Match
Szybkie wprowadzenie do łączenia aplikacji w Springu z bazą danych. W przykładzie mamy bazę PostgreSQL ale też MongoDB

#programowanie_ogólnie

Tips on Adding JSON Output to Your CLI App
Jeśli chcesz, aby Twoja aplikacja w odpowiedzi wypisywała na konsoli informacje w formacie JSONa - poznaj kilka dobrych praktyk jak to robić.

#python

Learn the `Pathlib` and Never Have a Problem With Paths Again
Slash czy backslash - jak oddzielasz kolejne poziomy zagłębienia w ścieżce pliku. Jak to w IT: "to zależy", przede wszystkim od systemu operacyjnego. Biblioteka Pathlib pozwala zapomnieć o tym problemie, w dodatku oferuje dużo więcej niż tylko obsługę "podkatalogów"

Network Automation and Python-dotenv
Żeby nie trzymać wrażliwych danych (np. dostępu do bazy danych, kluczy API) w kodzie można wykorzystać zmienne środowiskowe. Ale można odpowiednie informacje zapisać w pliku .env i przy pomocy pakietu python-dotenv traktować taki plik jakby to były zmienne środowiskowe właśnie. Zobacz jak.

Creating and Computing Vectors Using Python
W świecie embedingów wektory stały się chlebem powszechnym. Jak zapanować nad nimi w Pythonie? A adekwatnie powtórzenie algebry i przełożenie jej na język programowania

FastAPI - Repository Pattern and Service Layer
Całkiem spory projekt w FastAPI z dużą strukturą składowych plików i wykorzystaniem wzorców projektowych. Cenna lekcja nie tylko Pythona, ale i architektury kodu.

Asyncio Coroutine Object Methods in Python
Wiecie, iż w ramach zdefiniowanych metod dla klasy mogą być takie asynchroniczne? jeżeli nie - to się dowiecie.

#środowisko_pracy

How to Use Llama 3 as Copilot in VS Code for Free
Nie minął chyba jeszcze miesiąc od premiery modelu językowego Llama 3 a już mamy rozwiązanie co-pilota w VSCode oparte na tymże modelu. Za darmo.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału