Newsletter Dane i Analizy, 2024-01-15

blog.prokulski.science 8 miesięcy temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Idzie (właściwie już jest) karnawał, może drinka? Jakie drinki są aktualnie popularne? Ładna infografika nam to pokaże :). A jeżeli chodzi o obrazki, a może raczej - pokazywanie danych - to na samym końcu tego wydania coś o dobieraniu wykresu do danych, które chcemy zaprezentować. Taki to kończący szkołę i rozpoczynający ferie numer mamy.

Bo sporo też stosunkowo "juniorskich" tekstów dla adeptów programowania w Pythonie. Ale dla seniorów - spora książka o analizie danych geograficznych. Czytajcie uważnie, szukajcie dokładnie.

Poczytajcie też o serwisie Standard Ebooks (i poklikajcie po nim - furka aż miło! A stoi na malutkim VPSie. Da się? Da się!


#analiza_danych_koncepcje

Categorical Encoding for Time Series
W szeregach czasowych czasem możemy mieć do czynienia z dodatkowymi zmiennymi kategorycznymi (np SKU produktu, jego kategoria, sklep w którym produkt kupiono). Jak wykorzystać te zmienne i jak je "zakodować" aby model miał z nich największą korzyść?

Boosting Algorithms in Machine Learning: AdaBoost
AdaBoost, skrót od Adaptive Boosting, to jedna z najwcześniejszych i najpopularniejszych metod wzmacniania uczenia. Jak ta metoda działa i jak ją wykorzystać?

Algorithmic Alchemy with The Fast Fourier Transform
Kompletny przewodnik po mechanice algorytmu FFT z zastosowaniami w przetwarzaniu sygnałów

#analiza_danych_projekty

Creating a Data Pipeline from Scratch
Typowy projekt polegający na zbieraniu danych, ich pretwarzaniu i finalnie prezentacji. Lubimy takie!

#architektura

Google to tylko jeden guzik i dwa ekrany?
...a potem prezes pyta dlaczego implementacja trwa tak długo. Przecież “to tylko dwa ekrany" :) O projektowaniu systemu - zadanie z EventStormingu

#bazy_danych

Advanced Open-Source EV Route Planning with PostgreSQL, PostGIS, and pgRouting
Szukanie trasy przejazdu wprost w bazie danych (PostgreSQL+PostGIS)

#ciekawostki

PocketBase - Open Source backend in 1 file
To rozwiązanie pozwoli Ci zaimplementować pełnoprawny backend do prostej aplikacji SaaS. W PocketBase nie tylko dane mieszczą się w jednym pliku, ale cała aplikacja - wraz z panelem Web, REST-owym API i wszystkim innym, co niezbędne jest do działania!

Gmail And Yahoo Inbox Updates & What They Mean For Senders?
Używasz własnej domeny mailowej? Koniecznie zadbaj o obsługę SPF/DKIM/DMARC - od lutego Gmail i Yahoo będą tego wymagać!

#devops

25 Most Popular Docker Interview Questions and Answers
Pytania (i odpowiedzi) z rozmów kwalifikacyjnych to fajny sposób na naukę. Tym razem Dockera, na poziomie podstawowym

A tool for exploring each layer in a docker image
Jak sprawdzić, która warstwa Dockerfile generuje największy rozmiar całego kontenera? Dive pozwala łatwo wykonać taką operację.

#flink

7 reasons to invest in real-time streaming analytics based on Apache Flink
Dlaczego do przetwarzania danych real time wykorzystać Apache Flink? Kilka powodów znajdziesz w tym artykule

#front_end

How Standard Ebooks serves millions of requests per month with a 2GB VPS
Serwis ze sporym ruchem na małej maszynce. Trochę tricków zamiast dużej infrastruktury.

#llm_&_chatgpt

Build a Text-to-Image Generator Web App
Jak używać Hugging Face DiffusionPipeline do generowania obrazów? Budujemy interaktywną aplikacje generującą obrazki przy użyciu Flask i Streamlit.

How Johnny Can Persuade LLMs to Jailbreak Them:Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs
Odrobina perswazji pozwala lepiej wykorzystać modele LLM i przekonać je, żeby "powiedziały" więcej niż mają ochotę ;)

#powerbi

Excel Data Cleaning with Power Query
Czyszczenie danych w PowerBI - na początek pracy z danymi w tym narzędziu BI.

#python

Five Python Decorators That Can Reduce Your Code By Half
Dekoratory w Pythonie przyspieszają pracę - zobacz kilka przykładowych i najbardziej typowych zastosowań tej konstrukcji

9 Advanced Magic Methods in Python To Customize Classes Conveniently
Dekoratory to jedno, a "magiczne metody" to drugie - nieco opowieści o pisaniu lepszych klas

Supercharge Your Python Functions!
Dekoratory, metody magiczne... to jeszcze do kompletu brakuje nam dodatków dla programowania funkcyjnego. I to takich, które są w bibliotece standardowej Pythona

Mastering Asynchronous Programming in Python: A Comprehensive Guide
Jeśli można coś zrobić równolegle to dlaczego nie? A w Pythonie robimy to tak...

Parallel HTTP requests in Python with httpx
Równoległa praca? Tak, wyżej tekst o tym. A tutaj tekst o tym jak równolegle obsługiwać żądania HTTP

3 Easy Ways to Convert Python Scripts to .Exe Files
Jak już zbudujemy swoją wielką aplikację w Pythonie to możemy chcieć pozwolić używać jej bez konieczności instalacji samego Pythona. Na przykład w postaci uruchamialnego pliku .exe.

Python: SQLAlchemy + Postgres
Dla początkujących: jak korzystać z bazy danych (przy okazji jak zbudować sobie własną z Dockera) z poziomu Pythona i SQLAlchemy?

Managing Environment Variable & Securing Your Secrets
Zmienne środowiskowe to przydatny i sensowny sposób na trzymanie konfiguracji. W skryptach pythonowych można wykorzystać plik .env zawierający te zmienne

Geocomputation with Python
Z tej książki dowiesz się, jak pracować z danymi geograficznymi w Pythonie. To krótka i praktyczna książka o otwartym kodzie źródłowym, w której opracujesz i wykorzystasz geokomputację do rozwiązywania praktycznych problemów i położenia podwalin pod zaawansowane aplikacje geoprzestrzenne.

Prompting GPT-4 For Map Creation: Testing 4 Terrific Python Libraries
Czy ChatGPT odbierze nam pracę? Zobacz jaki kod związany z rysowaniem mapek przygotuje

#r

One billion row challenge using base R
Miliard pomiarów temperatury. Jak obsłużyć tak duże dane w R?

#wizualizacja_danych

Visualisation 101: Choosing the Best Visualisation Type
Który wykres do czego? Tak na początek przygody z wizualizacją danych...


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału