Newsletter Dane i Analizy, 2023-02-20

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Jak wyglądać będzie świat kiedy GPT-3 będzie pisać teksty? Mniej więcej tak jak wygląda Medium.com. Clickbaitowe tytuły, mało merytorycznej treści. jeżeli brać pod uwagę teksty mówiące ogólnie rzecz biorąc o IT to dodatkowo długie wprowadzenia (zawsze mniej więcej o tym samym: czym jest Kafka, czym jest AirFlow, czym jest Docker), potem dwa akapity o banalnym do rozwiązania problemie i to wszystko.

Może to przeziębienie trwające już za długo, może kryzys wieku średniego ;-) albo za dużo zajęć i rzeczy do zrobienia tu i teraz, ale szczerze mówiąc jestem zmęczony, głównie internetem - wszędzie to samo, wszystko miałkie, wszystko wtórne. Dlatego, żeby tego wszystkiego Wam oszczędzić do dzisiejszego newslettera wstępnie wybrałem około 50 artykułów. Ile przeszło selekcję? Widzicie poniżej. Ile z nich jest godnych uwagi i na prawdę coś interesującego wnosi? To musicie ocenić sami.

Dodatkowo, poza standardowymi działami, przeczytajcie o tym dlaczego Medium się zepsuło. Tekst jest na substack.com, który rośnie na konkurencję, więc może ten tekst trzeba brać przez palce?

Tak czy inaczej - przebijając się przez pół setki wstępnie wytypowanych artykułów i wycinając większą część miałkości - zapraszam do lektury.


#AI_ML

XGBoost: Theory and Hyperparameter Tuning
Przewodnik z przykładami w Pythonie o tym czym są hiperparametry w modelach klasy XGBoost

Credit Card Fraud Detection With Autoencoders
Autoenkodery (w PyTorch) i ich wykorzystanie do wykrywania fraudów na kartach kredytowych.

#analiza_danych_koncepcje

Predict Time-To-Event with Machine Learning
Analiza przeżycia jako sposób na prognozowanie odejść klientów (tzw. churn)

DyBall Shots: K-Means vs. HDBSCAN
Algorytmy K-means i DBSCAN na przykładzie piłkarzy

Topic Modeling For Beginners - BERTopic
O czym (jakiego tematu dotyczy) jest ten tekst? To jedno z podstawowych zagadnień w NLP. Popularnym podejściem jest LDA ale model BERT daje lepsze wyniki. I wprowadzenie do modelu BERT tutaj znajdziecie

One Cool Way to Spot Correlations in Finance
"Dynamic time warping" to technika zaprojektowana do testowania podobieństwa między dwiema szeregami czasowymi. Na przykład dwie osoby poruszają się z różną prędkością po tej samej drodze. Zatem przebieg ich trasy jest podobny czy inny? Albo przebieg kursu akcji spółki kontra indeks do którego należy - zbieżne czy nie?

#big_data

Hands-On Introduction to Delta Lake with (py)Spark
Wprowadzenie do architektury Lakehouse opartej o Delta Table i PySparka

#ciekawostki

Home Server Energy Saving
Czy Twój domowy serwer nieprzebrane ilości prądu, choćby gdy nic nie robi? Autor tego wpisu pokazuje, jak używając RaspberryPi zautomatyzował uruchamianie i wyłączanie serwera tak, aby konsumował prąd tylko wtedy, gdy naprawdę jest potrzebny

#management

6 Steps to Making Data Reliability a Habit
Dane to paliwo. Ale dobre dane, bo zasada "garbage in, garbage out" obowiązuje też tutaj. Upewnij się więc, iż monitorujesz zarówno przepływ danych ("czy dane się zbierają") ale też ich jakość

#python

10 Surprising Ways to Use Python Dictionaries
Słowniki w Pythonie wydają się być niedocenione. A potrafią wiele!

Pivot tables in Pandas
Kiedy odkrywasz tabele przestawne w Excelu jesteś oczarowany(a). Jak do tego dodasz jeszcze możliwość pobierania wyniku wprost z takiej tabeli (przez GETPIVOTDATA / WEŹDANETABELI). A w Pythonie? A w Pandas? Też się da i o tym ten obszereny tutorial

Best Practices to Deploying your ML Model
Twój model ML jest wart dokładnie ZERO jeżeli nie jest używany i jest osadzony jedynie w Jupyter Notebooku

Step-by-Step Guide on Deploying Yolo Model on Fast API
YOLO (You Only Look Once) jako model detekcji obiektów na obrazie.... opakowany w API

9 FastAPI Resources You Need To Know
Skoro upakowaliśmy już modele w API to poznajmy FastAPI nieco lepiej

A Guide to the YOLO Family of Computer Vision Models
Wyżej ubieraliśmy YOLO w API ale czym różnią się poszczególne wersje tego algorytmu od siebie?

Async Processing in Python
Czytaj, przetwarzaj, zapisuj. I tak w koło. Ale może "w koło" trwa za długo?

#r

How to Create a Drill-Down Bar Chart in Shiny
"We need to go deeper". Wykresy z drill-down robią zawsze wrażenie, a poza tym są intuicyjne. W R i Shiny ze wsparciem dodatkowego pakietu robi się je tak jak opisano tutaj

#ux

Mastering Website Navigation: The Ultimate Guide
Wiesz, czym różni się megamenu od dropdown menu? A kiedy mogą przydać się tzw. okruszki? Dobra lektura dla osób projektujących interfejsy użytkownika

#wizualizacja_danych

Plotting Chord Diagrams in Python
Biblioteka Holoviews do prezentowania relacji (np. przepływy ludzi z miejsca w miejsce) i przykład jej wykorzystania w Pythonie


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału