Newsletter Dane i Analizy, 2022-10-24

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiejsze wydanie newslettera skupia się na szeregach czasowych. Szeregiem czasowym jest pewnie jakieś 60% danych, na pewno wszystkie zmieniające się w czasie. Tak więc liczba klientów w sklepie (albo stronie internetowej), wynik pomiarów z jakiegoś czujnika (temperatura) itd itp - wszystko to układa się w szeregi czasowe.

A takie szeregi pozwalają na przewidywanie przyszłości. Czasem jest to łatwe, czasem trudne (giełda to też w zasadzie szereg czasowy, a przewidywanie nie jest takie oczywiste). I trochę o tym dzisiaj.


#analiza_danych_koncepcje

What Can Be Learned From 1,001 A/B Tests?
Ile powinien trwać test typu A/B? Jaka powinna być wielkość próbki? Jakie są progi ufności?

Pair-Wise Hyperparameter Tuning with the Native XGBoost API
O (hiper)parametrach XGBoost i poszukiwaniu najlepszej ich kombinacji

#analiza_danych_projekty

Measuring User Engagement with Cohort Analysis
Firmy muszą być w stanie mierzyć zaangażowanie i retencję użytkowników, aby określić ilościowo różne czynniki wpyływające na zachowania użytkowników, takie jak zmiana w czasie, zdarzenia zewnętrzne i sezonowość zaangażowanie

#ciekawostki

Ultimate Guide to Statistics for Data Science
Data scientist bez znajomości podstawowych zagadnień statystyki ponoć sobie nie poradzi. Zatem uzupełnienie wiedzy przed Wami (o ile go potrzebujecie)

#devops

Your First MLOps System: What Does Good Look Like?
Co to jest system MLOps? Jak wygląda dobry system MLOps? Jak to zrealizować? Jak skalować system MLOps?

#python

Face Detection using Haar-Cascade using Python Uncategorized
Haar-Cascade są używane do wykrywania twarzy na urządzeniach o niskiej wydajności i jest to jeden z najpopularniejszych algorytmów wykrywania obiektów w OpenCV. Na czym polega? Jak go użyć w Pythonie?

#spark

Most Important PySpark Functions with Example
Kilka mniej oczywistych funkcji w PySpark które mogą ułatwić życie

Apache Spark Monitoring
Jak używać interfejsów API do monitorowania Sparka?

#szeregi_czasowe

How to Do an EDA for Time-Series
Analiza szeregów czasowych - w Pythonie i Pandas. Dobre wprowadzenie do samych szeregów

Time-Series Stationarity Simply Explained
Proste i intuicyjne wyjaśnienie dlaczego w modelowaniu szeregów czasowych powinny one być stacjonarne?

Box-Cox Transform for Time Series
Jedna z najbardziej podstawowych transformacji sprowadzająca szereg czasowy do postaci stacjonarnej

How to Create a GIF from Matplotlib Plots in Python
Technika wizualizacji danych dla dwuwymiarowych szeregów czasowych przy użyciu pakietu imageio

Text as Time Series
Ciekawy pakiet dla Pythona, który ułatwia pracę z danymi tekstowymi (głównie ich eksplorację), ale też pozwala na traktowanie tekstu jak szeregu czasowego

Interrupted time series analysis
Wprowadzenie do bajesowskiej analizy szeregów czasowych, czyli kolejny poziom skomplikowania :)

#ux

Tworzenie lepszych komunikatów z błedami
Ciekawa analiza tego, z czego zbudowany jest komunikat z błędem i jak każdą z tych części można ulepszyć. Przyjemnie zaprezentowana wiedza.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału