Newsletter Dane i Analizy, 2023-09-18

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dziś polecam gorąco dwa teksty, dość obszerne.

Pierwszy to świetny i darmowy kurs spaCy - chyba najlepszej w tej chwili biblioteki służącej do przetwarzania tekstu w Pythonie (z bogatą biblioteką słowników w różnych językach)

Drugi to cykl (link prowadzi do jego środka) opowiadający o budowaniu aplikacji do zamawiania usług: zaczyna się od FastAPI przyjmującego zamówienia, Kafka jako potok na dane, Apache Pinot jako hurtownia danych i aplikacja-dashboard napisany dzięki Dash.

A żeby nie było za łatwo - musisz samodzielnie przeczytać całą poniższą listę, aby te dwa teksty odkryć. Dzięki temu może znajdziesz jeszcze coś ciekawego?


#ai_ml

From Encodings to Embeddings
W tym artykule omówiono dwie podstawowe koncepcje z zakresu reprezentacji danych i uczenia maszynowego: kodowanie (encoding) i osadzanie (embeding).

Advanced NLP with spaCy . A free online course
Ten kurs online spaCy oferuje głębokie zanurzenie się w przetwarzaniu tekstu. Zaczyna się od podstawowych pojęć (identyfikacja słów i fraz), a kończy na technikach analizy na dużą skalę i zagłębiania się w zawiłości potoków przetwarzania spaCy

#analiza_danych_projekty

How to Calculate Customer Lifetime Value Using Python
Ile wart jest każdy z klientów?

Crime Location Analysis
Gdzie jest bezpiecznie a gdzie nieco mniej? interesujący projekt w Pythonie - mapki i predykcja

Building an Order Delivery Analytics Application
Seria (jeszcze nie wszystko napisane) artykułów o analizie danych związanych z procesem zamówień online. Mamy FastAPI oraz Kafkę do komunikacji, Apache Pinot do przetrzymywania danych i ich przeliczania, na koniec zaś pythonowego Dasha do budowania dashboardów. Hint: na GitHubie jest repo z kodem ze wszystkich części

Mastering the Art of Pricing Optimization
Jak zmienić cenę, żeby nie stracić klientów?

#ciekawostki

Rubik and Markov
Prawdopodobieństwo, rozkłady, matematyka i kostka Rubika

#python

Incredibly Fast Ways to Filter Lists in Python
Podstawy Pythona - jak gwałtownie wyfiltrować listę?

Dynamic data schemas with Pydantic discriminator
Pydantic - rozwiązanie na uporządkowanie struktur danych i ich walidację

5 Best Practices for Python Exception Handling
Wyjątki w Pythonie - jak napisać program tak, aby się nie zatrzymał w przypadku błędu?

You are probably using Python’s __init__ method incorrectly
Coś o konstruktorach klas w Pythonie. Dlaczego powinny być proste, bez logiki biznesowej?

Using GraphQL with Python
Jak użyć GraphQL w Pythonie? W pierwszej części tekstu o aplikacji we Flasku łączącej się do bazy danych - albo to znasz i przewiniesz, albo się czegoś nauczysz dodatkowo poza GraphQL

Enhancing Efficiency: 10 Decorators I Use Daily as a Tech MLE
Dekoratory to eleganckie i potężne narzędzia, które pozwalają nam modyfikować zachowanie funkcji lub metod. Oto zestaw 10 dekoratorów, które mają na celu usprawnić pracę w zakresie uczenia maszynowego.

Let’s Create an End-to-End Web Scraping Pipeline With Scrapy!
Jak użyć frameworku Scrapy (i nie pisać wszystkiego co w scrapingu potrzebne od zera?)

#wizualizacja_danych

10 + Politics Related Data Visuals In A Single Line Of Code
Na "chwilę" przed wyborami coś o wizualizacji danych związanych z polityką. jeżeli ktoś przymierza się do pokazania na przykład wyników wyborczych - może się przydać albo zainspirować

#środowisko_pracy

Writing your first Pre-Commit Hooks
A gdyby tak przed commitem sformatować kod. Albo wykonać testy jednostkowe?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału