Newsletter Dane i Analizy, 2022-11-07

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj poniedziałek, ale w środę po południu przyjdzie do Ciebie mail z ankietą. To 6 prostych pytań, które pomogą w rozwoju newslettera. Dawno nie było ankiety, widzę statystyki tego co czytacie, ale statystyki to jedno, a odczucie prawdziwego czytelniak to drugie :) Ankieta sprowadza się do klikania, zajmuje 2-3 minuty, zachęcam do wypełnienia.

A dzisiaj jeszcze standardowo - dużo treści na przeróżne tematy :). Dzisiaj na prawdę dużo (drugie tyle czeka w garażu, mam przynieść?).


#AI_ML

Tutorial GPT-3 - podstawy w 20 minut
Jak generować teksty z użyciem sztucznej inteligencji od OpenAI? W tym poradniku znajdziecie absolutne podstawy używania GPT-3

How to Visualize Neural Network Architectures?
Dla praktyków prawdopodobnie wystarczy kawałek kodu, ale być może na slajdach w prezentacjach na konferencjach albo w publikacjach naukowych lepiej pokazywać architekturę sieci neuronowych obrazkami? Tutaj znajdziecie przykładowe sposoby przygotowania takich obrazków w Pythonie.

#analiza_danych_koncepcje

How to Support A/B Testing in Python
Znowu video, tym razem o wykorzystaniu "feature flags" w kodzie, w szczególności przy testach A/B. Arjan pokazuje przy okazji narzędzia wspomagające feature flags i testy A/B - GrowthBook oraz MixPanel - i ich wykorzystanie w praktyce

Solving Multi-Armed Bandit Problems
Będąc już przy testach A/B można iść krok dalej - w stronę problemu wielorękiego bandyty. W bardzo dużym skrócie: test A/B da nam wynik po sprawdzeniu określonej liczby kontaktów (odpowiednio rozdzielonych na próbki) z probką A i z próbką B, dopiero na końcu. Wieloręki bandyta przybliża nas do wyniki po każdym z kontaktów, po każdym z użytkowników. Mechanizm ten jest najczęściej wykorzystywany przy serwowaniu najlepszej (czyli najbardziej skutecznej) reklamy

Better churn prediction - using survival analysis
Interesujący pomysł - wykorzystanie metod znanych z analizy przeżycia do predykcji churnu (czyli odejścia klientów). W niedzielę na fanpage’u był tutorial o churnie, więc możecie trakrować to jako uzupełnienie (ale bez kodu)

Modeling Starbucks Waiting Time Using Markov Chains
Ile czay będę czekać na kawę w Starbucksie? Użyjmy łańcuchów Markova żeby się tego dowiedzieć! I Pythona, żeby nie liczyć na kartce ;)

#analiza_danych_projekty

Deploying a Data Science Platform on AWS: Setting Up AWS Batch
Równoległe uczenie modeli na zasobach AWS - o tym jest ta seria (to pierwszy z ciągu artykułów). Ale chyba najwięcej dowiesz się o tym jak z poziomu konsoli operować maszynami i zlecać im konkretne zadania.

#bazy_danych

Redis Explained
Co to jest Redis, jak to zbudowane architektonicznie? A i blog cały fajny, z przyjemnymi obrazkami

Working with JSON in Postgres
Tak, w PostgreSQL można trzymać JSONy. Tak, można ich używać tak jak innych danych. Jak? Tak!

How To Operate MongoDB in Python
Inny sposób na trzymanie danych których strukturę można opisać JSONem to MongoDB. I tutaj szybkie wprowadzenie jak z Mongo korzystać w Pythonie

#big_data

Hydrating a Data Lake using Log-based Change Data Capture
Co to jest CDC, jak ma się do tego Debezium? W dużym uproszczeniu: ten tekst opisuje architekturę, w której każda zmiana na bazie danych przekazywana jest na Kafkę. Co z tym dalej zrobić to już adekwatnie dowolność...

Kafka & KSQL & TensorFlow for Data Scientists via Python & Jupyter Notebook
A jak już sobie coś leci tą Kafką to może użyć tych danych do predykcji z użyciem modelu opartego o TensorFlow?

#ciekawostki

How LinkedIn Uses Machine Learning To Rank Your Feed
Jak na poziomie dość ogólnym wygląda decydowanie o tym co widzisz na swoim feedzie w LinkedIn? To adekwatnie bardzo dobre wprowadzenie do artykuły powyżej!

Prometheus & Microsoft Teams Integration
Czy monitoring jakiejś aplikacji może komunikować się z Tobą przez Teams? Może. Tutaj przykład jak spiąć z Teamsami Prometeusza

#management

Moving from Data Lakes to Data Mesh
Dlaczego firmy decydują się na decentralizację danych? Jak ten proces się odbywa?

#python

The Art of Speeding Up Python Loop
Python dla początkujących i średnio zaawansowanych - jak przyspieszać działanie pętli?

Make your Streamlit Web App Look Better
Tutaj zaś Streamlit dla średnio zaawansowanych: jak sprawić, żeby aplikacje tworzone w tym frameworku były nieco wygodniejsze w użyciu albo układ elementów był taki jak chcemy?

Using Eurostat statistical data on Europe with Python
Eurostat to wielka baza danych, nic tylko sięgać i na przykład tworzyć mapki "jak to w Europie jest z...". No ale kto by chciał ściągać dane manualnie, skoro można automatycznie?

Getting Started with Google APIs in Python
Google do adekwatnie wszystkich swoich usług daje API. Co więcej - daje API do takich usług, których nie ma wydzielonych do oddzielnych produktów (bo wchodzą w część czegoś innego - Google Places, mówiące o np. restauracjach które widać na Google Maps). I bardzo Google chce żebyśmy z tych danych korzystali. Tak więc poznajmy sposób w jaki można to zrobić w Pythonie

Shiny for Python - simple Twitter analytics dashboard
Jakiś czas temu framework Shiny został przygotowany do użycia w Pythonie (już nie tylko w R). Dla osób przesiadających się z R może to być znakomite ułatwienie. Takim ułatwiniem będzie ten tutorial, pokazujący jak w Python+Shiny zbudować prosty dashboard.

#r

Understanding ShinyApps
A jeżeli już jesteśmy przy Shiny - czym są te aplikacje? Jaka filozofia stoi za sposobem działania?

How to Deploy Shiny Apps in Azure and use your Domain Name
Przygotowaliśmy naszą aplikację w Shiny, ubraliśmy ja w Dockera, jak teraz to wdrożyć na Azure? Dodając własną domenę i certyfikat SSL.

How to Work With XML Files in R
Krótko mówiąc: jak czytać XMLe w R? Takie proste XMLe, bo te bardziej zakręcone to już większa komplikacja. Ale jak znamy podstawy to możemy iść dalej

#spark

Reading Kafka data through PySpark
Czy Spark może czytać dane bezpośrednio z Kafki? Może. Jak to zrobić z poziomu Pythona i PySparka? Zobacz tutaj!

#wizualizacja_danych

Dashboard Design Patterns
Dashboardy i ich wygląd - temat rzeka. Trochę inspiracji i cennych wskazówek znajdziecie tutaj

Visualizing S&P 500 Performance by Sector
Insporujący sposób na pokazanie wyników giełdowych spółek z S&P 500 w 2022 roku


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału