Newsletter Dane i Analizy, 2023-05-08

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Majówka, majówka i po majówce. Wypoczęci? Ja zwiedziłem z rodziną Trójmiasto, jestem zadowolony i o to adekwatnie w wypoczynku chodzi. Tylko dlaczego tak wieje nad morzem?

W dzisiejszym odcinku zaś szczególnie polecam książkę Françoisa Fleureta The Little Book of Deep Learning - sporo teorii o tym jak działa głębokie uczenie, różne typy warstw i w ogóle na czym ta cała sztuczna inteligencja polega. Książka wygląda na przyciętą formatem do ekranu telefonu - przyznam, iż to interesujący pomysł (ale już go znamy z chociażby [reklama] Kart Data Science).

Sztuczna inteligencja rozpycha się ciągle, w szczególności w mediach to stale popularny temat. Ostatnio - wyobraźcie sobie! - powstały modele tworzące muzykę. O AudioGPT znajdziecie tekst poniżej, a przykłady opisywanego modelu stworzonego przez Google znajdziecie na stronie MusicML.


#AI_ML

The Little Book of Deep Learning
François Fleuret jest profesorem informatyki na Uniwersytecie w Genewie i właśnie opublikował PDFa z książką o ML i AI. Dobra rzecz!

#analiza_danych_koncepcje

Cosine Similarity Classification Algorithm For Churn Prediction
Odległość kosinusowa służąca w obliczaniu churnu? Jest to jakaś koncepcja... Na pewno jest więcej kodu niż pisaniny ;-)

#analiza_danych_projekty

Forecast Multiple Time Series Like a Master
Przewidywanie wielu szeregów czasowych jednocześnie. W dodatku z wykorzystaniem wielu algorytmów (i weryfikacją który sprawdza się najlepiej)

Real-Time Tweet Sentiment Analysis with PySpark
Tekst opisuje system do analizy sentymentu w czasie rzeczywistym. System korzysta z wytrenowanego wcześniej modelu, oparty jest na Kafce i Sparku.

#architektura

Designing Event-Based Data Pipelines with Apache Kafka
Event-driven architecture (EDA) to styl projektowania systemów informatycznych, który opiera się na wydarzeniach (ang. events). Tutaj opowiedziano na czym polega EDA na przykładzie danych telematycznych

#ciekawostki

AudioGPT - A Glimpse into the Future of Creating Music
Czy muzyka też może być tworzona przez sztuczną inteligencję?

Five reasons you shouldn’t rewrite that code
Podsumowując, można stwierdzić, że:
1) nie warto pisać nowego kodu, jeżeli istniejący działa dobrze;
2) istniejący kod jest dokumentacją, która pomaga w rozwijaniu nowego kodu;
3) istniejący kod jest testowany i przechodzi przez proces CI/CD, co oznacza, iż jest mniej podatny na błędy;
4) istniejący kod jest znany i rozumiany przez zespół, co pozwala na szybsze wprowadzanie zmian;
5) istniejący kod ma swoją historię, która pomaga w lepszym zrozumieniu kontekstu.

#devops

Script smarter with conditional statement
Wykorzystanie instrukcji warunkowych w języku skryptowym Bash

#python

Mastering Asyncio
Python jest językiem, który daje możliwość wykonywania wielu operacji jednocześnie. Jest to możliwe dzięki asyncio i tutaj dowiesz się jak to robić

Using Tqdm with Asyncio in Python
Skoro było o Asyncio to dorzućmy TQDM, czyli bardzo wygodny w użyciu pasek postępu

How to dockerize flask python application
O budowaniu i wdrażaniu aplikacji webowych napisanych we Flasku raz jeszcze. Komplet niezbędnych informacji dla trójki Docker + Nginx + Flask

Geospatial Data Analysis in Python
Jak zacząć z analizą danych przestrzennych (mapowych) w Pythonie? Pobierając je z OpenStreetMap i badając co tak naprawdę zostało pobrane. Na dodatek - w tekście kilka słów i przykładów o ciekawej bibliotece Kepler.gl

How to test an API request to the external system
Jak przetestować żądanie API wysyłane do zewnętrznego systemu. Opisano krok po kroku, jakie działania należy wykonać, aby sprawdzić, czy żądanie jest poprawne. Wskazano także, jakie narzędzia można użyć do wykonania testu.

Writing professional Python logs
W jaki sposób pisać profesjonalne logi w Pythonie? Tak, aby były czytelne, zrozumiałe i przydatne?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału