Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Majówka, majówka i po majówce. Wypoczęci? Ja zwiedziłem z rodziną Trójmiasto, jestem zadowolony i o to adekwatnie w wypoczynku chodzi. Tylko dlaczego tak wieje nad morzem?
W dzisiejszym odcinku zaś szczególnie polecam książkę Françoisa Fleureta The Little Book of Deep Learning - sporo teorii o tym jak działa głębokie uczenie, różne typy warstw i w ogóle na czym ta cała sztuczna inteligencja polega. Książka wygląda na przyciętą formatem do ekranu telefonu - przyznam, iż to interesujący pomysł (ale już go znamy z chociażby [reklama] Kart Data Science).
Sztuczna inteligencja rozpycha się ciągle, w szczególności w mediach to stale popularny temat. Ostatnio - wyobraźcie sobie! - powstały modele tworzące muzykę. O AudioGPT znajdziecie tekst poniżej, a przykłady opisywanego modelu stworzonego przez Google znajdziecie na stronie MusicML.
#AI_ML
The Little Book of Deep Learning
François Fleuret jest profesorem informatyki na Uniwersytecie w Genewie i właśnie opublikował PDFa z książką o ML i AI. Dobra rzecz!
#analiza_danych_koncepcje
Cosine Similarity Classification Algorithm For Churn Prediction
Odległość kosinusowa służąca w obliczaniu churnu? Jest to jakaś koncepcja... Na pewno jest więcej kodu niż pisaniny ;-)
#analiza_danych_projekty
Forecast Multiple Time Series Like a Master
Przewidywanie wielu szeregów czasowych jednocześnie. W dodatku z wykorzystaniem wielu algorytmów (i weryfikacją który sprawdza się najlepiej)
Real-Time Tweet Sentiment Analysis with PySpark
Tekst opisuje system do analizy sentymentu w czasie rzeczywistym. System korzysta z wytrenowanego wcześniej modelu, oparty jest na Kafce i Sparku.
#architektura
Designing Event-Based Data Pipelines with Apache Kafka
Event-driven architecture (EDA) to styl projektowania systemów informatycznych, który opiera się na wydarzeniach (ang. events). Tutaj opowiedziano na czym polega EDA na przykładzie danych telematycznych
#ciekawostki
AudioGPT - A Glimpse into the Future of Creating Music
Czy muzyka też może być tworzona przez sztuczną inteligencję?
Five reasons you shouldn’t rewrite that code
Podsumowując, można stwierdzić, że:
1) nie warto pisać nowego kodu, jeżeli istniejący działa dobrze;
2) istniejący kod jest dokumentacją, która pomaga w rozwijaniu nowego kodu;
3) istniejący kod jest testowany i przechodzi przez proces CI/CD, co oznacza, iż jest mniej podatny na błędy;
4) istniejący kod jest znany i rozumiany przez zespół, co pozwala na szybsze wprowadzanie zmian;
5) istniejący kod ma swoją historię, która pomaga w lepszym zrozumieniu kontekstu.
#devops
Script smarter with conditional statement
Wykorzystanie instrukcji warunkowych w języku skryptowym Bash
#python
Mastering Asyncio
Python jest językiem, który daje możliwość wykonywania wielu operacji jednocześnie. Jest to możliwe dzięki asyncio i tutaj dowiesz się jak to robić
Using Tqdm with Asyncio in Python
Skoro było o Asyncio to dorzućmy TQDM, czyli bardzo wygodny w użyciu pasek postępu
How to dockerize flask python application
O budowaniu i wdrażaniu aplikacji webowych napisanych we Flasku raz jeszcze. Komplet niezbędnych informacji dla trójki Docker + Nginx + Flask
Geospatial Data Analysis in Python
Jak zacząć z analizą danych przestrzennych (mapowych) w Pythonie? Pobierając je z OpenStreetMap i badając co tak naprawdę zostało pobrane. Na dodatek - w tekście kilka słów i przykładów o ciekawej bibliotece Kepler.gl
How to test an API request to the external system
Jak przetestować żądanie API wysyłane do zewnętrznego systemu. Opisano krok po kroku, jakie działania należy wykonać, aby sprawdzić, czy żądanie jest poprawne. Wskazano także, jakie narzędzia można użyć do wykonania testu.
Writing professional Python logs
W jaki sposób pisać profesjonalne logi w Pythonie? Tak, aby były czytelne, zrozumiałe i przydatne?
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)