Newsletter Dane i Analizy, 2024-09-30

blog.prokulski.science 6 dni temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Kiedyś robiłem analizę danych zbioru o taksówkach w Nowym Jorku (wpis na blogu sprzed lat), w R. Tam było kilka wykresów, ale nie było interaktywnej wizualizacji. A tutaj jest interaktywna wizualizacja (repo na GitHubie dla tych, którzy nie mają dostępu do Medium), w Pythonie z pakietem Bokeh. EDA też jest, w części pierwszej - warto zapoznać się z tą serią, pokazuje ten najbardziej żmudny etap pracy analityka danych czy też data scientisty.

Czy AI zabierze nam pracę? Ileż razy można o to pytać?... dzisiaj więc coś nieco innego, ale też o zabieraniu pracy. adekwatnie to o przewidywaniach jakie miejsca pracy będą znikać. Serwis Visual Capitalist (prezentujący interesujące wizualizacje) przygotował odpowiednią infografikę - interesujące i (zapewne) zachęcające do zapoznania się z całym serwisem.


#ai_ml

Using Generative AI to Automatically Create a Video Talk from an Article
Jak zrobić wykład w postaci filmu na YouTube? Użyć Gemini do wygenerowania treści, zrobić z niej slajdy w Power Point, tekst przekształcić w audio, a potem całość poskładać w film. Wszystko z użyciem Pythona.

VisionTS: Building Superior Forecasting Models from Images
Computer Vision to dość mocno rozpoznana dziedzina AI. Można ją więc wykorzystać do prognozowania szeregów czasowych.

#architektura

Real-time mouse pointers
Jak Canva to robi, iż potrafi w czasie rzeczywistym pokazywać kursor myszki wszystkich użytkowników wszystkim użytkownikom? Dzięki temu można bawić się w berka na ekranie, albo symulować Układ Słoneczny ;-)

#bazy_danych

System Design: How to Scale a Database
Systemów przeważnie dochodzimy do momentu, w którym pierwotna baza danych przestaje już wyrabiać i trzeba zainteresować się tematem skalowania. Tylko jak to zrobić? Artykuł przedstawia osiem różnych strategii, takich jak skalowanie pionowe, indeksowanie, shardowanie, replikacja danych czy denormalizacja, które pomagają w utrzymaniu optymalnej wydajności bazy.

#data_engineering

Building a Modern Data Stack with Docker
...czyli "data stack mamy w domu": PostgreSQL, Airflow, dbt oraz Superset uruchamiane w obrazów Dockera, idealne do ćwiczeń.

#devops

Kubernetes for Data Engineers
Co to jest ten Kubernetes? Szybkie wprowadzenie dla początkujących.

#excel

Using Google Sheets as the Backbone of My School Election Apps
Może nie Excel, a Google Sheets, więc nie VBA a Google App Script - w każdym razie arkusz jako "silnik" wyborów na przewodniczącego szkoły.

#programowanie_ogólnie

Wzorce projektowe. Nowoczesny podręcznik
Wzorce projektowe to typowe rozwiązania problemów często napotykanych podczas projektowania oprogramowania. Każdy z nich stanowi plan, który po odpowiednim dostosowaniu pomaga poradzić sobie z konkretnym problemem w projekcie twojego kodu.

CUDA Programming Course
12-godzinny kurs programowania z wykorzystaniem CUDA [YT, po angielsku, programowanie głównie w C/C++]

#python

14 pandas tricks you MUST know
Pandas dla średnio zaawansowanych. Niektóre rzeczy być może nie są dla Was niczym szczególnym, ale co najmniej jedna będzie zaskoczeniem.

Coffee Shop Implementation
Najlepszym sposobem na naukę programowania jest tworzenie własnego. Tutaj mamy przykład implementacji kawiarni - jako sposób na naukę programowania obiektowego w Pythonie

Building a Database-Driven Streamlit App with Python
Coś na kształt todo-listy: projekt w Pythonie (z GUI w Streamlit, a baza w SQLite) pozwalający na tworzenie i przeglądanie zapisków.

How to Parse and Visualize Strava Activities
Jak pobrać dane w formacie GPX ze Stravy i później przygotować ich wizualizację w Pythonie?

How to Generate Analytics Reports in Python
Quarto to silnik do generowania raportów z kodu napisanego w plikach Markdown. W tym około półgodzinnym filmie (YT, po angielsku) autor prezentuje jak użyć Quarto z Pythonem do generowania PDFów z raportami.

#r

Introducing Shiny Assistant
Model GPT dedykowany do tworzenia aplikacji W Shiny.

#sql

Handling NULL Values in SQL
Jak radzić sobie z wartościami NULL w SQL? Kilka sposobów, ale też adekwatności samego NULLa

#wizualizacja_danych

5 efektywnych alternatyw dla wykresu kołowego w analizie danych
O tym, iż wykres kołowy nie jest idealnym typem wykresu wie już chyba każdy adept sztuki wizualizacji danych.

Beyond Line and Bar Charts
Coś więcej niż podstawowe wykresy. Kilka propozycji na różne okazje, w zależności od tego co chcemy pokazać. Plus skrócony opis jak uzyskać wykres w Tableau (ale nie jest ono wymagane).


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału