Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
W tym tygodniu sporo rozwiązań big data’owych i ciekawostek ogólnie związanych z przetwarzaniem danych.
Ale jeżeli interesuje Cię coś bardziej "biznesowego", w szczególności jak projektuje się produkty to gorąco polecam rozmowę z Marcinem Zarembą o projektowaniu autobookingu w Dobrym Mechaniku oraz dodatkowo tekst o tymże u Marcina na blogu. Świetny case study, serio serio.
#AI_ML
Train Mask R-CNN Net for Object Detection in 60 Lines of Code
Rozpoznawanie obiektów na zdjęciach - jak to działa?
#analiza_danych_koncepcje
Top 10 Streaming SQL Patterns
Analityka w prawie czasie rzeczywistym z pomocą SQLa
AWS SageMaker x HuggingFace x AWS QuickSight
Klasyfikacja danych medycznych z SageMakerem w praktyce - od danych, przez modele do gotowego dashboardu
6 Dimensionality Reduction Techniques
Masz za dużo kolumn w swoim zbiorze danych? Może redukcja wymiarów pomoże (i często odkryje coś dodatkowego)?
Feature Selection Using Genetic Algorithms
Algorytmy genetyczne do szukania najlepszego zestawu cech. Już nie jakieś liniowe korelacje a walka pokoleń, dzieci zmutowane genetycznie ;-)
Interesujący koncept, tutaj z przykładami i jakimiś prostymi modelami w TensorFlow
#analiza_danych_projekty
Analysis of the polarity of tweets with the hashtag #bridgerton on Twitter
Obszerny tutorial wykorzystania Python do zadań NLP (no... nie przesadzajmy) na danych z Twittera - to dobry temat do nauki w kilku obszarach jednocześnie (czyszczenie danych, trochę NLP, "gadanie" z Twitterem, rysowanie wykresów)
Process Stability Analysis with Python
Wykresy kontroli jakości - czym są, jakie mają zastosowania i jak je ogarnąć w Pythonie?
#bazy_danych
Soft deletion with PostgreSQL
Kasowanie z PostgreSQL z logiką na bazie
#big_data
PySpark czy Pandas?
A może połączyć oba?
Apache Camel vs. Apache Kafka
Kolejne dzisiaj porównanie
Real-time ingestion to Iceberg with Kafka Connect
Co to w ogóle jest Apache Iceberg i po co to?
Self-service Business Intelligence,
Samoobsługowy BI - jakie to problemy i jakie rozwiązanie (z użyciem dbt)
ETL with Apache Beam - Load Data from API to BigQuery
Jak zbudować skalowalny przepływ danych do BigQuery?
#ciekawostki
Jak powstawał Autobooking w DobryMechanik.pl (case study)?
Ciekawa rozmowa o tym jak projektuje się produkty, na przykładzie bardzo interesującego projektu. W opisie filmu znajdziecie link do wersji opisowej
State of Engineering
Na czym inżynierowie systemu spędzają swój czas? Wyniki podsumowujące 600 ankiet, źródło inspiracji w którym kierunku idzie świat IT
Creating autocomplete search forms
Pythonowy Tkinter vs VBA w Excelu
#programowanie_ogólnie
How to Write High-Quality Python as a Data Scientist
Przyjęło się mówić, iż data scientiści to nie są za dobrzy programiści. Co powinni zrobić żeby to poprawić?
#python_mid
8 surprising ways how to use Jupyter Notebook
Do czego może posłużyć "zwykły" Jupyter Notebook?
#r
Two Packages to Clean and Validate Datasets
Czyszczenie (i ogólnie przygotowywanie) danych do dalszej pracy to żmudna praca, a te pakiety R mogą ją nieco uprościć
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)