Newsletter Dane i Analizy, 2022-06-06

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W tym tygodniu sporo rozwiązań big data’owych i ciekawostek ogólnie związanych z przetwarzaniem danych.

Ale jeżeli interesuje Cię coś bardziej "biznesowego", w szczególności jak projektuje się produkty to gorąco polecam rozmowę z Marcinem Zarembą o projektowaniu autobookingu w Dobrym Mechaniku oraz dodatkowo tekst o tymże u Marcina na blogu. Świetny case study, serio serio.


#AI_ML

Train Mask R-CNN Net for Object Detection in 60 Lines of Code
Rozpoznawanie obiektów na zdjęciach - jak to działa?

#analiza_danych_koncepcje

Top 10 Streaming SQL Patterns
Analityka w prawie czasie rzeczywistym z pomocą SQLa

AWS SageMaker x HuggingFace x AWS QuickSight
Klasyfikacja danych medycznych z SageMakerem w praktyce - od danych, przez modele do gotowego dashboardu

6 Dimensionality Reduction Techniques
Masz za dużo kolumn w swoim zbiorze danych? Może redukcja wymiarów pomoże (i często odkryje coś dodatkowego)?

Feature Selection Using Genetic Algorithms
Algorytmy genetyczne do szukania najlepszego zestawu cech. Już nie jakieś liniowe korelacje a walka pokoleń, dzieci zmutowane genetycznie ;-)
Interesujący koncept, tutaj z przykładami i jakimiś prostymi modelami w TensorFlow

#analiza_danych_projekty

Analysis of the polarity of tweets with the hashtag #bridgerton on Twitter
Obszerny tutorial wykorzystania Python do zadań NLP (no... nie przesadzajmy) na danych z Twittera - to dobry temat do nauki w kilku obszarach jednocześnie (czyszczenie danych, trochę NLP, "gadanie" z Twitterem, rysowanie wykresów)

Process Stability Analysis with Python
Wykresy kontroli jakości - czym są, jakie mają zastosowania i jak je ogarnąć w Pythonie?

#bazy_danych

Soft deletion with PostgreSQL
Kasowanie z PostgreSQL z logiką na bazie

#big_data

PySpark czy Pandas?
A może połączyć oba?

Apache Camel vs. Apache Kafka
Kolejne dzisiaj porównanie

Real-time ingestion to Iceberg with Kafka Connect
Co to w ogóle jest Apache Iceberg i po co to?

Self-service Business Intelligence,
Samoobsługowy BI - jakie to problemy i jakie rozwiązanie (z użyciem dbt)

ETL with Apache Beam - Load Data from API to BigQuery
Jak zbudować skalowalny przepływ danych do BigQuery?

#ciekawostki

Jak powstawał Autobooking w DobryMechanik.pl (case study)?
Ciekawa rozmowa o tym jak projektuje się produkty, na przykładzie bardzo interesującego projektu. W opisie filmu znajdziecie link do wersji opisowej

State of Engineering
Na czym inżynierowie systemu spędzają swój czas? Wyniki podsumowujące 600 ankiet, źródło inspiracji w którym kierunku idzie świat IT

Creating autocomplete search forms
Pythonowy Tkinter vs VBA w Excelu

#programowanie_ogólnie

How to Write High-Quality Python as a Data Scientist
Przyjęło się mówić, iż data scientiści to nie są za dobrzy programiści. Co powinni zrobić żeby to poprawić?

#python_mid

8 surprising ways how to use Jupyter Notebook
Do czego może posłużyć "zwykły" Jupyter Notebook?

#r

Two Packages to Clean and Validate Datasets
Czyszczenie (i ogólnie przygotowywanie) danych do dalszej pracy to żmudna praca, a te pakiety R mogą ją nieco uprościć


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału