Newsletter Dane i Analizy, 2022-07-25

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Wakacje wakacjami, ale te kilka godzin poświęciłem specjalnie dla Was aby przygotować dzisiejsze wydanie newslettera.

Pamiętacie Wojny Rdzeniowe? Dla tych, którzy nie bardzo - ciekawy tekst (po polsku, co rzadkie tutaj ;) opowiadający historię tych... hmmm... konkursów? zawodów?

A gdyby tak przygotować wewnętrzne rozgrywki tego typu? Co o tym sądzicie? Piszcie!

Zamiast jednak programować można klikać. jeżeli ktoś jest zwolennnikiem no-code to pewnie zainteresuje się przeglądem platform tego typu przeznaczonych do zadań uczenia maszynowego.


#AI_ML

Deep Convolutional GAN
Architektura DCGAN i tutorial jak ją zbudować w Tensorflow

Apache Spark, Kafka, and Airflow for ETL pipelines
Piszesz tekst, a dostajesz plik audio. Możliwe?

#bazy_danych

Awesome-DB-Tools - zbiór narzędzi do pracy z bazami danych
Nie ma znaczenia, czy pracujesz z bazami SQL czy NoSQL, w tym zestawie prawdopodobnie znajdziesz coś dla siebie. Aplikacje do zarządzania, backupowania, analizowania, testowania i wielu innych

How to Use “on Conflict" in INSERT Statement
Robisz zapytanie INSERT do bazy SQL i masz błąd, bo na przykład klucz już istnieje. Co w takim przypadku?

#big_data

Machine Learning Workflows? Make it easy breezy
Co to jest Apache Airflow i jak działa?

Stream Processing with Apache Spark, Kafka, Avro...
Pełna platforma do stream processingu, a przykłady opierają się głównie na pilnowaniu schematu danych (z poziomu Pythona)

Data Stream Processing for Newbies with Kafka, KSQL, and Postgres
I kolejny stream processing - tym razem wykorzystujący Kafkę bardziej niż tylko do przesyłania danych z miejsca w miejsce

Apache Kafka micro-batch Consumer in Python
Można przetwarzać komunikaty z Kafki strumieniowo, ale można też mikro-batchowo. Tutaj przykład w Pythonie (gratis dobry dockerfile do uruchomienia lokalnej Kafki)

#ciekawostki

Building a real-time recommendation system
Czy zastanawiałeś się kiedyś, w jaki sposób YouTube natychmiast aktualizuje swoje rekomendacje? Proces wybierania w czasie rzeczywistym kilkunastu pozycji do polecenia użytkownikowi spośród milionów jest złożony

Supercharging A/B Testing at Uber
Jak Uber projektuje i realizuje swoje testy A/B?

#devops

Building a CI/CD Pipeline using GitHub Actions
Od początku do końca: wykorzystanie Akcji na GitHubie do automatycznego wdrażania aplikacji w Pythonie

#programowanie_ogólnie

Why DRY is the most over-rated programming principle
Zasada “Dont Repeat Yourself" w teorii ma zagwarantować nam, iż kod będzie czystszy, bardziej czytelny i nie będzie zawierał zbytecznych, przeklejanych wielokrotnie instrukcji. W praktyce jednak nie wygląda to aż tak dobrze...

#python

Colored logs
Chcesz mieć kolorowe logi z aplikacji w Pythonie? Ten pakiet zrobi to za ciebie

Introduction to Elasticsearch using Python
A gdyby tak wykorzystać Elastica z poziomu Pythona?

#r

A Guide to Using Caret in R
Jak używać pakietu caret w R? Pakiet ten to jeden interface do wielu bibliotek umożliwiających budowanie modeli machine learningowych - na tyle przydatny i wygodny, iż choćby skopiowali go do Pythona jako pyCaret ;-)

Eight R Tidyverse tips for everyday data engineering
Kilka przydatnych sztuczek i rozwiązań, które przydadzą się w codziennej pracy z R i tidyverse. Niektóre zmyślne :)

Shiny App Calendar Heatmap
Jeden z tekstów w ramach serii raportowania w R Markdown. Tym razem o przedstawieniu danych na wizualizacjach w formie kalendarza, adekwatnie nie tylko w aplikacjach Shiny

#ux

The History of User Interfaces
Jak zmieniał się UI/UX systemów operacyjnych na przestrzeni lat? Warto szczególnie rzucić okiem na interfejsy powstałe przed Windows 95, który jakby nie patrzeć, wizualnie mocno odmienił rynek systemów

#wizualizacja_danych

How to pick the least wrong colors
Kolory na prezentacji nie tylko muszą być ładne, ale powinny być także czytelne i to zarówno dla osób widzących poprawnie, jak i dla tych posiadająych pewne ograniczenia w postrzeganiu kolorów. Jak więc dobrać optymalne kolory? Tego dowiesz się z artykułu

Bivariate Choropleths with biscale package
Jak na jednej mapie pokazać jednym kolorem jednocześnie dwie wartości? Interesujące rozwiązanie w R

What a Book Published in the 80s Taught Me about Data Visualization
Stare (no, może nie tak bardzo stare) książki mogą czegoś nauczyć... na przykład wizualizacji danych


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału