Newsletter Dane i Analizy, 2022-07-04

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Znacie historię plików cookie? Dzisiaj możecie ją poznać z jednego z tekstów w newsletterrze.

Jeśli interesuje Was coś z zakresu wdrażania oprogramowania, monitoringu i ogólnie pojętej automatyzacji tego typu działań - sekcja DevOps może być dobrym początkiem.

Polecam też gorąco tekst o efekcie wabika oraz R-owy pakiet gtExtras użyty w jednym ze sposobów prezentacji rankingu zawodników.


#analiza_danych_koncepcje

Unsupervised Learning: K-Means Clustering
K-means to jeden z algorytmów nienadzorowanego uczenia maszynowego o którego pytają na rozmowach kwalifikacyjnych. Jak działa?

#analiza_danych_projekty

Classifying Music Genres with LightGBM
Po iluś projektach związanych z analizowaniem danych muzycznych mam wątpliwości czy taka klasyfikacja ma sens... ale to są świetne projekty do nauki, więc zawsze warto!

#architektura

Data Warehouse vs. Data Lake vs. Data Streaming - Friends, Enemies, Frenemies?
Pierwszy post z ciekawie zapowiadającej się serii

#bazy_danych

5 time-saving, advanced SQL queries
Pięć zoptymalizowanych zapytań SQL - ranking, self join, CASE-WHEN czy też wyciąganie fragmentów informacji (rok, miesiąc) z kolumn zawierających czas

#ciekawostki

Lou Montulli and the invention of cookie
W 1994 roku Lou Montulli napisał fragment kodu, który wprowadził nowy sposób udostępniania tożsamości w sieci - plik cookie. Przeczytaj historię wynalazcy cookies

Why Is Everybody Parking Near My Car?
Ile miejsc potrzeba na parkingu? Co minutę przyjeżdża auto, spędza 5 minut na parkingu i odjeżdża. jeżeli to jest regularnie to łatwo, ale jak nie jest?

Powerful Rules for Better Data Science
Przydatność czy złożoność?
Jakość danych czy dostrajanie hiperparametrów?
Prostota czy nowatorstwo?

#devops

Top 10 Essential Skills for DevOps Engineer
A co taki DevOps powinien umieć? Jakie narzędzia znać? To wiedza bardzo specjalistyczna czy raczej odwrotnie - szeroka, z wielu dziedzin?

Top 5 DevOps Best Practices You Should Use
Zarządzanie wydaniami, zautomatyzowane wdrożenia, kontenery i mikroserwisy, infrastruktura jako kod i monitoring.
Niejako ciąg dalszy i pogłębienie powyższego tekstu

#management

Agile is the worst approach to research projects - except for all the others that have been tried
Angielski tytuł, ale polski tekst. Co z metodyki Agile nadaje się do prowadzenia projektów badawczych B+R w obszarze Data Science?

#python

Real-Time Typeahead Search with Elasticsearch
Przykład jak od początku do końca zbudować wyszukiwarkę (na zbiorze MovieLens) w oparciu o AWS OpenSearch i Pythona

The Forgotten Data Containers
Python ma wiele wbudowanych modułów z bardzo przydatnymi funkcjami. Collections to jeden z nich

Python Best Practices to Secure APIs
Jak w Pythonie napisać zabezpieczone API?

Decorator Tricks for Data Scientists
Jeśli już wiesz co to dekorator w Pythonie to tutaj znajdziesz kilka zmyślnych przykładów na wykorzystanie tego mechanizmu - np. dekorator ponawiający wywołanie funkcji w przypadku konkretnego błędu (takie oczywiste i przydatne, prawda?)

#ux

Decoy Effect: A Complete Practical Guide to The Psychological Pricing and Marketing Hack
"Efekt wabika" to błąd poznawczy, który wpływa na sposób, w jaki ludzie kupują. Zobacz jak w praktyce się go wykorzystuje i na co się on przekłada

#wizualizacja_danych

Visualizing Electoral Data
Ciekawa analiza (i sposób przedstawienia) danych zebranych w wyniku wyborów w Chile. Inspirowane (wymienionym w treści) opracowaniem z francuskiego "Le Monde", które też warto zobaczyć

Building a Kaggle Leaderboard with gtExtras
Tutorial pokazujący jak w R przygotować pięknie wyglądającą tabelkę z np. wynikami jakiegoś konkursu - avatarki uczestników, wynik w postaci liczb i słupków, wyróżnione czołowe miejsca... - wszystko tutaj jest!

How to Improve Your Analytical Report?
Formatowanie warunkowe znane z Excela w tabelkach Pandas? Serio? Tak, wystarczy doczytać dokumentację (albo ten tekst)

Sankeying with Plotly
Plotly fajne do wykresów (takie interaktywne, so much wow ;-)), Wykres Sankeya (wykres strumieniowy) fajny diagram - to połączmy oba w Pythonie!


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału