Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Znacie historię plików cookie? Dzisiaj możecie ją poznać z jednego z tekstów w newsletterrze.
Jeśli interesuje Was coś z zakresu wdrażania oprogramowania, monitoringu i ogólnie pojętej automatyzacji tego typu działań - sekcja DevOps może być dobrym początkiem.
Polecam też gorąco tekst o efekcie wabika oraz R-owy pakiet gtExtras użyty w jednym ze sposobów prezentacji rankingu zawodników.
#analiza_danych_koncepcje
Unsupervised Learning: K-Means Clustering
K-means to jeden z algorytmów nienadzorowanego uczenia maszynowego o którego pytają na rozmowach kwalifikacyjnych. Jak działa?
#analiza_danych_projekty
Classifying Music Genres with LightGBM
Po iluś projektach związanych z analizowaniem danych muzycznych mam wątpliwości czy taka klasyfikacja ma sens... ale to są świetne projekty do nauki, więc zawsze warto!
#architektura
Data Warehouse vs. Data Lake vs. Data Streaming - Friends, Enemies, Frenemies?
Pierwszy post z ciekawie zapowiadającej się serii
#bazy_danych
5 time-saving, advanced SQL queries
Pięć zoptymalizowanych zapytań SQL - ranking, self join, CASE-WHEN czy też wyciąganie fragmentów informacji (rok, miesiąc) z kolumn zawierających czas
#ciekawostki
Lou Montulli and the invention of cookie
W 1994 roku Lou Montulli napisał fragment kodu, który wprowadził nowy sposób udostępniania tożsamości w sieci - plik cookie. Przeczytaj historię wynalazcy cookies
Why Is Everybody Parking Near My Car?
Ile miejsc potrzeba na parkingu? Co minutę przyjeżdża auto, spędza 5 minut na parkingu i odjeżdża. jeżeli to jest regularnie to łatwo, ale jak nie jest?
Powerful Rules for Better Data Science
Przydatność czy złożoność?
Jakość danych czy dostrajanie hiperparametrów?
Prostota czy nowatorstwo?
#devops
Top 10 Essential Skills for DevOps Engineer
A co taki DevOps powinien umieć? Jakie narzędzia znać? To wiedza bardzo specjalistyczna czy raczej odwrotnie - szeroka, z wielu dziedzin?
Top 5 DevOps Best Practices You Should Use
Zarządzanie wydaniami, zautomatyzowane wdrożenia, kontenery i mikroserwisy, infrastruktura jako kod i monitoring.
Niejako ciąg dalszy i pogłębienie powyższego tekstu
#management
Agile is the worst approach to research projects - except for all the others that have been tried
Angielski tytuł, ale polski tekst. Co z metodyki Agile nadaje się do prowadzenia projektów badawczych B+R w obszarze Data Science?
#python
Real-Time Typeahead Search with Elasticsearch
Przykład jak od początku do końca zbudować wyszukiwarkę (na zbiorze MovieLens) w oparciu o AWS OpenSearch i Pythona
The Forgotten Data Containers
Python ma wiele wbudowanych modułów z bardzo przydatnymi funkcjami. Collections to jeden z nich
Python Best Practices to Secure APIs
Jak w Pythonie napisać zabezpieczone API?
Decorator Tricks for Data Scientists
Jeśli już wiesz co to dekorator w Pythonie to tutaj znajdziesz kilka zmyślnych przykładów na wykorzystanie tego mechanizmu - np. dekorator ponawiający wywołanie funkcji w przypadku konkretnego błędu (takie oczywiste i przydatne, prawda?)
#ux
Decoy Effect: A Complete Practical Guide to The Psychological Pricing and Marketing Hack
"Efekt wabika" to błąd poznawczy, który wpływa na sposób, w jaki ludzie kupują. Zobacz jak w praktyce się go wykorzystuje i na co się on przekłada
#wizualizacja_danych
Visualizing Electoral Data
Ciekawa analiza (i sposób przedstawienia) danych zebranych w wyniku wyborów w Chile. Inspirowane (wymienionym w treści) opracowaniem z francuskiego "Le Monde", które też warto zobaczyć
Building a Kaggle Leaderboard with gtExtras
Tutorial pokazujący jak w R przygotować pięknie wyglądającą tabelkę z np. wynikami jakiegoś konkursu - avatarki uczestników, wynik w postaci liczb i słupków, wyróżnione czołowe miejsca... - wszystko tutaj jest!
How to Improve Your Analytical Report?
Formatowanie warunkowe znane z Excela w tabelkach Pandas? Serio? Tak, wystarczy doczytać dokumentację (albo ten tekst)
Sankeying with Plotly
Plotly fajne do wykresów (takie interaktywne, so much wow ;-)), Wykres Sankeya (wykres strumieniowy) fajny diagram - to połączmy oba w Pythonie!
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)