Newsletter Dane i Analizy, 2022-08-15

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Świat działa w realtime i tylko to się liczy - dlatego data scientiści też powinni na takie działanie się przygotować, a dobry tekst wprowadzający znajdziecie niżej.

No a jak Ci się znudził Excel plus Access wspomagane VBA (wg mnie to jest zmora korporacji - blokuje kreatywność i spowalnia rozwój) to dowiedz się gdzie kierować się dalej. Dla developerów z backendowym zacięciem też coś się znajdzie.

Dla tych co siedzą głęboko w modelach: połączenie Boruty z wartościami Shapleya do selekcji ważnych cech dla modeli - sprytne, ciekawe.


#AI_ML

Is Your Model the Best One or the Luckiest One?
Twój model ML czy choćby AI, jaki on jest? Najlepszy czy tylko najszczęśliwszy? Tak - próbka testowa czy walidacyjna może być mniej lub bardziej szczęśliwa

#analiza_danych_koncepcje

Is this the Best Feature Selection Algorithm “BorutaShap"?
Boruta to algorytm na wyszukiwanie najbardziej znaczących cech, które "najbardziej się przydają" modelom. Wartości Shapleya służą do tego samego. Zatem dlaczego nie połączyć obu podejść?

#analiza_danych_projekty

Monitoring Weather with Prefect ETL
Kibana jako miejsce obserwowania pogody. No bo dlaczego nie? A jakże to pouczające doświadczenie robić samodzielnie coś co empirycznie można sprawdzić! Serio serio - wiemy z doświadczenia

#big_data

Introduction to streaming for data scientists
Uczenie maszynowe w cyklach (batchowe, w paczkach) przestaje wystarczać. w tej chwili żadne 15-minutowe mikro-batche nie są wystarczające. Świat działa w realtime i tylko to się liczy. Co to znaczy dla analityków czy ogólnie data scientistów?

Request-Response with REST/HTTP vs. Data Streaming with Apache Kafka
RESTem czy Kafką? Czy to w ogóle jest wybór jedno czy drugie? A może oba? Architekci rozwiązań i analitycy systemowi - to dla Was!

#ciekawostki

Evolving to Problem Solving?
A jak już jestem tym programistą, inżynierem danych, data scientistą, analitykiem dłubiącym w Excelu i piszącym w VBA - co jak mam się rozwijać? Co robić, żeby nie stanąć w miejscu (w rozwoju ale też w obliczu codziennych zadań)?

Backend Developer Roadmap
Chcesz się rozwijać jako developer w obszarze backendu? Może to roadmapa dla Ciebie?

#management

Communicating Data Science Insights to Non-Technical Teams
Opowiadanie laikom o zagadnieniach ML czy AI nie jest łatwe. Należy unikać zrozumienia na poziomie "sztuczna inteligencja wszystko zrobi za nas"

The universe of “Data Science" roles demystified
Kto jest kim w tym "data science"-owym, "big data"-owym świecie? Albo: jeżeli nie wiesz jakie stanowiska co robią to masz słownik

4 Principles to Guide Data Team Leaders
Jak budować wydajne zespoły zajmujące się danymi?

#python

Python-Pandas cheat sheet
30 "przydasiów" pandasowych dla adeptów przerzucania danych w Pythonie

Solar panel power generation analysis
Abstrahując od danych - dobry tutorial jak pokazywać dane i przygotować proste EDA

Choose the Right Python Concurrency API
Przetwarzanie wielu zadań na raz w Pythonie - są na to co najmniej trzy sposoby. Jak wybrać ten adekwatny?

#r

5 ways to instantly improve your R data visualizations
Przyciągnij uwagę odbiorców Twoich wykresów słupkowych nieco je modyfikując. W R, w ggplot2, dla średniozaawansowanych

#wizualizacja_danych

3 Must Know Data Visualization Principles
Wyróżniki na wykresach - nie wszystko musi być opisane, nie wszystko musi być dokładne, często mniej elementów przekazuje lepiej to samo


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału