Newsletter Dane i Analizy, 2022-08-01

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj nieco więcej materiałów z krainy "ops" w świecie "devops". Warto znać obie ziemie, żeby nie mieć problemu chociażby z uruchomieniem kilku aplikacji (dockerowymi) pod różnymi ścieżkami na jednej domenie. Dlatego warto zajrzeć do tekstów o Nginx.

Ale sprawy związane z analizowaniem danych czy też ich przetwarzaniem w celu przewidywania przyszłości tradycyjnie też są na poniższej liście interesujących artykułów z minionego tygodnia.


#AI_ML

Czym jest i jak zbadać dryft modelu (model drift)?
Dryft modelu odnosi się do spadku wydajności modelu z powodu zmian danych i relacji między zmiennymi wejściowymi i wyjściowymi

Architektura Transformer NLP pod mikroskopem
Opis architektury modelu Transformer NLP, mechanizmu uwagi (attention) na przykładzie tłumaczeń

Top Explainable AI Python Frameworks in 2022
Wyjaśnienie dlaczego model zadziałał tak czy inaczej, dlaczego tak podzielił nasze dane na kategorie albo przewidziała taką a nie inną wartość w procesach regresyjnych jest istotnym zagadnieniem w wielu przypadkach. Tutaj znajdziecie pakiety do Explainable AI (XAI) dostępne i używane w tej chwili w Pythonie

#analiza_danych_koncepcje

Time-Series Data Processing Workflow
Jak wygląda proces prognozowania danych czasowych? Wydaje się to być proste, ale wprowadzenie jak dla początkujących pozwala często uporządkować wiedzę

The Bayesian Bootstrap
Krótki przewodnik po prostej i potężnej alternatywie dla bootstrapu

#bazy_danych

A Visual Summary of SQL Date/Time Functions
Przekształcenia związane z czasem czy datami w ramach zapytań SQL - podsumowanie (dobre na przykład na rozmowę kwalifikacyjną albo po prostu jako ściągawka)

Spatial Data Science: SQL Join Spatially
Join pomiędzy tabelami w bazie danych to nic specjalnego. Ale PostgreSQL (razem z PostGIS) potrafi operować na danych przestrzennych - na przykład zwracać tylko te punkt na mapie, które leżą w ramach określonego obszaru. Szybkie wprowadzenie na zasadzie "tu jest kierunek, szukaj dalej"

#big_data

The Heart of the Data Mesh Beats Real-Time with Apache Kafka
Niezawodne, skalowane mikrousługi w środowisku strumieniowym

#ciekawostki

PyBaobabdt
Pakiet Pythona do wizualizacji drzew decyzyjnych dzięki diagramów Sankeya. W przypadku klasyfikatora drzewa każda klasa jest reprezentowana przez kolor, a szerokość każdego łącza (lub korzenia) reprezentuje liczbę próbek w każdej klasie.

Growth Engineering
Jak Zalando (wbrew pozorom to nie tylko sklep z ciuchami, ale firma z poważny bigdejtowym zapleczem) dba i rozwija swoje zespoły inżynierów?

#devops

Top 25 Nginx Tips and Tricks From Practical Experience
Paczka tricków i prostych rozwiązań dla początkujących administratorów Nginxa. "Biała lista" adresów IP? Blokowanie hot-linkowania obrazków? Blokowanie ruchu ze spamowych refferali? Wszystko to tutaj jest!

Best Courses to learn Nginx in depth
Jeśli 25 tricków to za mało - sprawdź, może któryś z bardziej zaawansowanych kursów będzie dla Ciebie?

Routing Multiple Docker Containers with Different Web Servers to the Same Port
Jak już tak przy tym Nginxie jesteśmy... to jak udostępnić wiele aplikacji z dockerowych obrazów na jednym porcie?

Visual studio code extensions for DevOps engineers
Visual Studio Code to nie tylko znakomite IDE dla programistów (niektórzy wolą IntelliJ i rodzinę od JetBrains), ale jak się okazuje są też dodatki da devops

#python

Best Practices for File Operations
Moduły os oraz os.path mogą odejść w zapomnienie. Pathlib robi robotę! I nie jest dodatkową biblioteką!

Test-Driven Development with Python
Jak skorzystać z techniki test-driven development (TDD) przy pisaniu kodu w Pythonie?

#wizualizacja_danych

Enhance Your Data Understanding with a Single Plot
Jeden prosty wykres który na gwałtownie pozwoli przejrzeć posiadane dane i ich wzajemne relacje

Whip up a stunning Dashboard with Python & Streamlit!
Liczniki w aplikacjach Streamlit? Własny wygląd (własne CSSy)? Jak tego dokonać dowiesz się z tego tekstu


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału