Newsletter Dane i Analizy, 2022-05-16

blog.prokulski.science 2 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Łączyłem kiedyś accesssowe VBA z R - da się, choćby spoko działa. A było to tak, iż Access wypluwał dane do CSV - chyba za pośrednictwem Excela, nie pamiętam - potem R to mieliło i robiło wykres, który wstawiany był jako obrazek do raportu opartego na szablonie zrobionym w... VBA piszącym do Excela. Jak to cudo odziedziczyłem to przepisałem na Shiny produkujące PDFa z RMarkdowna i potrzebujący sobie sami te raporty robili, a nie czekali aż ja manualnie te accessowe cuda odpalę (i zablokuję sobie komputer, bo przecież "raporty się generują"). O tym jak łączyć Excela z R czy Pythonem przeczytacie dzisiaj.

Znajdziesz dzisiaj też kilka tekstów związanych z prezentowaniem danych oraz co nie co o szeregach czasowych.

Już jutro, wygodnie ze swojego domu lub biura, a w dodatku za darmo możesz w pełni bezpłatnie uczestniczyć w największym cyfrowym wydarzeniu poświęconym Python w Polsce

Pytech Summit 2022 (online) to największa polska konferencja poświęcona Pythonowi, a skierowana jest do pasjonatów tego języka z profilu mid i senior.

Co będzie? To co lubicie w ramach czterech ścieżek tematycznych:
web backend machine learning big data

Rejestracja na stronie pytechsummit.pl, a Dane i Analizy to patron medialny.


#analiza_danych_koncepcje

Survival Analysis: A Brief Introduction
Jakie jest prawdopodobieństwo iż sprzęt się zepsuje po 5 latach pracy? Albo iż ktoś dożyje wieku 80 lat? Do badania takich rzeczy służy analiza przeżycia, a tutaj wprowadzenie (przy użyciu Pythona)

Extract knowledge from text
Jak wyciągnąć wiedzę z tekstu? Praktyczne przykłady na wykorzystanie spaCy do zadań NLP

A new tool for explainable AI
Wyjaśnienia dlaczego model dał takie a nie inne wyniki (Explainable AI, XAI) to isotne zagadnienie. Tutaj nowe narzędzie do tego celu

#analiza_danych_projekty

Call Python and R Scripts From Excel
Do obrabiania danych Python czy R często są lepsze niż Excel. Albo często w Excelu nie ma gotowych narzędzi do jakichś tam obliczeń. Może więc z Excela wywołać skrypty R/Python?

A simple route optimization using BigQuery
Problem komiwojażera w nowoczesnym wydaniu - w jakiej kolejności odwiedzać klientów? BigQuery przychodzi z pomocą

Optimizing Facebook-Prophet fit method to run 20X faster
Facebookowa biblioteka Prophet świetnie radzi sobie z szeregami czasowymi. A gdyby jeszcze było szybciej?

#bazy_danych

How to use MongoDB with Graphical IDEs
MongoDB też ma narzędzia do wygodnego przeglądania danych zawartych w bazach i kolekcjach, a też do zarządzania tymi bazami i kolekcjami

#big_data

Learn Stream Processing With Kafka Streams
Wprowadzenie do Kafka Streams - jak wykonać proste operacje bezpośrednio na strumieniu danych "płynącym" Kafką?

Apache Spark Discretized Streams (DStreams) with PySpark
Tutaj zaś streaming ale w Sparku

How we built our Lakeless Data Warehouse
Budowanie data lake czy też hurtowni danych - co może się przytrafić? (lessons learned)

#ciekawostki

Don’t do these DATA SCIENCE Mistakes
Planujesz albo zaczynasz pracę jako data scientist? Przeczytaj koniecznie!

#management

How to Measure the ROI of Your Data Team?
Płacimy tym zespołom analityków czy inżynierów danych, ale jaki to daje zwrot? Czy to się opłaca?

A Framework for Embedding Decision Intelligence into your Organization
Droga do data driven, droga do data mesh - na obu mamy coś o podobne zagadnienia, a ten tekst też takowe porusza

#python_junior

12 useful Pandas scripts for financial time series
Kilka "przydasiów" do analizy szeregów czasowych w Pandas, szczególnie jeżeli to są finansowe szeregi (np. kursy walut lub akcji)

#python_mid

PyScript - Run Python With HTML
Hit ostatniego tygodnia - Python uruchamiany jak JavaScript w kodzie strony HTML

Reloadium
Ciekawy plugin dla piszących w Pythonie - adekwatnie debugger w trakcie pisania kodu

Testing feature logic, transformations, and feature pipelines with pytest
Testowanie nie tylko funkcji czy klas, ale też cech w zestawach danych (ficzersów w datasetach - nazwijmy to po imieniu)

#r

Analyze your Twitter timeline with {rtweet} and {lubridate}
Analiza timeline’u twitterowego w R. A tak naprawdę to o parsowaniu dat przy pomocy pakietu lubridate

Input Validation for Shiny Apps
Walidacja wprowadzanych w różnych inputach danych w aplikacjach Shiny - przydatny pakiet

#wizualizacja_danych

Goodbye Scatterplot, Welcome Binned Scatterplot
Jeśli nie scatterplot (wykres punktowy, X-Y) to co?

Simple Yet Stunning and Meaningful Geospatial Visualization Using Happiness and Conflict data
Jak pokazać dane na mapie w Pythonie? W praktyce użyte zostają pakiety Geopandas, Plotly oraz Folium

Python Libraries for Mesh, Point Cloud, and Data Visualization
Wizualizacje 3D, wykresy, animacje... Szaleństwo. Jest też druga część tego szaleństwa


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału