Newsletter Dane i Analizy, 2022-12-19

blog.prokulski.science 3 lat temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Po Mundialu, można się rozejść. W tym tygodniu lekkie wytchnienie, potem święta, święta i po świętach.

W związku z tym życzę Państwu wszystkiego najlepszego, rodzinnych, spokojnych świąt. Odstawcie modele ML, dostawcie Flinki, Sparki i Kafki, zajmijcie się uszkami w barszczu i prezentami spod choinki. No, może być Pinot... Pinot Noir.

#AI_ML

10 Commonly Used Loss Functions Explained with Python Code
Loss Function czy też bardziej swojsko "funkcja straty" to taka funkcja, która jest minimalizowana przez algorytm ML. A jakie mogą to być funkcje?

#analiza_danych_koncepcje

Generate Synthetic Mobility Data
Czasami potrzebne są sztucznie wygenerowane dane. jeżeli jest to na przykład lista losowych paragonów z danego sklepu to jest to dość proste - losujemy numer klienta i zestaw produktów. Ale jeżeli mają być to dane o poruszaniu się po mieście?

Window Functions in SQL and PySpark
Agregowanie danych w grupy i liczenie różnych wartości w tychże grupach - w dużym uproszczeniu o to chodzi w tym tekście. Na przykładach w SQL i Sparku

#architektura

Real-World Engineering Challenges: Choosing Technologies
Cztery serwisy i wybory jakie przed nimi stanęły. Jaka architektura, jaki język, jakie frameworki?

What is Event Sourcing?
Event Sourcing to sposób przechowywania danych zorientowany nie na aktualny stan obiektów a na przechowanie każdej zmiany, czyli kolejne zdarzenia z obiektem powiązane

#big_data

Making sense of access logs with the Modern Streaming Stack
Apache Kafka, Faust, Apache Pinot i Superset - wszystko to do monitorowania logów aplikacji. Gdzie logi są tylko przykładem, mogą być to przecież zdarzenia (eventy) wspomniane wyżej

Why Apache Pinot is Worth the Hype?
Czy Apache Pinot jest rzeczywiście taki super? Taki na przykład LinkedIn obsługuje wyświetlenia każdego posta przy użyciu Apache Pinot, a aktualizacje robione są w czasie rzeczywistym dzięki Kafki

#ciekawostki

The State of Frontend 2022
W badaniu udział wzięło 3073 developerów z 125 krajów. Zobacz, jak w 2022 roku wyglądały wykorzystanie i rozwój technologii frontendowych.

Start preparing for data science interviews from these GitHub repositories
Szukasz pracy w obszarach Data Science, Data Analyst albo Machine Learning Engineer? Proszę, oto zbiór linków który może pomóc.

#devops

Write Better Dockerfile
Jak z głową budować obrazy dockerowe? Żeby były mniejsze, szybciej się budowały i uruchomiały?

#python

Dynamic EDA for Qatar World Cup Teams
Trochę o danych na temat drużyn z minionego już Mundialu... ale bardziej o tym jak robić wykresy w Plotly

#r

How to make a Calender in R with ggplot2
Jak zrobić kalendarz w GGPlot2?

Hillshade, colors and marginal plots with tidyterra
O mapach, obszarach i dobieraniu koloru. Między innymi. Gorąco polecam, całego bloga

#środowisko_pracy

Increase Your Productivity with VSCode Snippets
Pisz nieco szybciej w Pythonie dzięki "gotowcom" w VSCode. Dzięki tym przykładom dowiesz się jak przygotować własne "przydasie"

Integrate GitHub and Visual Studio Code for Maximum Productivity
VSCode po raz drugi - tym razem o jego współpracy z repozytoriami git. Rozszerzenie GitLens też polecam, z doświadczenia

Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału