Newsletter Dane i Analizy, 2023-10-02

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Tytuł dzisiejszy, o siatce tajnych powiązań wśród noblistów, nieco prowokacyjny - zobaczmy czy ma wpływ na open rate newslettera ;-). A o samej siatce powiązań przeczytasz niżej. Siatka, w której Rodzina Curie odgrywa znaczącą rolę (dobrze brzmi, jak Rodzina Corleone, co nie? ;-)

W sekcji poświęconej językowi R znajdziecie analizę przygotowaną w ramach #TidyTuesday, czyli cotygodniowych ćwiczeń dla analityków danych. Polecam tę serię jeżeli chcesz poćwiczyć swoje umiejętności, a brakuj Ci pomysłów (ileż można w churn klientów, ceny domów ze zbioru Boston Housing albo rozpoznawanie cyferek z MNIST?). Zadania przygotowane są z myślą o R, ale - zadanie to zadanie, prawda? Narzędzia do rozwiązania dowolne.

Na koniec zaś Radar Technologiczny: szybki rzut oka na narzędzia, techniki, platformy, języki programowania i frameworki. Raport oparty jest na praktycznych doświadczeniach z całego świata. Publikowany dwa razy w roku dostarcza wglądu w to, jak współczesny świat tworzy oprogramowanie. Zdaje się, iż szybciej reaguje na nowości niż Gartner, na pewno jest za darmo. Podobnym serwisem jest też G2 - jeżeli robisz "przeglądy rynku" albo przygotowujesz materiały porównujące różnych dostawców czy rozwiązania to na pewno Ci się przyda.


#analiza_danych_koncepcje

How to Accurately Test Significance with Difference in Difference Models
Czy skutek został wywołany przez zmianę? Można to sprawdzić robiąc testy A/B, ale nie zawsze jest to możliwe - na przykład w czasach pandemii nie mieliśmy próbek kontrolnych "restauracje otwarte" i "restauracje zamknięte" - wszystkie były zamknięte. Jak więc sprawdzić czy wprowadzona zmiana przyczyniła się do skutku?

Mastering Customer Segmentation with LLM
Grupowanie klientów ze wsparciem modeli LLM (tekst budowany z danych tabelarycznych) - szalone ale efektywne.

Social Network Analysis with NetworkX: A Gentle Introduction
Wprowadzenie do analizy sieci społecznych. Gdzieś tutaj krąży analiza sieci laureatów Nagrody Nobla... to tutaj narzędzia do tego typu rzeczy. Albo do sprawdzenia "kto kogo" wśród Twoich znajomych na FB albo LI, ewentualnie w zarządach spółek.

#analiza_danych_projekty

Budowa modelu klasyfikacji obrazów z Fast.AI
Mateusz (autor tekstu) pisze: projekt wykonałem w ciągu jednego wieczoru pod naciskiem syna. Jest dosyć prosty, choć korzysta z nietrywialnych rozwiązań - głębokie sieci neuronowe.

Data Engineering Project - BI Department
Poczętek serii artykułów w której autor buduje całe zaplecze dla analiz BI, które mają na celu wspieranie wypożyczalni DVD. Świetny przykład jak budować model danych, przepływy danych i finalne wizualizacje.

#architektura

ML Pipeline Architecture Design Patterns
Standardowe praktyki i typowe wzorce oraz komponenty potoków danych i uczenia maszynowego

12 Microservices Patterns I Wish I Knew Before the System Design Interview
Na najpopularniejszym rozwiązaniu polegającym na wrzuceniu wszystkich usług za API Gateway świat się nie kończy. Istnieje jeszcze kilkanaście innych rozwiązań, które także mają swoje zastosowanie.

#bazy_danych

Upsert in SQL
Jak w SQLu dodać nowe rekordy do bazy danych i jednocześnie zaktualizować już istniejące? Ten artykuł pokazuje jak to zrobić. Znajdziesz przykłady dla MySQL, SQLite, PostgreSQL, SQL Server i Oracle, a same przykłady są interaktywne!

Understanding SQL: Getting Started with Window Functions
Agregacja jak GROUP BY ale z nieco innymi cechami.

#big_data

Scaling Kafka to Support PayPal’s Data Growth
A kiedy Apache Kafka jest za mała i trzeba ją zeskalować aby obsłużyła znacznie większy ruch?

#ciekawostki

Genius Cliques: Mapping out the Nobel Network
Łącząc naukę o sieciach społecznych, wizualizację danych i Wikipedię, autor odkrywa ukryte powiązania między wszystkimi laureatami Nagrody Nobla. Interesujące!

Spotify is going to clone podcasters’ voices - and translate them to other languages
Współpraca Spotify z OpenAI umożliwi twórcom podcastów replikowanie ich głosów w celu automatycznego tworzenia obcojęzycznych wersji ich programów. Czyli nagrywasz po polsku a słuchają po hiszpańsku, portugalsku, grecku i włosku (i nie tylko). Niesamowite!

#devops

The Best Strategies to reduce the size of Docker Images
Kilka sposobów na zmniejszenie rozmiaru obrazów dockerowych ale też na szybsze ich budowanie

#python

Creating a Simple Task CRUD App with FastAPI, PostgreSQL, SQLAlchemy, and Docker
Szybki CRUD (Create, Read, Update, Delete) w Pythonie, na PostgreSQL. To jest potrzebne tak często, iż lepiej mieć gotowca pod ręką.

Building a Smart Travel Itinerary Suggester with LangChain, Google Maps API, and Gradio (Part 3)
Ten artykuł jest ostatnim z trzyczęściowej serii, w której autor stworzył aplikację do sugerowania planów podróży przy użyciu interfejsów API OpenAI i Google i wyświetla ją w prostym interfejsie użytkownika wygenerowanym dzięki Gradio. W tej części dowiesz się, jak zbudować interfejs użytkownika i złożyć w całość wszystkie moduły z części 1 i 2.

Use the MACD Indicator in the Market
Akcje: kupić czy sprzedać? MACD to jeden z prostszych wskaźników mogących pomóc w podjęciu decyzji. Jak jest zbudowany?

#r

Creating typewriter-styled maps in ggplot2
Mapa wyglądajaca jak przygotowana na maszynie do pisania :O

How often does Roy Kent say "F*CK"?
Jak bardzo Roy (znany z Ted Lasso) przeklina? Projekt z serii #TidyTuesday (cotygodniowe ćwiczenia dla analityków danych)

#wizualizacja_danych

Mastering Plotly
Szybki przewodnik po Plotly - jak przygotować interaktywne wykresy korzystając z tej dość uniwersalnej biblioteki?

Top 9 Architecture diagram software for cloud infrastructure
Narzędzia do tworzenia diagramów architektury dla infrastruktury chmurowej

#środowisko_pracy

“Good Commit" vs “Your Commit": How to Write a Perfect Git Commit Message
"Poprawka" - to nie jest dobry komentarz do commita. Jak więc pisać dobre?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału