Newsletter Dane i Analizy, 2023-07-10

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Myślisz, iż analitycy danych już nie będą potrzebni? Dlaczego? Bo pojawił się Code Interpreter, a jeżeli nie wiesz o co chodzi to przeczytaj koniecznie o nim (i o tym jak go używać!) tutaj ("What AI can do with a toolbox... Getting started with Code Interpreter") oraz tutaj ("It is starting to get strange"). Code Interpreter jest dostępny w planie "ChatGPT Plus".

I ten temat, te dwa teksty to chyba najciekawszy materiał w tym tygodniu. Gdyby było mało - poniżej kilka kolejnych.


#ai_ml

ML w AWS
O co chodzi z Amazon Sagemaker? Ten wpis jest pierwszym z serii (i po polsku)

Meta AI’s Another Revolutionary Large Scale Model — DINOv2 for Image Feature Extraction
DINOv2 - nowy model do wyciągania cech z obrazów.

#analiza_danych_koncepcje

Step-by-Step Guide to Bayesian Optimization: A Python-based Approach
Optymalizacja bayesowska - technika używana do globalnej (optymalnej) optymalizacji funkcji "czarnej skrzynki", czyli po prostu do znalezienia najlepszego dopasowania. Wytłumaczenie o co chodzi wraz z przykładami w Pythonie

PostgreSQL as a Vector Database: Create, Store, and Query OpenAI Embeddings With pgvector
Różne cechy określonego na przykład produktu (albo klienta) można w gruncie rzeczy ułożyć w ciąg liczb, a ciąg liczb to wektor. Embedingi dla tekstu to też wektory. I takie embedingi (w dodatku z OpenAI!) posłużą za przykład wykorzystania bazy PozstgreSQL jako bazy wektorowej

#analiza_danych_projekty

Customer Churn Prediction in a Telco
A gdyby tak do predykcji churnu (= odejść klientów) użyć modeli jak w "analizie przeżycia"? Interesujące podejście dające dobre wyniki!

All You Need to Know to Build Your First LLM App
LLM (duże modele językowe) to popularny ostatnio temat, głównie ze względu na ChatGPT. A jak zbudować własną aplikację wykorzystującą takie modele?

#bazy_danych

Using MongoDB Query Language for Unstructured Data
Znasz SQLa? To gwałtownie poznasz podstawy zapytań do MongoDB - ten tekst zestawia w jednej tabelce oba języki odpytywania baz danych

MongoDB Is Great For Analytics; Until It’s Not
Zapytania zapytaniami, ale jak dowiecie się z tego tekstu - MongoDB nie zawsze musi być takie super. Gdzie mogą pojawić się problemy?

#ciekawostki

Using Large Language Models (LLMS) In Production
Wyżej znajdziecie tekst o tym jak zbudować modele typu LLM, ale po co taki model w ogóle wykorzystać?

#management

Scaling Data Teams: 5 Learnings from BlaBlaCar
Twoja drużyna zajmująca się danymi wydaje się być za mała? Zobacz jak w BlaBlaCar ją powiększali

Better Software Engineering teams: Structures, roles, responsibilities...
Uzupełnieniem wiedzy o rozbudowie zespołu może być kilka typowych struktur organizacyjnych - na przykładzie zespołu inżynierów danych

#python

10 Advanced Matplotlib Concepts You Must Know To Create Killer Visuals
Co prawda nie doprowadzicie swoich wykresów do tego co widać na miniaturze, ale będziecie potrafili upiększyć standardowego matplotliba.

5 Powerful Python Libraries For EDA You Need to Know About
Dane zawsze lepiej zobaczyć - w formie prostych tabelek czy wykresów. Tutaj znajdziesz kilka bibliotek, które gwałtownie Ci to umożliwią.

10 Libraries That Take Data Visualization to New Heights
Pythonowe biblioteki na każdą wizualizację


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału