Newsletter Dane i Analizy, 2023-05-22

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Tak się zdarzyło, iż dzisiaj większa część tekstów dotyczy zagadnień związanych z Pythonem. Nic dziwnego, bo to główny język z którym mam do czynienia (jeśli coś w ogóle piszę albo przeglądam czyjś kod) i chyba też najbardziej popularny język wśród Czytelników. Ale na przykładzie Pythona dość łatwo pokazać ideę różnych rozwiązań - dzisiaj znajdziecie przykład oparty o FastAPI (pizzeria).

Z innych tekstów gorąco polecam rozwiązania bliższe przechowywaniu danych - jak trzymać "lajki" w bazie danych? Jak Booking.com radzi sobie z szybkim wyszukiwaniem obiektów na mapach? Co daje partycjonowanie danych (na przykładzie ich odczytywania Sparkiem)?

Bardziej filozoficzne tematy to "objaśnialność" albo bardziej nowocześnie i z angielska: XAI, czyli "wyjaśnialna sztuczna inteligencja" (w tekście o tym kiedy ufać modelom) oraz różnica pomiędzy data inżynierami a programistami (tych drugich nie dzielimy na frątasiów i bakusiów, przynajmniej nie w tej konkretnej sytuacji ;-)


#ai_ml

How to Build an AI-Powered Game Bot with PyTorch and EfficientNet
Gra w Dinozaura w Google Chrome i... komputer wyposażony w model zbudowany w PyTorch w nią grający.

#analiza_danych_koncepcje

Kiedy ufać modelom ML?
Modele uczenia maszynowego długo były postrzegane jako "czarne skrzynki". To był (a niejednokrotnie dalej jest) powód dlaczego wiele osób wybiera klasyczne metody ponad uczenie maszynowe. A może jednak czasem można im zaufać?

#bazy_danych

How social media “likes" are stored in a database
Jak w bazie danych trzymać informacje o "lajkach", aby było to najbardziej efektywnie?

#big_data

Parquet File Format: Everything You Need to Know
Dlaczego pliki w formacie Parquet są tak popularne w świecie big data?

#chatgpt

How I Turned My Company’s Docs into a Searchable Database with OpenAI
Framework który pozwolił zaindeksować dokumentację (głównie pliki Markdown, HTML i kod w notebookach Jupytera) tak, aby dało się ją przeszukać zadając pytania w "ludzki" sposób.

#ciekawostki

How Booking.com Searches Through Millions of Locations in Milliseconds
Opis algorytmu, którym posługuje się Booking.com, który pozwala im na znalezienie lokali z danego obszaru w ułamkach sekund

#front_end

302 Stories To Learn About Front End Development
Znany portal z poradnikami i tutorialami opublikował kompilację swoich najlepszych artykułów dla frontend developerów. Są posortowane od najczęściej czytanych, więc na początku znajdziesz te najbardziej docenione przez społeczność bloga.

#management

Why data engineers should be more like software engineers
Różnica między programistami a inżynierami danych czy też data scientistami rozbija się zwykle o umiejętności związane z programowaniem. A konkretnie?

#python

How To Manage Environment Variables in Python
Zmienne środowiskowe są świetną metodą parametryzowania działania kodu (na przykład w zależności od środowiska) i jednocześnie "ukrycia" danych wrażliwych (loginy, dostęp do bazy danych itd). A jak najprościej z nich skorzystać w Pythonie? Pakiet dotenv przychodzi z pomocą i "robi robotę"

Sending Emails in Python with Gmail
Google wyłączyło "mniej bezpieczną" formę aktualizacji, więc wysyłanie maili przez SMTP Gmaila już nie jest takie banalne. Zobacz jak to robić w 2023 roku

An Easy Way to Convert List of Objects to DataFrame and the Reverse in Python
Pandas dla początkujących - jak z listy zrobić data frame? A jak odwrotnie? Niby proste, ale ubrane w klasy i metody, więc jednak bardziej zaawansowane podejście.

A Python FastAPI Journey with Docker and Kubernetes
Konteneryzacja aplikacji napisane w FastAPI - nie tylko Docker, ale też Kubernetes.

Efficient Background Job Processing with Docker, Python FastAPI, and Redis
Zdokeryzowana wersja pizzerii ;-) Czyli API ubrane w Dockera i kod używający Redisa

#spark

Supercharging Performance with Partitioning in Databricks and Spark
Partycjonowanie danych i ich wpływ na szybkość operacji. Tutaj trzecia część cyklu pokazująca efekty, we wcześniejszych (linki w treści artykuły) znajdziecie podstawowe informacje o partycjonowaniu


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału