Newsletter Dane i Analizy, 2023-06-19

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W dzisiejszym numerze znajdziecie link do niezbyt długiego filmu pokazującego jak korzystać z Midjourney - czyli narzędzia do generowania hiperrealistycznych grafik. Robi wrażenie (Midjourney, nie sam filmik), pochłonęło mnie na kilka godzin wczoraj... tylu nieistniejących dziewczyn dawno nie widziałem ;-) a zabawa w zmiany stylu przednia!

Oczywiście ktoś takie Midjourney musiał przygotować wcześniej i nauczyć tą sztuczną inteligencję tych wszystkich sztuczek. prawdopodobnie te osoby musiały zacząć od podstaw, a te znajdziecie w kursie od IBM, opublikowanym na YouTube.

Na YouTube też świetna rzecz - jak działa (w ujęciu architektury systemowej) Uber? Polecam gorąco!

Nie zapominajmy też o wynikach ankiety StackOverflow - wygląda na to, iż Python niedługo juz będzie 2x bardziej popularny niż Java.


#ai_ml

Introducing Voicebox: The first generative AI model for speech to generalize across tasks with state-of-the-art performance
Voicebox - nowy model od Facebooka, pozwalający na wygenerowanie dowolnej wypowiedzi dowolnym głosem bez treningu, ale też np. odfiltrowanie dowolnych odgłosów w tle albo dynamiczną zmianę treści wypowiedzi w nagraniach. Obsługuje język polski.

#analiza_danych_koncepcje

Can I Walk There?
Przeprowadzasz się do nowego miasta i szukasz mieszkania? Fajnie jakby było blisko pracy, ale też wszystkich potrzebnych miesc (sklep, restauracja, itd). Ten projekt polega na szukaniu takich miejsc. Inspirujące pomysły!

10 Confusing XGBoost Hyperparameters and How to Tune Them Like a Pro in 2023
Szczegółowe wyjaśnienie dziesięciu hiperparametrów, funkcjonalności, akceptowanych zakresów wartości, najlepszych praktyk oraz tego, jak używać Optuny do ich dostrajania (link do repo w treści)

Deep Multi-task Learning and Real-time Personalization for Closeup Recommendations
Algorytm rekomendacyjny w Pinterest

#analiza_danych_projekty

Finding Temporal Patterns in Twitter Posts
Analiza zachowań użytkowników (na przykładzie ich twittów) w czasie - czy jakieś pory są bardziej popularne?

IBM Data Analyst Complete Course - Data Analyst Tutorial For Beginners
Podstawowe zasady analizy danych dzięki Pythona i Excela (w tym 2 godziny wprowadzenia do Pythona) - 16 godzinny pełny kurs

#architektura

UBER System design
Jak zbudowana jest architektura, na której swoje działanie opiera UBER? Z jakich elementów się składa i dlaczego zdecydowano się właśnie na takie rozwiązania? Tego dowiesz się z filmu (YT, 37 minut)

#chatgpt

Power Up Your Text Analysis in Python Using LLMs within scikit-learn Framework
Pakiet Scikit-LLM pozwala na użycie modeli językowych, takich jak ChatGPT, do przeprowadzania klasyfikacji tekstu, jego podsumowania i innych zadań związanych z analizą tekstu.

Private LLMs on Your Local Machine and in the Cloud
ChatGPT rozpalił różne nadzieje, w tym chęć posiadania takiego cuda u siebie, na własnych danych. Przede wszystkim bez udostępniania tych danych. Mówiąc krótko: da się.

#ciekawostki

Ultimate Midjourney Guide: Beginner to Advanced
Dowiedz się, jak używać Midjourney do generowania (przez AI) grafiki. YouTube, 12 minut

#management

I beat impostor syndrome (and here’s how I did it)
"Wcale nie jestem taki/taka dobra jak mogłoby wskazywać moje stanowisko, przecież ja nic nie potrafię!" - znacie?

5 Career Lessons for Data Engineers
Wskazówki dotyczące rozwoju kariery w inżynierii danych. Czyli jeżeli zechcesz zmienić pracę to przyda ci się ;-)

#python

JupyterLab 4.0 is Here
Co nowego w najpopularniejszym środowisku dla data scientistów?

Encrypting Excel Files Written from DataFrames
ExcelHelper - pomoże Ci zapisać dane z pandasowego dataframe’a do zahasłowanego pliku Excela

Building A Concurrent WebScraper From Scratch
Scrapper jak scrapper, ale ubrany w wielowątkowość i kod napisany w jednej klasie. Do nauki jak znalazł

#r

Modeling EEG Signals using Polynomial Regression in R
Wybór najlepszego modelu z regresją wielomianową - od podstaw

#sql

12 Common Mistakes and Missed Optimization Opportunities in SQL
Optymalizacja zapytań SQL nie jest łatwa. Kilka typowych, ale nie banalnych, błędów (i sposobów na ich uniknięcie) znajdziecie w tym poradniku

#ux

Times New Roman: can we make serifs great again?
Czcionki potrafią być fascynującym tematem... a kto z młodych pamięta, iż domyślną czcionką w Wordzie była niegdyś szeryfowa Times New Roman?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału