Newsletter Dane i Analizy, 2023-01-23

blog.prokulski.science 1 rok temu

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj sporo materiałów edukacyjnych, konkretnych przykładów i rozwiązań (przynajmniej takie mam nadzieję, iż tak zostaną przez Was odebrane).

Przypominam, iż CuValley Hack, hackathon organizowany przez #KGHM, startuje już w tym tygodniu - 27.01!

Co Was czeka: 4 zadania i 127 500 PLN do wygrania! 40h kodowania analiza danych, #AI, #MachineLearning, #BigData webinary, Keynote Speakerzy i duża dawka wiedzy

Szczegóły (na przykład zadania) i darmowa rejestracja na stronie www.cuvalley.com

Dane i Analizy to patron społecznościowy, a ten konkretny konkurs to spełnienie mojej idei hackathonu: dane z przemysłu i rozwiązania dla przemysłu.


#analiza_danych_koncepcje

Machine Learning w problemie scoringu
Kilka wniosków (może dość oczywistych, ale... prawdziwych!) po zakończeniu projektu ML. Lepiej je znać wcześniej, po co uczyć się na własnych błędach skoro można na cudzych?

Dynamic pricing in practice
Dynamiczne ustalanie cen może pozwolić maksymalizować zyski. W tekście tym znajdziecie trochę teorii na ten temat

#analiza_danych_projekty

Exploratory Data Analysis of Chicago Divvy Bicycle Sharing
Dość podstawowy tutorial wprowadzający do eksploracyjnej analizy danych (EDA) w Pythonie. Ciekawostka: zbiór danych z Veturilo też da się zgromadzić, aktualne obłożenie stacji jest dostępne online

A Framework for Analyzing Churn
Klient z nami zostanie czy odejdzie? Odpowiedź na to pytanie to jedno z bardziej typowych zadań w uczenia maszynowego. Tutaj znajdziecie opis schematu działania przy budowaniu modeli ML rozwiązujących takie właśnie problemy

#bazy_danych

Data modeling with Dbeaver
Dbeaver to świetna przeglądarka baz danych, ale pozwala też na projektowanie architektury takich baz!

#big_data

Visualizing MongoDB and Pinot Data Using Trino
Dane leżące sobie w NoSQLowym Mongo pokazane na wykresach w Supersecie (który adekwatnie korzysta z widoków w tradycyjnym SQLu)? Da się. Pracujemy nad tym w CK BigData (na ile backlog biznesowy pozwala)

#ciekawostki

The yaml document from hell
Chcesz zapisać mapowanie portu 22 z kontenera na port 22 Twojej maszyny? W YAMLu taka konfiguracja to “- 22:22". Tylko dlaczego Twój kontener wylądował na porcie numer 1342 Zapisujesz kody państw w YAML? Dlaczego Norwegia to “False", a słowo “on" to “True"? Poznaj garść bugów w implementacji tego formatu!

#management

One company canceled all meetings for a month. Employees felt more productive.
Firma TechSmith na miesiąc zredukowała liczbę wewnętrznych spotkań do zera i zamiast tego postawiła na komunikację asynchroniczną. Okazało się, iż produktywność pracowników wzrosła.

Meetings for an effective eng organization.
Inżynierowie twierdzą często, iż każde spotkanie jest złe i powinno być ich jak najmniej (najlepiej wcale). Autor przedstawia jednak odmienne zdanie. W połączeniu z poprzednim tekstem mamy więc dwie opinie.

The Four-Question Framework in Competitive Advantage
Cztery pytania stanowią framework VRIO. Jak z niego skorzystać? Do czego służy?

#python

Python Data Engineer Interview Questions
Przy zmianie pracy data engineer może trafić na test wiedzy o Pythonie. W tym tekście zebrano sporo przykładowych pytań z rekrutacji i omówiono odpowiedzi. Sprawdź swoją wiedzę!

Dataclasses w Pythonie
Raczej coś dla początkujących Python-istów, ale może też nie znasz biblioteki dataclass? Ten wbudowany pakiet dostarcza możliwość tworzenia tzw. klas danych. Czym są klasy danych? Dlaczego ułatwiają pracę? Sprawdź!

Single Python package to cover 99% of your Path needs
Pathlib - bo o tym pakiecie mowa - "robi robotę" jeżeli chodzi o ścieżki do plików i folderów oraz związane z tymi bytami dodatkowe operacje

Automating Excel Dashboard Creation with Python
Czy Python może za Ciebie zrobić dashboard w Excelu? Niby jest VBA, ale czy w VBA można zrobić to samo co w Pythonie? A na implementację "węża" w miejscu Visual Basica w pakiecie Office chyba nie ma co liczyć (przynajmniej prędko)

Mastering ChatGPT in Python
ChatGPT to jeden z modeli językowych stworzonych przez OpenAI. Jest on używany do generowania tekstu na podstawie dostarczonych mu przykładów. Dostępne jest API, które pozwala na korzystanie z jego funkcjonalności w różnych aplikacjach. API umożliwia także dostosowanie modelu do indywidualnych potrzeb użytkownika. I o tym jest ten tekst, a opis wygenerował właśnie model ChatGPT


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Idź do oryginalnego materiału