"Możliwości AI przez cały czas nas zaskakują" 🕹 - rozmowa z Siimem Maivelem

techpigulka.substack.com 2 lat temu

Wykorzystanie algorytmów sztucznej inteligencji i wsparcie codziennej pracy przez chatboty takie, jak ChatGPT widać praktycznie na każdym kroku. Od jakiegoś czasu ciekawiło mnie jednak, w jaki sposób duże organizacje wykorzystują AI do swoich operacji. Czy wdrożenie konkretnych modeli zawsze jest potrzebne? Czy się opłaca? Ile osób pracuje nad danymi?

Te i wiele innych pytań nurtowały mnie na spacerach i pod prysznicem (bo przecież jak wszyscy wiemy, to właśnie w łazience powstają największe idee).

Okazja do uzyskania odpowiedzi na niektóre pytania pojawiła się znienacka - dzięki Martynie Kurkowskiej z polskiego oddziału firmy Bolt miałem okazję porozmawiać z Siimem Maivelem - Head of Data Science w Bolt.

Żeby nie przedłużać, szczególnie w sobotni poranek - nie pozostaje mi nic innego, jak zaprosić Cię do lektury.

Bon appétit! 🍰

Jak spadek kosztów wdrożenia AI wpłynął na strategię biznesową Bolt?

Większość firm nie ma problemu z generowaniem dobrych pomysłów, które chciałyby wdrożyć. To samo dotyczy Bolta. Problem polega na ograniczonych zasobach. Pojawia się zatem pytanie jak wyselekcjonować te aspekty, których rozwiązanie przyniesie największy zwrot z każdej zainwestowanej złotówki?

Obniżony koszt rozwiązań wykorzystujących AI, zwiększył zwrot z inwestycji w wiele projektów związanych z automatyzacją czynności w zakresie przetwarzania zgłoszeń obsługi klienta czy obsługi wprowadzania danych np. z dokumentów kierowców.

Co ciekawe, w ciągu ostatnich dwóch miesięcy spadły nie tylko koszty, ale jednocześnie możliwości dużych modeli językowych wzrosły do poziomu, który wcześniej był niewyobrażalny. Z tego powodu zrobiliśmy krok wstecz w wielu projektach, aby przemyśleć, co jest możliwe. Możliwości tych modeli przez cały czas nas zaskakują: czy to oznaczaniem opinii klientów ze sklepów z aplikacjami, klasyfikacją przychodzących próśb o wsparcie w aplikacji, czy choćby ogólną rozmową z klientami za pośrednictwem czatu ze wsparciem technicznym.

Jakie są główne czynniki, które należy wziąć pod uwagę, oceniając, czy inwestować w sztuczną inteligencję?

W Bolcie wybierając odpowiednie inwestycje, kierujemy się nastawieniem na produkt.

Mówiąc ogólnie, patrzymy na następujące wymiary:

Korzyści a koszty. Oceniając w Bolt wpływ biznesowy projektów, myślimy przede wszystkim o ogólnej wielkości wpływu i pewności, jaką mamy co do niego. Budowanie, utrzymywanie, skalowanie i ulepszanie systemów uczenia maszynowego na dużą skalę wymaga sporego wysiłku, dlatego inwestując, chcemy mieć pewność, iż można na tym wiele zyskać.

Leczysz objaw czy chorobę? Niejednokrotnie ludzie mają żmudne, wykonywane manualnie zadania, które są połączeniem wprowadzania danych, podejmowania decyzji i monitorowania. Mimo iż problem jest uciążliwy, a rozwiązaniem mogłaby być jakaś aplikacja AI, często podczas analizy przyczyn źródłowych okazuje się, iż można wyeliminować lub ograniczyć problem, zmieniając proces lub system na wcześniejszym jego etapie. Na przykład, kiedy w Bolt weryfikujemy prawo jazdy partnerskich kierowców, w niektórych krajach rejestry online są dostępne wyłącznie za pośrednictwem sieciowego interfejsu użytkownika. Aby mieć potwierdzenie weryfikacji dokumentu, robimy zrzut ekranu i wyodrębniamy z niego tekst. W takim przypadku nie musisz wyodrębniać tekstu z obrazu, ale znaleźć sposób, aby wyodrębnić te informacje z HTML (tzw. web scraping) lub dzięki interfejsu API. I voila – sztuczna inteligencja nie jest potrzebna!

Kupić czy zbudować? Nie musimy budować wszystkiego we własnym zakresie, gdy istnieją dobrzy poddostawcy z konkurencyjnymi ofertami. Zasoby inżynieryjne są ograniczone, dlatego w Bolt chcemy wykorzystywać je tylko w przypadku funkcji i problemów, których żaden zewnętrzny poddostawca nie jest w stanie rozwiązać lub w przypadku których możemy zaoferować klientowi większą wartość, robiąc to samodzielnie, lepiej czy taniej. Na przykład istnieje wiele rozwiązań open source i chmurowych dla różnych modeli wykrywania twarzy. Nie ma potrzeby budowania go samodzielnie, choćby jeżeli jest to łatwe do wykonania. Nie ma jednak odpowiednich dostawców zewnętrznych, którzy mogliby oszacować wzrost naszych kampanii marketingowych.

Czy mamy lepsze zbiory danych lub zrozumienie domeny? Istnieje wiele produktów opartych na uczeniu maszynowym, które są oferowane jako usługa lub wywołanie API. W naszej skali często odkrywamy, iż mamy więcej danych dla naszego konkretnego przypadku użycia, dzięki czemu możemy zbudować dokładniejszy i bardziej wydajny model.

Zbędność. Kiedy stajemy się nadmiernie uzależnieni od zewnętrznych dostawców usług, ich przestoje i degradacja usług wpływają i na nas. Dlatego chcemy odizolować naszych klientów od błędów naszych dostawców, co czasami oznacza konieczność budowania duplikatów systemów.

Jak można zmierzyć korzyści, które przynosi sztuczna inteligencja w organizacji? Jakie wskaźniki mogą pomóc w ocenie tego?

To głównie zależy od konkretnych zastosowań, ale główne obszary to:

Generowanie sprzedaży. Czy jesteśmy w stanie obsłużyć nowych klientów lub potencjalnie sprzedać więcej naszym obecnym? Jest to zwykle możliwe bezpośrednio do zaobserwowania poprzez testy A/B lub inne metody badawcze. Przykładem jest planowanie przejazdów z/na lotnisko, które wymagają prognozowania podaży i popytu w przyszłości, aby zapewnić odpowiednie ceny i dostępność.

Optymalizacja przychodów. Jakie korzyści jesteśmy w stanie dostarczyć naszym obecnym klientom? Nasze algorytmy planowania finansowego oszacowują zwrot z inwestycji w kampanie (przede wszystkim zniżki dla pasażerów) na każdym rynku, a następnie dystrybuują określony budżet inwestycyjny w taki sposób, aby maksymalizować zwroty. Właśnie zwrot z inwestycji jest wskaźnikiem.

Redukcja kosztów. To jest najbardziej oczywiste. Podczas tworzenia produktów należy gwałtownie budować funkcjonalność, a korzystanie z zewnętrznych dostawców jest jednym ze sposobów. Ale kiedy już zweryfikujemy zapotrzebowanie na dany produkt lub funkcję i zaczynamy go skalować, zewnętrzni dostawcy stają się kosztem, który można optymalizować poprzez negocjacje kosztu lub tworzenie takich rozwiązań samodzielnie. Szacowanie powodzenia takich projektów jest zwykle najdokładniejsze, ponieważ optymalizujemy istniejący koszt, a nie hipotetyczny koszt w przyszłości.

Jakość i bezpieczeństwo. Realizacja niektórych usług nie jest możliwa bez wykorzystania uczenia maszynowego, np. chatboty wspierające obsługę klienta, automatyczne wprowadzanie danych z dokumentów, czy też przewidywanie czasu przygotowania jedzenia. W takich przypadkach miarą jest dokładność i niezawodność funkcji, choć można również znaleźć zależności między aktywnością klienta a jakością i bezpieczeństwem usługi.

Jakie są główne trudności z integracją open-source AI z istniejącymi systemami w firmie?

Większość naszych rozwiązań opartych na uczeniu maszynowym korzysta z technologii open-source, które możemy hostować u naszego dostawcy chmury, z wyjątkiem niektórych koncepcji, których realizację w tej chwili rozważamy przy użyciu interfejsów API OpenAI oraz niektórych generatorów obrazów. W przypadku dużych modeli językowych, takich jak GPT-4, głównym wyzwaniem są zasady dot. udostępniania danych i prywatności, które ma wdrożone dostawca, a których my musimy przestrzegać zgodnie z naszymi zobowiązaniami umownymi wobec użytkowników i obowiązującymi regulacjami. W przypadku generatorów obrazów, takich jak Midjourney, pojawiają się też kwestie autorstwa i praw autorskich, które mogą wprowadzić pewne ryzyko.

Jak pozyskujecie i analizujecie dane potrzebne do szkolenia i doskonalenia waszych systemów sztucznej inteligencji?

Dane do wszystkich modeli są generowane przez naszych użytkowników. Posiadamy ponad 100 milionów użytkowników w ponad 500 miastach na całym świecie i generują oni ogromne ilości danych! Więc to prawie nigdy nie stanowi problemu. Ważniejsze pytanie brzmi, jakie dane są przydatne i jak je zidentyfikować? W osiągnięciu tego celu pomaga nam ponad 200 Data Analysts i Data Scientists w firmie Bolt, którzy tworzą część analityczną na potrzeby biznesowe i produktowe, a także dla Software Engineers i Machine Learning Engineers, którzy korzystają z tych danych do doskonalenia swoich systemów i modeli.

W przypadku modeli uczenia maszynowego mamy rozbudowane systemy monitorowania i oceny, które pozwalają wykrywać błędy, zmiany w danych, degradację modelu oraz błędy w procesie szkolenia i produkcji. Ponieważ większość naszych modeli jest regularnie szkolona automatycznie, cały cykl życia modelu musi być zautomatyzowany. Każdy Data Scientist czy Machine Learning Engineer jest odpowiedzialny za tworzenie i utrzymanie cyklu szkolenia.

Czy twój zespół ds. sztucznej inteligencji jest zróżnicowany pod względem umiejętności? Jakie role są najważniejsze?

Dział ds. danych i uczenia maszynowego w Bolt rozpoczął działalność w 2018 roku z wysoko wykwalifikowanymi specjalistami o szerokim zakresie umiejętności, którzy potrafili swobodnie poruszać się w różnych dziedzinach. Ci specjaliści są w stanie przejąć niejasne opisy problemów i wdrożyć stosowne rozwiązania. Kiedy początkowe prototypy zaczęły stawać się podstawowymi funkcjami produktu i zaczęły był skalowane na różnych rynkach, wzrosła ich złożoność. Wraz z rozwojem rosła też potrzeba utrzymania i stopniowego doskonalenia naszych rozwiązań.

Obecnie w zespole posiadamy zarówno osoby o ogólnych umiejętnościach oraz inżynierów mocno wyspecjalizowanych w dziedzinach takich jak przetwarzanie obrazów i języka naturalnego, architektura danych, przewidywanie szeregów czasowych, ekonomia, badania operacyjne i eksperymenty. Jednak choćby przy obecnym zapotrzebowaniu na specjalistów, najbardziej doświadczeni członkowie zespołu technicznego zwykle mają szeroką wiedzę z rozmaitych obszarów i są w stanie kontrybuować na każdym etapie powstawania produktu.

W jaki sposób sztuczna inteligencja pomaga w lepszym zrozumieniu potrzeb i zachowań klientów na podstawie dostępnych danych?

Pierwszą rzeczą, jaką wiele zespołów produktowych robi, jest ustanowienie warstwy analitycznej, aby zrozumieć, jak podejść do swoich problemów i jak mierzyć najważniejsze wskaźniki. Wymaga to ekspertyzy w danej dziedzinie i ścisłej współpracy z liderami biznesowymi i produktowymi. Zrozumiawszy daną dziedzinę można rozpocząć bardziej zaawansowane modelowanie dzięki regresji liniowej, drzew decyzyjnych, wnioskowania przyczynowego i symulacji. Wymaga to głębszego i intuicyjnego zrozumienia, jak te metody działają. jeżeli nie jesteś w stanie wytłumaczyć, jak doszedłeś do swoich wniosków, poza faktem, iż użyłeś obiecującego modelu “X”, ludzie gwałtownie oznaczą go jako tzw. czarna skrzynka (eng. black box= skomplikowane, zamknięte oprogramowanie).

Zawsze, gdy przyglądałem się przypadkom, w których analityk lub interesariusz biznesowy mówił mi, iż nie mogę ufać jakiemuś wnioskowi lub systemowi, ponieważ to czarna skrzynka, zawsze okazywało się, iż wyjaśnienie nie było wystarczające lub kontekst nie został dostatecznie wytłumaczony. Oczywiście są przypadki, w których wyniki są trudne do interpretacji, ale częściej chodzi po prostu o jakość ich wyjaśnienia.

Jakie są twoje przemyślenia na temat roli i odpowiedzialności analityków danych w kształtowaniu przyszłych zastosowań sztucznej inteligencji?

Rola Data Scientists jest dość unikalna, ponieważ wiele razy to właśnie on/ona może być jedyną osobą w zespole, która dostatecznie dobrze rozumie jednocześnie dane, rozwiązanie i zastosowanie, aby odpowiednio zmierzyć wpływ biznesowy i potencjalne ryzyko. Wymaga to głębszej intuicji w zastosowaniu tych metod i umiejętności wczucia się w sytuację użytkownika końcowego.

Data Scientists projektują te algorytmy, dzięki czemu mogą wpływać na kwestie takie jak tendencyjność, nieprzewidziane konsekwencje czy wydajność. Z jednej strony daje to dużą kontrolę i wolność, ale może także nakładać na nich dużą odpowiedzialność. Z mojego doświadczenia Data Scientists, z którymi miałem przyjemność współpracować, byli ostrożni i odpowiedzialni w kwestiach prywatności, uczciwości i tendencyjności. Może choćby bardziej niż ich koledzy, ponieważ czują ciężar odpowiedzialności na swoich barkach.

Najlepsze rezultaty osiągane są jednak wtedy, gdy biznes, produkt, Data Scientists i dział prawny współpracują, tworząc wspólne zrozumienie ryzyka i potencjalnych rozwiązań.

Czy uważasz, iż sztuczna inteligencja ma potencjał do przekształcenia Twojej branży? jeżeli tak, to w jaki sposób?

Zdecydowanie tak! jeżeli się nad tym zastanowić, to usługi przewozu osób zaczęły się rozwijać w naszych miastach zaledwie 10 lat temu. To nie byłoby możliwe bez takich usług jak Google Maps, które przewidują czasy przyjazdu i trasy. Dziś, gdy korzystasz z usługi Bolt, podczas jednej podróży dokonuje się niemal 200 prognoz modeli uczenia maszynowego.

Od tamtego czasu postęp w technologii, w tym w uczeniu maszynowym i sztucznej inteligencji, znacznie obniżył koszty tej usługi, co oznacza, iż usługi transportu współdzielonego są dostępne dla wszystkich mieszkańca miasta.

Hulajnogi elektryczne, dostawa jedzenia i produktów spożywczych oraz krótkoterminowy wynajem samochodów, które Bolt oferuje w setkach miast na całym świecie, wymagają automatyzacji na dużą skalę, która nie byłaby możliwa bez sztucznej inteligencji. Jednak w stosunku do samochodów prywatnych, które stoją nieużywane przez 95% czasu, usługi transportu na żądanie stanowią wciąż tylko ułamek wszystkich podróży w mieście.

Przed nami więc jeszcze długa droga, a dalsza automatyzacja i optymalizacja odgrywają tu kluczową rolę.

Jeśli doceniasz to co robię i chcesz wesprzeć moje działania - to chodźmy na wirtualną kawkę. Dzięki za każde wsparcie! - https://bit.ly/wirtualnakawa ☕

Idź do oryginalnego materiału