Jak generatywna sztuczna inteligencja może naprawić Siri, Alexę i, miejmy nadzieję, także Asystenta Google

cyberfeed.pl 1 miesiąc temu


Asystenci głosowi niosą ze sobą wiele obietnic, ale od ponad dekady, odkąd Siri firmy Apple i Alexa firmy Amazon po raz pierwszy wkradły się do naszego życia, ich najbardziej fascynującym zastosowaniem wciąż jest ustawianie timerów. Konkurencja ze strony Asystenta Google (i jeżeli mamy być charytatywni, Bixby Samsunga) nie rozpaliła iskry innowacji w tej przestrzeni i pod wieloma względami kontrola głosowa uległa regresowi. Asystenci ci regularnie źle rozumieją, źle słyszą, a czasem po prostu w ogóle nie słuchają. Daleko im do proaktywnych, a adekwatnie inteligentnych asystentów cyfrowych, za jakich pierwotnie uważano.

Wprowadź generatywną sztuczną inteligencję: technologia, którą asystenci głosowi muszą przekształcić z nowatorskiej w niezbędną. W tym tygodniu na światowej konferencji programistów Apple ogłosił plany napełnić go długo zaniedbywany asystent z pojawiającą się technologią, zapewniając Siri dwie najważniejsze umiejętności: kontekst i rozmowę. To przepis na dotrzymanie pierwotnej obietnicy lub przynajmniej zbliżenie nas do siebie.

Apple twierdzi, iż tak Inteligencja Apple przyniesie Siri „zupełnie nowe supermoce” wynikające z lepszego zrozumienia języka, świadomości kontekstu osobistego i możliwości podejmowania działań w aplikacjach na telefonie.

Tam, gdzie obecna Siri potrzebuje wyraźnych instrukcji, co i jak zrobić, Apple obiecuje, iż w nowej wersji będziesz mógł powiedzieć coś w stylu: „Siri, o której wyląduje samolot mamy?” a asystent będzie wiedział, jak przejrzeć Twoją pocztę i wiadomości i wyciągnąć informacje. Możesz wtedy zapytać: „Jak długo zajmie mi dotarcie tam?” i powinien wiedzieć, iż masz na myśli lotnisko, i wyświetlić trasę oraz ETA dzięki Map.

Te pozornie drobne ulepszenia rozwiązują podstawowe problemy asystentów głosowych

Nie będziesz także musiał precyzyjnie formułować poleceń. Zamiast mówić: „Siri, ustaw minutnik na 10 minut”, powinieneś być w stanie wypowiedzieć zdanie w stylu: „Siri, ustaw alarm na… och, czekaj, nie, ustaw minutnik na 10 minut. adekwatnie, zrób to 5”, a asystent zrobi to dobrze.

Te pozornie drobne ulepszenia rozwiązują niektóre podstawowe problemy asystentów głosowych — niewystarczające zrozumienie Ciebie i wymaganie od Ciebie mówienia w nienaturalnie precyzyjny sposób, aby skłonić ich do zrobienia czegokolwiek — które zamieniły te obiecujące elementy technologii w kilka więcej niż wychwalane budziki.

Siri, Alexa i in. są już sztucznie inteligentnymi asystentami głosowymi: maszynami naśladującymi inteligencję ludzką poprzez połączenie programowania poleceń i reagowania nauczanie maszynowe. Jednak dzięki mocy generatywnej sztucznej inteligencji i LLM asystenci głosowi mogliby mieć możliwość generowania odpowiedzi na podstawie tego, czego się nauczyli, a nie tylko reagowania na podstawie istniejącej wiedzy.

Powinno to zapewnić narzędzia umożliwiające stworzenie bardziej konwersacyjnego i inteligentniejszego asystenta głosowego, który może być znacznie bardziej przydatny niż te, które mamy dzisiaj. Ale wszystko, co widzieliśmy do tej pory, to demonstracje tego potencjału; nic takiego nie istnieje jeszcze w prawdziwym życiu.

Zwiększanie inteligencji asystentów głosowych nie jest tak proste, jak poddanie Siri i Alexie lobotomii w stylu ChatGPT

Dzieje się tak dlatego, iż stworzenie superinteligentnego asystenta głosowego jest ogromnym wyzwaniem i ma równie ogromne potencjalne konsekwencje, jeżeli zostanie on źle wykonany. Nie jest to też tak proste, jak poddanie Siri i Alexie lobotomii w stylu ChatGPT.

Asystenci głosowi, szczególnie ci podłączeni do urządzeń i usług w naszych telefonach i domach, to inna bestia niż chatbot w przeglądarce. Mają możliwość podejmowania działań w prawdziwym świecie: kontrolowania naszych termostatów i świateł oraz wysyłania e-maili i wiadomości. Nie jest to miejsce, w którym chcesz mieć kontrolę nad potencjalnie halucynacyjną sztuczną inteligencją, ale to wyjaśnia, dlaczego Apple to zrobił starannie piaskownica jego integracja ChatGPT z Siri.

Amazon pracuje również nad nowy i ulepszony asystent głosowyi podczas gdy twierdzi firma Jak wynika z raportu firmy, jej już zintegrowano generatywną sztuczną inteligencję z komponentami Alexy Fortuna, nowa Alexa nie jest choćby bliska gotowości.

Firma ogłosiła „zupełnie nowa, inteligentniejsza i bardziej konwersacyjna Alexa” zasilany nowym Alexa LLC ostatniej jesieni z imponująca demonstracja. Reklamował Alexę, która powinna rozumieć zwroty konwersacyjne w celu bardziej przypominających ludzkie interakcje, skuteczniej interpretować kontekst i wykonywać wiele żądań dzięki jednego polecenia – na przykład „Alexa, zadzwoń do mamy, włącz światła w salonie i zamknij drzwi wejściowe”.

Ale od tego czasu nie widzieliśmy żadnych oznak tej supermocnej Alexy, a jedynie niejasne zapewnienia, iż ​​jest ona dostępna w ograniczonej wersji zapoznawczej. Może to być spowodowane tym, iż według Fortunafirma jest próbuje połączyć starą Alexę i jego możliwości wraz z wizją asystenta głosowego nowej generacji.

Podobnie Apple stosuje powolne i stałe podejście. Nowa Siri zostanie wypuszczona na rynek dopiero jesienią i choćby wtedy będzie oznaczona jako wersja beta. Na początku nie będzie na niego miejsca w inteligentnym domu: nie jest obsługiwany na żadnym domowym urządzeniu Apple z funkcją przesyłania głosu, takim jak inteligentne głośniki HomePod i Apple TV. Nie pojawi się ona jeszcze na Apple Watch.

Nowa Siri nie jest obsługiwana na żadnym domowym urządzeniu Apple z funkcją przesyłania głosu, takim jak HomePods i Apple TV

Chociaż te urządzenia prawdopodobnie nie mają wystarczającej mocy obliczeniowej, aby uruchomić modele generatywne, z których wiele Apple chce działać lokalnie ze względu na prywatność, wydaje się to dużą luką. Inteligentny dom to kluczowa przestrzeń dla bardziej inteligentnego asystenta głosowego. Nie tylko może pomóc połączyć przestrzeń osobistą z domową, ale może znacznie ułatwić prowadzenie inteligentnego domu.

Były szef działu urządzeń i usług Amazon, Dave Limp, powiedział mi w zeszłym roku, iż budowana przez nich nowa Alexa LLM przeszkolony w zakresie setek inteligentnych interfejsów API domu. Może to zapewnić Alexie kontekst potrzebny do proaktywnego zarządzania inteligentnymi urządzeniami domowymi, takimi jak światła, zamki, termostaty itp., ułatwiając ich konfigurację i obsługę, a także umożliwiając wydawanie poleceń takich jak: „Alexa, tu jest ciemno i jestem zimno”, a asystent głosowy będzie wiedział, co robić.

W przeciwieństwie do Apple, Amazon powiedział, iż nowa Alexa będzie dostępna we wszystkich inteligentnych głośnikach Echo, w tym w pierwszym Echo wydanym w 2014 roku. (Może to zrobić poprzez przeniesienie przetwarzania do chmury). Chociaż, ponieważ HomePod Mini jest ma już cztery lata i przypuszczam, iż niedługo zobaczymy nowy model ze zaktualizowanym sprzętem zaprojektowanym dla sztucznej inteligencji. Apple nie może sobie pozwolić na dalsze oddawanie domu Alexie.

Nowa Siri nie działa na HomePod Mini, co oznacza, iż ​​być może w drodze pojawi się nowe Mini.Zdjęcie: Jennifer Pattison Tuohy / The Verge

Chociaż scena jest przygotowana na drugie przyjście asystenta głosowego, przed nami jeszcze długa droga, zanim zobaczymy akt 1. Możliwe jest również, iż serial rozpocznie się od zupełnie nowych postaci, jeżeli firmy te nie znajdą sposobu na skuteczne budować nową technologię na fundamentach starej.

Całkiem możliwe, iż Google wypuści zupełnie nowego asystenta głosowego

Wydaje się, iż taką drogą podąża Google. Asystent głosowy Asystenta Google nie przeszedł jeszcze gruntownej modernizacji sztucznej inteligencji, a firma podobno włożyła wszystkie swoje zasoby w nowy, oparty na sztucznej inteligencji Asystent Bliźniąt. Chociaż symbioza wydaje się naturalnym posunięciem, biorąc pod uwagę skłonność Google do porzucania starego, jest całkiem możliwe, iż firma wprowadzi na rynek zupełnie nowego asystenta głosowego zbudowanego od podstaw w oparciu o generatywną sztuczną inteligencję.

Niezależnie od tego, gdzie się znajdą, obietnice związane z inteligentnymi asystentami głosowymi są ekscytujące, szczególnie dla każdej firmy, która może skutecznie połączyć osobistego asystenta z domem. Wyobraź sobie, iż Twój HomePod mógłby powitać Cię w domu spersonalizowanymi aktualizacjami, poinformować Cię, iż musisz wyjść do szkoły swojej córki 15 minut wcześniej ze względu na korki i naładować pojazd elektryczny o wystarczającym zasięgu, aby dotrzeć tam przed wyjściem z domu drzwi. To znacznie bardziej odpowiada temu, co nam obiecano — i jest o wiele mądrzejsze niż ustawianie timera.



Source link

Idź do oryginalnego materiału