Google pozwoli AI przejąć przeglądarkę, tak by sztuczna inteligencja wykonała za nas uciążliwe zadania, i to już w grudniu. A Anthropic poszedł jeszcze dalej – jego model może sterować wszystkimi programami na komputerze. Na razie w wersji testowej dla deweloperów, bo funkcjonalność ta jest tylko przez tzw. API.
Google szykuje fanom swojej sztucznej inteligencji sporą dawkę emocji w grudniu. Według doniesień medialnych, mogą się wtedy pokazać nowe wersje jego dużych modeli językowych, czyli Gemini 2.0. Cudów się nie spodziewajcie – postęp będzie raczej stopniowy. Jednak oprócz nowych modeli Gemini podobno czeka nas niespodzianka – możliwość sterowania przeglądarką przez AI.
Google pozwoli AI przejąć przeglądarkę
Jak informuje serwis The Information, nowa funkcjonalność AI, nazwana Jarvis, w reakcji na polecenia użytkownika będzie wykonywać i interpretować zrzuty ekranu, by następnie podjąć działania na stronie internetowej – klikając we właściwym miejscu czy wypełniając formularz.
Według tych doniesień, Jarvis ma pomagać użytkownikowi w rutynowych czynnościach. Są to np.: wyszukiwanie informacji w internecie, robienie zakupów czy rezerwacja lotu. Funkcjonalność ma zostać wstępnie udostępniona w grudniu. Nie jest jasne, czy dla wszystkich chętnych.
Anthropic odda AI władzę nad komputerem
Jeszcze dalej w automatyzacji przy pomocy AI poszedł Anthropic. Parę dni temu ogłosił program publicznych (a więc dostępnych dla wszystkich) testów beta dla nowej funkcjonalności – używania komputera (computer use). Jak na razie funkcjonalność jest skierowana przede wszystkim do deweloperów oprogramowania – dlatego też jest dostępna wyłącznie przez API, a więc interfejs programistyczny. Nic dziwnego – wersja jest testowa i może być czasem „niezgrabna i podatna na błędy.”
Na demo, firma pokazuje jak AI poszukuje informacji potrzebnych do wypełnienia zamówienia, używając różnych programów. Podobnie jak Jarvis, AI od Anthropica będzie używała zrzutów ekranu.
Nowa funkcjonalność w testach niepublicznych najwyraźniej obecna była już od pewnego czasu. Bo, jak twierdzi Anthropic, już teraz jest wykorzystywana przez takie firmy jak twórca narzędzia graficznego Canva czy The Browser Company, deweloper przeglądarki Arc.
Pamiętam jak niemal rok temu nasza koleżanka redakcyjna Sylwia Błach robiła recenzję Copilota w wersji PRE z nadzieją, iż sztuczna inteligencja od OpenAI/Microsoftu pomoże jej w obsłudze komputera. Np. uruchomi odpowiednią aplikację, wpisze w niej co trzeba, może coś wyśle… Wtedy te oczekiwania były na wyrost. Wydaje się, iż teraz zbliża się moment, kiedy komputer będzie mógł obsługiwać komputer niemal jak człowiek.
Źródło grafiki: Sztuczna inteligencja, model Dall-E 3