Grok zaczyna widzieć

sztucznainteligencjablog.pl 2 miesięcy temu

Od niedawna użytkownicy subskrypcji X Premium mogą skorzystać z ciekawej opcji – asystent sztucznej inteligencji Grok potrafi teraz nie tylko tworzyć obrazy, ale także je interpretować. Dzięki współpracy z xAI, Grok jest w stanie analizować i opisywać obrazy dzięki modelu Grok-2, co sprawia, iż dorównuje konkurentom takim jak ChatGPT czy Gemini.

Jak to działa? Wystarczy kliknąć odpowiedni przycisk przy poście z obrazem w serwisie X i poprosić Groka o opisanie tego, co się na nim znajduje. Można zadawać pytania związane ze zdjęciem lub po prostu zażądać opisu.

Potencjał na przyszłość

Przykłady udostępnione przez Elona Muska pokazują, jak Grok potrafi rozłożyć złożone obrazy na części pierwsze, a także wytłumaczyć na przykład sens dowcipu przedstawionego na obrazku. Choć tłumaczenie żartów często psuje całą zabawę, to pokazuje, iż xAI nie zamierza przestać na obecnym etapie rozwoju i cały czas próbuje dorównać konkurencji.

Czy Grok będzie w stanie w przyszłości analizować nie tylko obrazy, ale również dźwięk czy wideo, jest kwestią otwartą. Interesujące będzie także, jak czatbot poradzi sobie z kwestiami związanymi z prawami autorskimi – czy rozpozna znane postacie, czy marki jak Mario, a może jedynie odniesie się do nich w bardziej ogólnych kategoriach?

Praktyczne zastosowanie?

Właściciel xAI, będący również właścicielem kilku innych firm technologicznych, na przykład Tesla, dostrzega oczywiście możliwości zastosowania tej technologii w swoich innych projektach. Potencjalnie mógłby wesprzeć technologie autonomiczne, takie jak systemy wspomagania kierowcy, czy humanoidalne roboty, które Tesla rozwija od kilku lat.

Idź do oryginalnego materiału