AI od Google popularna w grafice i wideo. Z tekstem jest gorzej

homodigital.pl 8 miesięcy temu

Sztuczna inteligencja (AI) od Google świetnie sobie radzi z obrazem i wideo. Z tego powodu jest jedną z najczęściej wybieranych do tych celów. Jednak z tekstem jest gorzej, bo tu niepodzielnie królują OpenAI i Anthropic, a z trzeciego miejsca modele od Google wygryzł DeepSeek. Tak przynajmniej wynika z raportu od Poe AI, agregatora chatbotów.

Czym jest dokładnie Poe AI? Miejscem, platformą, na której można skorzystać z przeszło 100 różnych modeli AI. W tym tych najnowszych i najlepszych, takich jak Claude Sonnet 3.7, o3-mini czy GPT-4.5-Preview.

Korzystanie z platformy jest bezpłatne, choć z ograniczeniami ilościowymi. Osoby chcące w większym zakresie wykorzystać Poe mają możliwość wyboru modelu subskrypcyjnego. Fakt, iż Poe oferuje dostęp za darmo przyciągnął miliony użytkowników. To daje platformie wyjątkowo dobry wgląd w to, z jakich modeli użytkownicy korzystają najczęściej.

A wracając do Google…

AI od Google błyszczy w wideo…

W ostatnich tygodniach najnowszy model wideo od Google, czyli Veo-2, przebojem zdobył użytkowników tego typu modeli. W drugiej połowie lutego jego udział w zapytaniach wideo osiągnął niemal 40%, mimo iż jest dostępny zaledwie od grudnia.

Veo-2 zrzucił z pierwszego miejsca model Runway, który jeszcze w listopadzie był niekwestionowanym liderem z 60% zapytań w kategorii modeli wideo.

Należy jednak odnotować, iż wielkim nieobecnym kategorii wideo jest Sora od OpenAI, która po prostu nie jest dostępna na platformie Poe. Niewykluczone, iż nie pasowała do darmowego modelu oferowanego przez platformę.

… i dobrze sobie radzi w obrazach

Również w obrazach produkt Google, tym razem Imagen-3, radzi sobie bardzo dobrze. Nie jest co prawda liderem rynku, tu najlepiej sobie radzi rodzina modeli FLUX od BlackForestLabs z udziałem w zapytaniach na poziomie przeszło 37%. Jednak niemal 29% procent Imagen budzi szacunek, zwłaszcza, iż produkt Google jest na rynku o wiele krócej.

Bardzo słabe są wyniki niegdysiejszych liderów – Dall-E 3 i wariantów StableDiffusion. Dall-E 3, model od OpenAI, jeszcze w początkach zeszłego roku miał udział w zapytaniach na poziomie niemal 80%, teraz jest to raptem 10%. StableDiffusion spadło z około 40% w II kw. 2024 do niecałych 7% obecnie.

Ta kategoria również ma swojego wielkiego nieobecnego – Midjourney.

Za to w tekście królują OpenAI i Anthropic

Niestety dla Google, tam gdzie mogłoby się wydawać, iż będzie on szczególnie dobry, czyli w tekście, gigant z Mountain View istotnie odstaje od konkurentów. Bardzo duża część biznesu Google jest przecież oparta na tekście. Wyszukujemy najczęściej tekst, AdWords są tekstowe, poczta elektroniczna, gdzie króluje Gmail jest w dużej mierze tekstowa…

Ale liczby mówią same za siebie. Udział różnych modeli od OpenAI to niemal 50%, od Anthropica – prawie 40%. Udział modeli Gemini od Google to raptem 4%, czyli mniej niż 5,5% dla modeli DeepSeeka.

To oczywiście nie oznacza, iż tekstowa AI od Google jest bezużyteczna. Oparty na Gemini NotebookLM jest świetnym narzędziem do analizy wielu tekstów. Dodatki AI do różnych produktów Google również są użyteczne. Ale Gemini jako samodzielne narzędzie nie potrafi zdobyć serc użytkowników.

Nic zresztą dziwnego, jak odnotował niedawno Martin Peers z serwisu The Information, model Google nie daje sobie szczególnie rady z zapytaniami o najnowsze wydarzenia, z czym bez problemu radzą sobie ChatGPT i Grok. A przypomnijmy, iż Google to właściciel najlepszej na świecie wyszukiwarki internetowej i najpopularniejszego agregatora newsów czyli Google News i akurat w takich zadaniach powinien brylować.

Idź do oryginalnego materiału