Najlepsze modele AI – od OpenAI, Google, ale nie tylko

homodigital.pl 5 miesięcy temu

Jakie są najlepsze modele AI? Różne benchmarki dadzą nam różne odpowiedzi. Ale jeżeli chodzi o faktyczną użyteczność modeli, to bodaj najlepszą miarą jest to, z czego faktycznie korzystają ludzie. I jeżeli wierzyć danym z platformy Poe, to o ile w modelach tekstowych dominuje OpenAI i Google, to w modelach graficznych wygląda to inaczej. W narzędziach generujących obrazy i wideo silną pozycję mają mniejsi gracze, tacy jak Black Forest Labs i Runway.

Czym jest Poe? To platforma udostępniająca swoim klientom przeszło sto różnych modeli AI, w tym te najbardziej znane od OpenAI, Google, Anthropica, xAI czy Mety. Ponieważ klienci mogą bez trudu przełączać się między modelami, to dane pokazujące, które modele są najpopularniejsze na tej platformie dają dobry wgląd w preferencje użytkowników AI.

W tekście prowadzi OpenAI, w rozumowaniu – Google

Wśród tradycyjnych tekstowych modeli AI dominuje GPT-4o, model wykorzystywany jako podstawa chatbota ChatGPT. Przeszło jedna trzecia zapytań do tego typu modeli (35,8%) była skierowana do produktu OpenAI.

Nieco mniej zapytań było skierowanych do dwóch modeli Anthropica, niedawnego lidera statystyk od Poe – Claude 3.5 Sonnet i Claude 3.7 Sonnet odpowiadają w sumie za trzy na dziesięć zapytań. To o około 10 puntów procentowych mniej niż jeszcze kilka miesięcy temu, na początku tego roku.

Ten spadek popularności modeli Anthropica nie dziwi. Jeszcze nie tak dawno były one blisko szczytu listy LM Areny, czyli rankingu powstałego z porównania przez użytkowników odpowiedzi anonimowych modeli. w tej chwili najlepszy LLM firmy, czyli Claude 3.7 Sonnet, jest na odległym, 24. miejscu.

Google, choć nie może pochwalić się szczególnymi sukcesami wśród tradycyjnych modeli tekstowych, błyszczy wśród tych „rozumujących”. Niedawny debiutant, czyli Gemini-2.5-Pro, odpowiada za niemal co trzecie zapytanie użytkowników Poe do modeli rozumujących. To istotnie więcej niż Claude 3.7 Sonnet Reasoning (19%), ale i od całej trzódki modeli o1/o3/o4 od OpenAI. To spory sukces Google’a zważywszy na fakt, iż to OpenAI był pionierem modeli rozumujących a pierwsze modele tego typu od firmy z Mountain View nie zachwyciły.

Niezłą pozycję z wynikiem nieco ponad 12% utrzymuje DeepSeek-R1, otwarty model rozumujący od chińskiego labu DeepSeek, który sporo namieszał na rynku na początku tego roku.

Użytkownicy wciąż wolą modele tradycyjne od rozumujących, głównie ze względu na koszt, ale rola tych ostatnich gwałtownie rośnie. Na platformie Poe ich udział w zapytaniach wzrósł z 2% na początku tego roku do 10% obecnie.

W modelach graficznych królują mniejsi, ale Google też mocny

Nieco inną sytuację niż w modelach tekstowych mamy w tych graficznych. Tu o wiele silniejszą pozycję mają mniejsi, mniej słynni gracze rynku AI.

I tak na przykład wśród modeli generujących obrazy modele FLUX od Black Forrest Labs odpowiadają za około 35% zapytań do modeli graficznych. Wyprzedzają więc Image-3 od Google (23,7%) i GPT-Image-1 od OpenAI (16,7%).

Z kolei wśród modeli wideo najpopularniejszy jest Runway, a drugi jest model chińskiego Klinga a dopiero trzeci jest Veo-2 Google’a.

Czy możemy w pełni zaufać rankingom Poe? prawdopodobnie nie do końca. Na przykład zastanawia brak Groka wśród modeli tekstowych. Mimo iż jest dostępny na platformie i ma niezłą 4. pozycję na LM Arenie. Być może użytkownicy wolą korzystać z niego za darmo na platformie X niż zużywać swoje „punkty obliczeniowe” na Poe. Bo każdy plan subskrypcyjny na platformie ma limit punktów do wykorzystania na dzień lub miesiąc.

Z kolei wśród modeli wideo dostępnych na Poe nie znajdziemy bodaj najbardziej z nich znanego – Sory od OpenAI. Niemniej rankingi te wydają się być dość dobrą wskazówką, z jakich modeli najlepiej jest w tej chwili korzystać.

Zapraszamy do komentowania naszych artykułów pod tekstem.

Źródło grafiki: Sztuczna inteligencja, model GPT-4o

Idź do oryginalnego materiału