„Rozumujące” modele AI w ostatnich miesiącach znalazły się w centrum uwagi świata sztucznej inteligencji. Zaczęło się od modelu o1, którego wczesną wersję OpenAI udostępnił we wrześniu. Potem pojawiły się modele od chińskich badaczy, a w grudniu pełna wersja o1. Teraz dostaliśmy „rozumujący” model AI od Google i to całkiem za darmo — przynajmniej na razie. Ma to o tyle znaczenie, iż OpenAI za dostęp do o1 każe sobie słono płacić.
„Rozumującego” modelu językowego AI próżno jednak szukać na stronie chatbota Gemini. By się do niego dostać, musimy przejść na stronę Google AI Studio, z której zwykle korzystają pasjonaci AI chcący wypróbować nowe technologie od Google. Tam znajdziemy go pod nazwą Gemini 2.0 Flash Thinking Experimental 01-21.
Rozumujący model AI od Google – Gemini 2.0 Flash Thinking Experimental
Co więc dostajemy pod postacią modelu Flash Thinking? Przede wszystkim lepsze zdolności rozumowania niż w przypadku tradycyjnych modeli Gemini:
Są to również wartości zbliżone do tych osiąganych przez model o1 od OpenAI — tylko w przypadku testu AIME2024, badającego zaawansowane umiejętności matematyczne, wynik o1 jest o ładnych parę punktów wyższy niż w przypadku Flash-Thinking. Dla pozostałych testów te różnice są nieznaczne.
Model od Google ma jednak dwie zasadnicze — oprócz ceny — przewagi nad o1. Po pierwsze jest szybszy, po drugie ma aż pięciokrotnie większe tzw. okno kontekstowe — a więc ilość tekstu, jaki model jest w stanie przetworzyć jednorazowo. W przypadku Flash-Thinking jest to aż 1 milion tokenów, a więc setki stron dokumentów. To wystarczy, by dać modelowi do przemyślenia wiele artykułów naukowych.
Dan Mac, badacz AI, postanowił sprawdzić umiejętności modelu na zestawie tekstów religijnych i filozoficznych, prosząc model o nowatorskie wnioski. „To, co otrzymałem, było całkiem niesamowite” – napisał. Według Maca model jest około 4x szybszy od o1.
Wszystko to dostajemy za darmo, ale nie wiadomo na jak długo. Model ma być dostępny bez opłat tylko na czas testów beta. Na używanie go, podobnie jak ma to miejsce w przypadku innych darmowych modeli AI, nałożone są ograniczenia ilościowe.
Nie przegap najważniejszych trendów w technologiach!
Zarejestruj się, by otrzymywać nasz newsletter!
Kłopot dla OpenAI?
Pojawienie się nowego modelu od Google może być nie lada problemem dla OpenAI. Firma daje dostęp do swojego o1 przez subskrypcję ChatGPT Pro za pokaźną sumę 200 dolarów za miesiąc i… dokłada do interesu, bo użytkownicy korzystają z modelu częściej niż zakładała.
Teraz może mieć inny problem. Klienci mogą zacząć odpływać. Kto chciałby się rozstać z 200 dolarami miesięcznie jeżeli (z grubsza) to samo może dostać za darmo?
Oczywiście kiedyś Google przestanie dotować klientów darmowym dostępem do swojego Flash Thinking, ale różnice w prędkości dwóch konkurujących ze sobą modeli mogą świadczyć o tym, iż model od Google jest po prostu efektywniejszy obliczeniowo. Czytaj: tańszy w wykorzystaniu. A to by oznaczało, iż Google może poprosić za niego, powiedzmy, 100 dolarów miesięcznie i nie dopłacać do interesu. Różnica w benchmarkach nie jest raczej na tyle duża, by skłonić klientów do zapłacenia 2x więcej.
I kilka tutaj zmienią zapowiadane modele o3 od OpenAI. Jak już o tym pisałem, są one rzędy wielkości droższe w użytkowaniu niż modele o1. A więc subskrypcje na nie kosztować będą raczej tysiące dolarów i będą one wykorzystywane tylko w bardzo wąskich dziedzinach.
Źródło grafiki: Sztuczna inteligencja, model Dall-E 3