
AI sięga po złoto na Międzynarodowej Olimpiadzie Matematycznej (IMO) – najbardziej prestiżowym konkursie dla młodych matematyków. Dwóm modelom, po jednym od Google i OpenAI, udało się rozwiązać pięć z sześciu niezmiernie złożonych zadań z olimpiady. W wyścigu gigantów AI mamy więc na razie remis.
Sztuczna inteligencja idzie wielkimi krokami do przodu. W zeszłym roku AI od Google udało się rozwiązać cztery na sześć zadań z poprzedniej olimpiady matematycznej i osiągnąć w ten sposób status srebrnego medalisty. Wymagało to jednak dwóch specjalizowanych modeli i przetłumaczenia zadania z języka naturalnego na specjalizowany język formalny, którym posługiwały się te modele. W tym roku modele AI nie potrzebowały już ludzkich tłumaczy. Rozwiązywały problemy sformułowane w ten sam sposób, jak dla ludzkich uczestników konkursu.
AI Google sięga po złoto
Nieco bardziej oficjalną drogę postanowił przejść Google. Poprosił przedstawicieli IMO, by dokonali oceny wyników jego AI w taki sam sposób jak robią to dla uczestniczących w konkursie uczniów szkół średnich.
„Potwierdzamy, iż Google DeepMind osiągnęło upragniony kamień milowy, zdobywając 35 z możliwych 42 punktów — wynik na złoty medal. Ich rozwiązania były zadziwiające pod wieloma względami. Zdaniem oceniających IMO były one jasne, precyzyjne i w większości łatwe do zrozumienia” – powiedział prezes IMO Gregor Dolinar.
Co wiemy o modelu AI od Google? Jak pisze firma, jest to zaawansowana wersja Gemini Deep Think, a więc modelu ogłoszonego raptem dwa miesiące temu. Modelu, w którym procesy rozumowania prowadzone są równolegle, co pozwala analizować jednocześnie wiele możliwych wariantów. Rezultat? Już wtedy Google się chwalił, iż model ten wyraźnie wyprzedza konkurencję w programowaniu i bije ją na głowę w trudnych zadaniach matematycznych. Ze względu na duży potencjał Deep Think, miał on być najpierw przetestowany przez wąskie grono zaufanych klientów.
Ta zaawansowana wersja Deep Think została dodatkowo przeszkolona w zakresie nowatorskich technik uczenia się przez wzmacnianie. Chodzi o możliwość wykorzystywania większej ilości danych do wieloetapowego rozumowania, rozwiązywania problemów i dowodzenia twierdzeń. Ten model został również przeszkolony na zbiorze wysokiej jakości rozwiązań problemów matematycznych.
OpenAI też ma złoto. A poza tym… GPT-5 tuż za rogiem
Ten sam poziom – złotego medalu olimpiady – osiągnął również model od OpenAI. Choć tu medal został osiągnięty w nieco mniej sformalizowany sposób. Jak napisał badacz firmy Alexander Wei, praca modelu została oceniona przez trzech byłych medalistów olimpiady, a nie przez samą organizację.
W przypadku OpenAI mamy do czynienia nie z wersją istniejącego modelu, ale z kompletnie osobnym modelem badawczym, który, jak wskazuje Wei, nie zostanie upubliczniony w najbliższych miesiącach.
Jak podał badacz OpenAI, w nowym modelu zastosowano zmodyfikowaną wersję uczenia ze wzmocnieniem. W dotychczasowych modelach rozumujących stosowano technikę RLVR – uczenia ze wzmocnieniem na weryfikowalnych rezultatach. W technice tej modelowi daje się do rozwiązania zadanie z matematyki, programowania czy nauk ścisłych i sprawdza się, czy model podał prawidłową odpowiedź. jeżeli tak, to model dostaje nagrodę, a jeżeli nie, to albo nie dostaje nagrody, albo wręcz dostaje karę.
Przy prostszych zadaniach to się sprawdza, bo komputer łatwo może sprawdzić prawidłowość odpowiedzi, więc proces trenowania można łatwo zautomatyzować. Jednak w przypadku bardzo złożonych zaawansowanych zadań ten system się nie sprawdza – tutaj wymagane było nowe podejście.
„Osiągnęliśmy ten poziom możliwości nie poprzez wąską, specyficzną dla zadania metodologię, ale przełamując nowe bariery w uczeniu się przez wzmacnianie ogólnego przeznaczenia i skalowaniu obliczeń w czasie wnioskowania” – napisał Wei.
A przy okazji informowania o wynikach modelu na IMO, badacz rzucił mimochodem, iż wyczekiwany GPT-5 będzie „wkrótce”.
Wyścig o talent?
Jak odnotowuje Google, w ostatnim okresie IMO stała się aspiracyjnym wyzwaniem dla systemów AI. Główne laby AI chcą pokazać, iż są najlepsze. Nie tylko po to, by przekonać do siebie klientów. Również po to, by przyciągnąć do siebie talenty. I to zwłaszcza w czasie, gdy Meta potrafi wydać 200 mln dolarów, żeby ściągnąć do siebie jednego badacza, a prawdopodobnie miliardy, żeby zbudować zespół superinteligencji.
Jak pisze TechCrunch, „Firmy z branży sztucznej inteligencji zaciekle rywalizują o publiczne postrzeganie bycia liderem w wyścigu AI. To niematerialna bitwa na „wibracje”, która może mieć ogromne konsekwencje dla pozyskiwania najlepszych talentów w dziedzinie sztucznej inteligencji.”
W tym wyścigu na wibracje przodują teraz Google i OpenAI. I może dlatego Meta musi głębiej sięgać do kieszeni.
Źródło grafiki: Sztuczna inteligencja, model Dall-E 3