
AI zmierzyła się z najbardziej utalentowanymi nastolatkami świata. Co interesujące wyszła z tego starcia z medalem.
Tegoroczna Międzynarodowa Olimpiada Matematyczna (IMO) stała się areną niecodziennego pojedynku między ludzką pomysłowością a mocą modeli AI od Google DeepMind i OpenAI. Wyniki zaskoczyły niejednego obserwatora.
Modele AI na podium olimpiady
IMO to konkurs, w którym wyselekcjonowani uczniowie z całego świata rozwiązują 6 wyjątkowo trudnych zadań w 2 sesjach trwających po 4,5 godz. Tym razem na liście uczestników pojawiły się także 3 zaawansowane modele AI – jeden opracowany przez Google DeepMind, a drugi przez OpenAI.
Wyniki są zaskakujące. Oba systemy perfekcyjnie poradziły sobie z pięcioma z sześciu zadań, zdobywając 35 na 42 możliwe punkty. Jest to rezultat na poziomie złotego medalu. W gronie 630 młodych ludzi biorących udział w konkursie podobnym osiągnięciem mogło się pochwalić jedynie 67 z nich.
Kontrowersje wokół ogłoszenia wyników
Jak czytamy na łamach Gizmodo, oficjalne ogłoszenie sukcesu DeepMind nastąpiło zgodnie ze wszystkimi procedurami, czyli po publikacji wyników uczestników przez organizatorów. Inaczej postąpiło jednak OpenAI. Firma formalnie nie brała udziału w olimpiadzie, a jedynie rozwiązała dostępne zadania. Pochwaliła się swoim wynikiem jeszcze przed oficjalnym terminem publikacji rezultatów.
Co istotne, IMO prosiło firmy o uszanowanie uczniów i powstrzymanie się od ogłoszeń przed czasem, ale OpenAI postanowiło zrobić inaczej. Wywołało to krytyczne komentarze w środowisku edukacyjnym i naukowym.
Jak wyglądał test i jakie modele brały udział?
Zarówno uczniowie, jak i modele mieli takie same warunki, czyli brak dostępu do internetu, brak zewnętrznych narzędzi, 4,5 godz. na każdą turę. Co ciekawe, oba wykorzystane przez firmy systemy AI to rozwiązania ogólnego przeznaczenia, a nie wyspecjalizowane narzędzia matematyczne.
Sukces algorytmów nie pozostało dowodem na to, iż AI już dziś może w szerszym kontekście konkurować z najlepszymi umysłami świata. Modele użyte przez DeepMind i OpenAI nie są dostępne publicznie, a różnica pomiędzy nimi a tym, co mają do dyspozycji użytkownicy, może budzić pytania o możliwości skalowania technologii. Rezultat jest jednak kolejnym dowodem na to, iż AI coraz lepiej radzi sobie z rozumowaniem i ze złożonymi problemami logicznymi.
*Źródło zdjęcia wprowadzającego: Andrew Angelov / Shutterstock