OpenAI wprowadza GPT-5-Codex – specjalną wersję swojego modelu do programowania, zdolną samodzielnie pracować nad kodem od kilku minut, choćby do wielu godzin, z wyraźnie lepszymi wynikami w testach.
OpenAI zaprezentowało GPT-5-Codex, nową generację agenta AI do programowania. To specjalnie dostosowana wersja GPT-5, która ma usprawnić proces tworzenia i refaktoryzacji kodu, a także wspierać programistów w pracy nad dużymi repozytoriami. Według informacji opublikowanych na oficjalnym blogu OpenAI i w serwisach branżowych, model wyróżnia się unikalną zdolnością do dynamicznego zarządzania czasem potrzebnym na rozwiązanie zadania. O ile wcześniejsze modele działały według z góry określonego schematu, GPT-5-Codex potrafi dostosować długość pracy w zależności od złożoności problemu – w testach zdarzało się, iż samodzielnie pracował nad zadaniem choćby ponad siedem godzin.
Nowy model uzyskuje lepsze wyniki w benchmarkach takich jak SWE-bench Verified, które mierzą umiejętności autonomicznego kodowania i wprowadzania poprawek do istniejących projektów. OpenAI podkreśla również, iż GPT-5-Codex znacząco poprawia proces przeglądów kodu. W testach przeprowadzonych z udziałem doświadczonych inżynierów model generował mniej błędnych uwag, a częściej wskazywał te istotne z perspektywy rozwoju oprogramowania.

GPT-5-Codex został już wdrożony do środowisk, w których dotychczas działał Codex – dostępny jest z poziomu terminala, rozszerzeń IDE, GitHuba, a także w ChatGPT dla użytkowników planów Plus, Pro, Business, Edu i Enterprise. OpenAI zapowiedziało, iż w kolejnych miesiącach model zostanie udostępniony także w ramach API, co pozwoli deweloperom włączać jego funkcje bezpośrednio do własnych narzędzi i procesów.
Firma określa GPT-5-Codex jako krok w stronę bardziej autonomicznych agentów AI, które w przyszłości mają odciążyć programistów od żmudnych zadań i umożliwić im skupienie się na projektowaniu rozwiązań, a nie tylko na pisaniu kodu. Choć OpenAI unika jednoznacznych deklaracji co do „rekordowych” wyników, to z dostępnych danych wynika, iż nowy model wyraźnie podnosi poprzeczkę w dziedzinie sztucznej inteligencji wspierającej rozwój oprogramowania.