OpenAI zaprezentowało GPT-5.4 z kontekstem do 1 mln tokenów: co wiadomo o nowej wersji i jakie ma przewagi nad GPT-5.2

geopolityka.org 3 dni temu

OpenAI zaprezentowało GPT-5.4 — nowy flagowy model sztucznej inteligencji do zastosowań profesjonalnych. Firma pozycjonuje go jako najbardziej wydajny i efektywny model w swojej ofercie, łączący możliwości rozumowania, programowania i pracy agentowej w jednym rozwiązaniu, informuje geopolityka.org, powołując się na OpenAI.

Model został udostępniony w kilku wersjach: podstawowej GPT-5.4, GPT-5.4 Thinking do zadań wymagających pogłębionego rozumowania oraz GPT-5.4 Pro, ukierunkowanej na wyższą wydajność. W API nowość obsługuje okno kontekstowe do 1 mln tokenów — to najwyższy wynik wśród modeli OpenAI w momencie premiery.

Firma poinformowała również o zwiększeniu efektywności pracy z tokenami. Według tych danych GPT-5.4 potrafi wykonywać zadania, wykorzystując mniej tokenów niż poprzednia wersja. Wdrażanie modelu rusza jednocześnie w kilku produktach OpenAI — ChatGPT, Codex i API. GPT-5.4 Thinking będzie dostępny dla użytkowników Plus, Teams i Pro, natomiast GPT-5.4 Pro — przez API, a także dla klientów ChatGPT Enterprise i Edu.

Jedną z kluczowych cech GPT-5.4 OpenAI nazywa wbudowane możliwości pracy z komputerem. Według firmy jest to pierwszy uniwersalny model OpenAI, który może wchodzić w interakcję z aplikacjami na urządzeniu w imieniu użytkownika. Chodzi o wykonywanie działań w programach, pisanie kodu, a także nawigację w systemie operacyjnym dzięki poleceń klawiatury i myszy.

OpenAI opublikowało także wyniki wewnętrznych i partnerskich testów modelu. W szczególności GPT-5.4, według danych firmy, zajęło pierwsze miejsce w Mercor APEX-Agents — benchmarku oceniającym umiejętności zawodowe w obszarach prawa i finansów. Model osiągnął również najlepsze wyniki w OSWorld-Verified i WebArena Verified, które sprawdzają zdolność AI do pracy z interfejsem komputerowym. W teście GDPval, mierzącym wykonywanie zadań intelektualnych, model uzyskał 83%.

Dyrektor generalny Mercor, Brendan Foody, oświadczył, iż GPT-5.4 skutecznie radzi sobie z długoterminowymi zadaniami, w tym z tworzeniem prezentacji, modeli finansowych i analiz prawnych. Jak podkreślił, model wykazuje wysoką skuteczność przy niższych kosztach.

OpenAI osobno akcentuje ograniczenie liczby błędów. Według danych firmy GPT-5.4 o 33% rzadziej popełnia błędy w pojedynczych stwierdzeniach w porównaniu z GPT-5.2, a ogólna liczba odpowiedzi zawierających błędy spadła o 18%.

Wraz z uruchomieniem modelu OpenAI zaktualizowało API, dodając system Tool Search do pracy z narzędziami. Nowe podejście pozwala modelowi wyszukiwać potrzebne narzędzia podczas realizacji zapytania, zamiast ładować wszystkie ich definicje do systemowego promptu. Firma zaznacza, iż ma to ograniczyć zużycie tokenów i przyspieszyć przetwarzanie zapytań w środowiskach z dużą liczbą narzędzi.

Ponadto OpenAI zaprezentowało nowy system oceny bezpieczeństwa do sprawdzania łańcuchów rozumowania modelu — pośrednich wyjaśnień, które pojawiają się podczas realizacji zadań wieloetapowych. Według wyników badań firmy GPT-5.4 Thinking rzadziej wykazuje oznaki fałszowania takich wyjaśnień, co zdaniem OpenAI może zwiększyć skuteczność monitorowania bezpieczeństwa.

Premiera GPT-5.4 odbywa się w czasie wzmożonej uwagi wobec decyzji OpenAI dotyczących współpracy z Departamentem Obrony USA. Według doniesień po tym firma zetknęła się z odpływem części odbiorców. Na tym tle nowa premiera ma wzmocnić pozycję OpenAI w segmencie profesjonalnych narzędzi i agentowej sztucznej inteligencji.

Przeczytaj także o tym, iż Apple zapowiedziało MacBooka Neo: cena nowości, cechy i specyfikacja.

Idź do oryginalnego materiału