OpenAI udostępnia GPT-5.2. Jest dziwnie

konto.spidersweb.pl 3 godzin temu

OpenAI wcisnęło przycisk „Publikuj”, choć GPT-5.2 nie jest żadnym spektakularnym przełomem. To raczej próba zatrzymania użytkowników, zanim odpłyną do Google’a.

Najwidoczniej ogłoszony przez Sama Altmana „kod czerwony” zaczął przeradzać się w czyny. Bo niecały miesiąc po premierze GPT-5.1, OpenAI raczy świat modelem GPT-5.2, który ma ratować honor ChataGPT po sukcesie Gemini 3.

Najnowsza seria modeli i ma być – jak zapewnia firma – najbardziej kompetentną propozycją do pracy zawodowej. W tym programowania, analizy dokumentów, tworzenia prezentacji czy wieloetapowych projektów.

Najnowszy GPT-5.2 jest jak plaster na krwawiącą ranę. W sumie to całkiem ładny plaster

GPT-5.2 to największy dotąd skok w ramach piątej generacji modeli. Warianty Thinking i Pro są zorientowane na generowanie „rozwiniętych sekwencji rozumowania”, podczas gdy Instant obsługuje szybsze zadania. Wszystkie trzy korzystają z okna kontekstowego sięgającego 400 tys. tokenów – wysyłane im prompty (instrukcje tekstowe) mogą oprócz długich wiadomości zawierać także liczne dokumenty. Zakktualizowano także zbiór wiedzy o świecie – GPT-5.2 wie o wszystkim co działo się na świecie przed 31 sierpnia 2025 r. W API GPT-5.2 kosztuje 1,75 dol. za milion tokenów wejściowych, czyli o 40 proc. więcej niż GPT-5.1.

OpenAI mocno akcentuje wydajność nowej wersji. Firma deklaruje, iż GPT-5.2 Thinking wyręcza lub dorównuje „ludzkim profesjonalistom” w 70,9 proc. zadań w benchmarku GDPval obejmującym zadania typowe dla 44 zawodów – od programistów i prawników po dyplomowane pielęgniarki i inżynierów mechaników. To istotny wzrost względem Gemini 3 Pro, ocenionego w tym samym benchmarku na 53,3 proc. W testach inżynierii systemu SWE-Bench Pro model osiągnął 55,6 proc., wyprzedzając zarówno Geminiego 3 Pro, jak i Claude’a Opus 4.5. W zadaniach naukowych GPQA Diamond uzyskał 92,4 proc., minimalnie wyżej niż Google. Jak relacjonuje serwis VentureBeat, podczas spotkania z mediami OpenAI chętnie chwaliło się wyższością GPT-5.2 nad Gemini, ale na swojej stronie nie zamieściło żadnych bezpośrednich porównań z Gemini 3. Zamiast tego firma skupiła się na narracji „ulepszeń względem GPT-5.1”.

Tabela z materiałów prasowych z benchmarkami GPT-5.2 – w oficjalnym poście na blogu OpenAI znajdziemy tylko dwie pierwsze kolumny; źródło: VentureBeat

Równocześnie model ma generować o 38 proc. mniej konfabulacji niż GPT-5.1. Mimo to firma nie obiecuje cudów: Altman przyznał, iż GPT-5.2 wciąż nie umie np. tworzyć w pełni dopracowanych plików bez nadzoru człowieka.

W praktyce 5.2 ma być przede wszystkim narzędziem pracy. OpenAI twierdzi, iż użytkownicy biznesowi są w stanie zaoszczędzić choćby 40-60 minut dziennie dzięki usprawnieniom wprowadzonym do nowej iteracji modelu. Potwierdzać mają to doświadczenia pracowników Shopify czy Zoom – firm, którym OpenAI udostępniło GPT-5.2 w ramach zamkniętego testu. OpenAI podkreśla też, iż strategicznie była gotowa na tę premierę od dawna – choć decyzja o jej tempie i terminie niewątpliwie została ukształtowana przez agresywny ruch Google’a.

Ostateczna ocena GPT-5.2 będzie jednak zależeć od niezależnych testów. Historia benchmarków pokazała już, iż firmy technologiczne potrafią przedstawić wyniki w najkorzystniejszym dla siebie świetle, a nauka mierzenia zdolności AI wciąż nie nadąża za marketingiem. Na razie nowy model wygląda na stosunkowo skromną aktualizację, która ma uspokoić inwestorów i zatrzymać użytkowników – przynajmniej do kolejnego ruchu Google’a.

Więcej na temat OpenAI:

Idź do oryginalnego materiału