OpenAI ogłasza GPT-4.5, swój największy i najbardziej zaawansowany model

ittechblog.pl 8 miesięcy temu

Dzisiaj OpenAI ogłosiło swój nowy model non-reasoning, czyli GPT-4.5. Jest największym i najbardziej kompetentnym modelem do tej pory. Jak sama nazwa wskazuje, został zbudowany na GPT-4o poprzez dalsze skalowanie go podczas procesu wstępnego treningu. OpenAI potwierdziło, iż GPT-4.5 nie jest modelem granicznym, ale jest ich największym LLM, szczycącym się większą wiedzą o świecie, ulepszonymi umiejętnościami pisania i wyrafinowaną osobowością w porównaniu do GPT-4o.

Ale dane benchmarkowe wskazują, iż GPT-4.5 to zaledwie skromna poprawa w stosunku do GPT-4o. W benchmarku SWE-bench Verified, GPT-4.5 osiągnął 38%, wzrost o 2-7% w stosunku do GPT-4o i 30% poniżej głębokich badań OpenAI opartych na O3. Dla porównania, Claude 3.7 Sonnet firmy Anthropic osiągnął najnowocześniejszą wydajność 62,3% w SWE-bench Verified. W teście SimpleQA Accuracy GPT-4.5 uzyskał 62,5%, w porównaniu do 38,2% dla GPT-4o. W teście SimpleQA Hallucination Rate GPT-4.5 uzyskał najniższy wynik spośród wszystkich dużych modeli językowych OpenAI.

Co potrafi GPT-4.5?

Niedawno zespół OpenAI’s Preparedness opracował nowy test porównawczy o nazwie SWE-Lancer , który ocenia wydajność LLM w rzeczywistych zadaniach inżynierii oprogramowania, w tym rozwój funkcji, projektowanie, poprawki błędów i wiele innych. W tym nowym teście porównawczym model GPT-4.5 był w stanie rozwiązać 20% zadań IC SWE i 44% zadań SWE Manager, co stanowi niewielką poprawę w porównaniu z modelem o1 OpenAI. Na podstawie wyników ocen gotowości, Grupa Doradcza ds. Bezpieczeństwa OpenAI sklasyfikowała ten nowy model GPT-4.5 jako “średnio ryzykowny”. Otrzymał również niską ocenę za cyberbezpieczeństwo i autonomię modelu.

Nowy podgląd badań modelu GPT-4.5 jest już dostępny dla użytkowników ChatGPT Pro za pośrednictwem selektora modeli w sieci, na urządzeniach mobilnych i na komputerach stacjonarnych. Obsługuje wyszukiwanie, przesyłanie plików i obrazów oraz funkcje kanwy w ChatGPT. W przyszłości będą obsługiwane funkcje multimodalne, takie jak tryb głosowy, wideo i udostępnianie ekranu. GPT-4.5 będzie dostępny w przyszłym tygodniu dla użytkowników ChatGPT Plus i Teams.

Czytaj też: DeepSeek zablokowany w kolejnym kraju. Powodem obawy dotyczące prywatności

GPT-4.5 jest również dostępny dla wszystkich płatnych deweloperów za pośrednictwem Chat Completions API, Assistants API i Batch API. Obsługuje najważniejsze narzędzia, takie jak wywoływanie funkcji, Structured Outputs, Streaming i komunikaty systemowe.

Idź do oryginalnego materiału