
OpenAI w końcu udostępnia Oriona – jej ostatni model „nierozumujący”, który zgodnie z zapowiedziami uzyskał nazwę GPT-4.5. Model nie zachwyci nas raczej swoimi benchmarkami, ale kooperacja z nim ma mieć bardziej „ludzkie” oblicze, bo ma większe wyczucie niuansu, w tym emocjonalnego. Nie spodziewajmy się go jednak w darmowej wersji ChatGPT – jak przyznaje prezes OpenAI Sam Altman, jest to „olbrzymi, drogi model”.
Na tę chwilę czekaliśmy długo. Pogłoski o Orionie słyszeliśmy od połowy zeszłego roku, a we wrześniu Sam Altman zdawał się sugerować, iż Orion pojawi się zimą. Wcześniejsze sugestie mówiły o końcu roku, ale później pojawiły się sygnały, iż z najnowszymi dużymi modelami językowymi jest pewien problem – ich wytrenowanie kosztuje krocie a niekoniecznie zachwycają osiągami. OpenAI w końcu zdecydowało się udostępnić Oriona/GPT-4.5, ale robi to bez większej fanfary.
OpenAI udostępnia Oriona – w czym jest on dobry?
Zacznijmy od zalet Oriona. To największy model OpenAI, a przypomnijmy, iż jego poprzednik GPT-4 był kolosem o 1,76 bilionów parametrów. Dodatkowo przez model przepuszczono rekordową ilość danych, w tym również, jak przyznaje spółka, generowanych przez mniejsze modele. Zdaje się to potwierdzać pogłoski, iż do trenowania Oriona wykorzystywano „rozumujący” model o1.
Dzięki swej wielkości i olbrzymiej ilości danych użytych do treningu, ma „szerszą wiedzę i głębsze zrozumienie świata.” Jest również dzięki temu mniej podatny na halucynacje.
Jednak tym, za co OpenAI najbardziej chwali swój nowy model jest inteligencja emocjonalna. Model był specjalnie trenowany by zwiększyć jego sterowalność, zrozumienie niuansu i umiejętność prowadzenia naturalnej rozmowy.
To zaś zwiększyło jego zrozumienie ludzkich intencji i inteligencję emocjonalną, co sprawia, iż jest przydatny w takich obszarach jak poprawa pisania i rozwiązywanie praktycznych problemów. Jak napisał Sam Altman, „to pierwszy model, który sprawia wrażenie rozmowy z myślącą osobą.”
Koniec „scaling laws” dla prostych LLM-ów?
Przy swoich zaletach, GPT-4.5 ma też istotne wady. Po pierwsze jest modelem wręcz absurdalnie drogim. w tej chwili z poziomu ChatGPT jest dostępny tylko dla użytkowników planu Pro za jedyne 200 dolarów miesięcznie. To ma się zmienić w następnych tygodniach, gdy zostanie udostępniony użytkownikom innych planów płatnych.
To, jak bardzo drogi jest to model najlepiej widać w cenniku dostępu programistycznego przez API. GPT-4.5 jest w nim 15-30x droższy niż najczęściej ostatnio używany model GPT-4o i 5-7,5x droższy niż uznawane w tej chwili za zdecydowanie drogie GPT-4 Turbo. To wysoka cena do zapłacenia za zwiększoną inteligencję emocjonalną.
GPT-4.5 nie bez powodu będzie więc ostatnim tradycyjnym LLM-em ze stajni OpenAI. Jeszcze jakiś czas temu zakładano, iż modelom takim wystarczy dodać parametrów i przepuścić przez nie więcej danych, by uzyskać jeszcze inteligentniejszą AI. Teraz okazuje się, iż takie podejście prowadzi do coraz mniejszej poprawy inteligencji przy lawinowo rosnących kosztach.
Jak napisało OpenAI w karcie technicznej modelu, GPT 4.5 nie jest modelem granicznym (frontier model), a więc takim, który znajduje się na granicy tego co umie sztuczna inteligencja.
„Chociaż GPT-4.5 wykazuje zwiększoną wiedzę o świecie, poprawioną zdolność pisania i udoskonaloną osobowość w porównaniu do poprzednich modeli, nie wprowadza nowych przełomowych możliwości w porównaniu do wcześniejszych modeli „rozumujących”, a jego wydajność jest niższa od o1, o3-mini i deep research” – czytamy.
Wygląda więc na to, iż GPT-4.5 pozostanie raczej ciekawostką a nie modelem o szerokich zastosowaniach. Dla większości klientów ulepszona kreatywność i inteligencja emocjonalna nie będą wystarczające do zapłacenia absurdalnie wysokiej ceny za dostęp do modelu. Choć można założyć, iż dotychczasowi użytkownicy planów płatnych ChatGPT chętnie spróbują modelu do zadań kreatywnych. Oni nie będą musieli zapłacić ekstra.
A nam pozostaje czekać na GPT-5, czyli hybrydę LLM-u z modelem rozumującym. Podobno zostały nam tylko trzy miesiące czekania.
Źródło grafiki: OpenAI