GPT-4o (od łacińskiego omni – wszystko) – nowy, lepszy duży model językowy (LLM) od OpenAI, otworzy nowe możliwości dla użytkowników ChatGPT, również tych korzystających z darmowego konta ChatGPT Free. Nowe narzędzie jest w stanie analizować obrazy, a z czasem będzie mogło z nami pogadać. Na razie jednak będzie dostępny dla wybranych – będzie wprowadzany stopniowo.
Jakie są możliwości GPT4o? jeżeli chodzi o komunikację tekstową w języku angielskim, to model ten oferuje podobne umiejętności jak GPT-4 Turbo, jest jednak dwa razy szybszy. Poszerzone mają być również możliwości modelu jeżeli chodzi o inne języki – na przykład nowy tokenizer (część modelu zamieniająca tekst w reprezentację numeryczną) będzie o wiele wydajniejszy dla języków innych niż angielski.
GPT-4o potrafi również zrozumieć grafikę – może na przykład omówić zawartość wgranego przez użytkownika obrazka. Model jest również wytrenowany do rozumienia i generowania dźwięku i wideo, jednak te funkcje zostaną udostępnione dopiero za kilka tygodni i to, na początek, wąskiemu gronu klientów.
Już teraz klienci mogą sobie porozmawiać ze starszymi modelami przy pomocy głosu, jednak wymaga to użycia aż trzech modeli (głos-do-tekstu, GPT, tekst-do-głosu) i trwa długo – kilka sekund. GPT-4o inkorporuje to wszystko w jednym szybkim modelu i dzięki temu jest w stanie odpowiedzieć średnio w ciągu 320 milisekund (0,3 sekundy). Te umiejętności, kiedy się już szerzej pojawią, mogą stanowić zagrożenie dla wirtualnych asystentów, takich jak Siri od Apple czy Asystenta Google.
Kiedy GPT-4o będzie publiczny?
OpenAI twierdzi, iż zacznie stopniowo udostępniać GPT-4o klientom jego płatnych planów taryfowych Chat GPT Plus i Teams. Model będzie również niedługo dostępny dla użytkowników planu Enterprise. Stopniowe udostępnianie GPT-4o użytkownikom darmowego planu również zacznie się dzisiaj – choć można zakładać, iż tutaj udostępnianie będzie jeszcze bardziej stopniowe niż w planach płatnych. W moim ChatGPT nie ma jeszcze choćby śladu GPT-4o. Możliwy jest już jednak dostęp przez tzw. Playground – dla użytkowników korzystających z API OpenAI.
Kiedy już GPT-4o nadejdzie, niestety nie będzie można z niego korzystać bez ograniczeń. Limity będą dotyczyły wszystkich planów taryfowych. Oczywiście będą najostrzejsze dla planu darmowego, w planie Plus będziemy mieli 5x większy limit niż we Free a użytkownicy Teams i Enterrise będą mieli jeszcze wyższy.
To niejedyne wiadomości od OpenAI. Kiedy już GPT-4o nadejdzie do nas, nie tylko dostaniemy za darmo model o inteligencji GPT-4, będziemy również mogli (również za darmo):
- uzyskać odpowiedzi korzystające z zasobów sieci www;
- analizować dane i tworzyć wykresy;
- wgrać pliki (na przykład po to, by model nam podsumował ich treść);
- korzystać z GPTs – specjalizowanych chatbotów;
- korzystać z pamięci chatbota.
Obecnie te możliwości są dostępne tylko dla płacących klientów.
Prezentację możliwości GPT-4o możecie obejrzeć tutaj.
Oprócz tego, OpenAI udostępnił aplikację ChatGPT na komputery stacjonarne – chwilowo tylko na te od Apple, ale niedługo również pod system Windows.
Swoimi zapowiedziami OpenAI mocno wchodzi w terytorium swoich konkurentów. Udostępnienie za darmo modelu o możliwościach GPT-4 będzie problemem dla firm, które albo nie posiadają tak dobrych modeli, albo oferują je tylko w planach płatnych (jak Google czy Anthropic). Udostępnienie za darmo pełnych możliwości GPT-4o szerszej publiczności może być problemem choćby dla Microsoftu, głównego partnera biznesowego OpenAI, bo Copilot może stracić na atrakcyjności. Jednak dla nas to są same dobre wiadomości – konkurencja jest dobra przede wszystkim dla konsumenta.
Źródło grafiki: OpenAI