ChatGPT Images 2.0 brzmi na papierze jak rewolucja w generowaniu materiałów graficznych zawierających tekst. Model ma cechować się wysoką dokładnością w odwzorowywaniu choćby najbardziej skomplikowanych znaków, można też np. zamienić pismo komputerowe w odręcznie przygotowane notatki.
ChatGPT Images 2.0 to kolejny etap rozwoju generatywnej AI
OpenAI zaprezentowało kolejną wersję swojego zaawansowanego narzędzia. ChatGPT Images 2.0 posiada jeszcze bardziej rozwinięte umiejętności rozumowania i odwzorowywania. Aktualizacja to podobno coś więcej niż zwykłe zwiększenie limitów, algorytm teraz niejako „myśli” przed startem generowania obrazka. Wcześniej nasze prompty były traktowane po macoszemu i zbyt dosłownie.
Skutek? Narzędzie znacznie lepiej radzi sobie z bardziej złożonymi komendami i zachowuje spójność materiału wyjściowego choćby przy podaniu wielu danych. Udostępnione przez OpenAI materiały to również pokaz niezawodności w przypadku umieszczania tekstu wewnątrz obrazów. Dotychczas stanowiło to problem nie do przeskoczenia dla większości modeli.
ChatGPT Images 2.0 pozwala przy okazji wykorzystać jeden prompt do generowania wielu rodzajów treści (np. plakat, prezentacja, notatki). Dostaliśmy zatem narzędzie, które nie chce zastępować sztuki, ale wyłącznie stanowić użyteczną pomoc w pracy czy pobocznych projektach. To bardzo dobra wiadomość.
Do tego dochodzą ulepszenia pod kątem renderowania tekstu czy struktury samych grafik. AI może zostać zatem wykorzystana do nauki czy przygotowania mockupów, które potem użyjemy przy manualnie realizowanych materiałach graficznych.
OpenAI informuje przy okazji, iż ChatGPT Images 2.0 znacznie lepiej radzi sobie ze znakami występującymi w innych językach. Mowa przede wszystkim o azjatyckich alfabetach, choć lepiej wypadać ma również generowanie polskich czy hiszpańskich znaków.
Źródło tekstu i zdjęcia otwierającego: OpenAI









