ChatGPT-4o ze świetnym generatorem grafik. To w nim zrobicie perfekcyjne napisy

dailyweb.pl 4 dni temu
Zdjęcie: ChatGPT-4o


OpenAI prezentuje nową funkcję w ChatGPT-4o. Jest nim generator grafik, który prezentuje się naprawdę świetnie!

Nie jest to oczywiście pierwsze narzędzie do generowania grafik od OpenAI. Pierwszym był DALL-E 3, ale nie wypadł on najlepiej na tle konkurencji. Sam Altman widział głosy niezadowolenia użytkowników i postanowił wdrożyć nie tyle samą aktualizację, a wprowadził coś zupełnie nowego. Firma uważa, iż taka możliwość nie powinna mieć oddzielnej aplikacji, a być funkcją w podstawowym chatbocie. Czyli: zaraz obok „dialogu” z ChatGPT każdy powinien móc zadać takiego prompta, aby system stworzył grafikę, jaka urodziła się w naszej wyobraźni.

ChatGPT-4o umożliwia tworzenie grafik

ChatGPT-4o ma teraz nową funkcję, która to umożliwi. Wystarczy, iż poprosimy chatbota o wygenerowanie grafiki (tak jak Copilocie i Gemini) lub wybierzemy opcję „Utwórz obraz” w edytorze. Wiadomo – im lepszy prompt – lepsze wyniki, ale to dobry krok w kierunku komfortowej pracy. Ma być dokładniejszy nie tylko od DALL-E 3, ale również od konkurencyjnych generatorów. Korzysta z tego samego silnika, ale różni się pod kątem precyzji i przede wszystkim – ma tworzyć perfekcyjne napisy. To jest bardzo dużym problemem generatorów grafik. Swojego czasu bawiłem się różnymi narzędziami, aby stworzyć podpis w tworzonym pliku. I zwykle efekty nie były zbyt dobre. Pojawiały się literówki, napisy były krzywe i trudno było taki plik opublikować w sieci. Najbliższy ku temu był Copilot. ChatGPT-4o ma sobie z tym radzić o wiele lepiej, a pierwsze przykłady, opublikowane przez OpenAI robią wrażenie. Spójrzmy najpierw na fragment długiego, udostępnionego promptu i jego wynik. Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign. Context: a city street in a random street in Williamsburg, NY with a pole covered entirely by numerous detailed street signs (e.g., street sweeping hours, parking permits required, vehicle classifications, towing rules), including few ridiculous signs at the middle: (paraphrase it to make these legitimate street signs)"Broom Parking for Witches Not Permitted in Zone C" and "Magic Carpet Loading and Unloading Only (15-Minute Limit)" and "Reindeer Parking by Permit Only (Dec 24–25)\n Violators will be placed on Naughty List." The signpost is on the right of a street. Do not repeat signs. Signs must be realistic.

Napisy na grafikach wyglądają świetnie

Trzeba przyznać, iż ChatGPT-4o poradził sobie naprawdę nieźle. Co więcej – dany wynik możemy zmieniać poprzez rozmowę i nasze sugestie, jakie elementy dodać lub usunąć. Chatbot może obsłużyć do 10-20 różnych obiektów. OpenAI przyznaje się do tego, iż wyniki nie zawsze mogą być zadowalające, np. przycinać w nieodpowiednich miejscach grafiki, edycja nie jest dokładna, a napisy mogę być zbyt małe. https://dailyweb.pl/google-przeglad-ai/ Generowanie obrazów przez ChatGPT-4o jest dostępny dla planów Plus, Pro, Team i w Sorze. Niebawem Enterprise i Edu otrzymają taką możliwość. Prawdopodobnie i darmowe plany będą mogły z tego skorzystać, ale pewnie z dziennymi ograniczeniami. Początkowo każdy miał mieć dostęp do nowej funkcji, ale finalnie wprowadzono ograniczenia. Szkoda, bo chętnie bym przetestował, ale liczę na to, iż niedługo się to zmieni. przez cały czas można używać DALL-E 3, ale mam wrażenie, iż są to ostatnie chwile, kiedy to narzędzie będzie dostępne.
Idź do oryginalnego materiału