ChatGPT-4 stał się nareszcie multimodalny. Zrobi za nas wszystko?

bithub.pl 1 rok temu

Firma OpenAI wprowadziła właśnie monumentalną aktualizację dla swojego flagowego chatbota, ChatGPT-4. Nowy, ulepszony arsenał funkcjonalności znacząco wzbogaca możliwości algorytmu i umożliwia interakcje z różnego rodzaju plikami (jak PDF), co czyni go de facto modelem multimodalnym. Nowinka zapowiada też nową erę w sektorze sztucznej inteligencji i komunikacji, w której nasz wirtualny asystent przetworzy dla nas nie tylko format tekstowy, ale też obraz i dźwięk.

Nowe szaty ChatGPT-4

ChatGPT-4 to najnowsza wersja systemu firmy z branży technologii przyszłości, OpenAI. Model zdobył świat szturmem umożliwiając masom korzystanie za darmo z własnego wirtualnego asystenta przy pomocy zaledwie internetu i klawiatury telefonu lub komputera. Wersja pierwotna nosiła numer GPT-3, przy czym wersja czwarta została wytrenowana na o wiele większym zasobie informacji, ma nowsze bazy danych i docelowo miała przetwarzać zarówno tekst, jak i obrazy. Do niedawna była to jedynie funkcjonalność beta, w tej chwili jest ona dostępna dla każdej osoby korzystającej z płatnej subskrypcji (ok. 20 dolarów miesięcznie).

Oto pełna, opisowa lista nowych funkcjonalności w najpopularniejszym modelu językowym opartym na uczeniu maszynowym: GPT-4:

Przetwarzanie plików tekstowych i graficznych: Subskrybenci planu ChatGPT Plus mogą teraz korzystać z chatbota do przetwarzania zarówno plików tekstowych, jak i graficznych. Oznacza to, iż użytkownicy mogą przesyłać pliki PDF, grafiki lub inne formaty i zadawać pytania dotyczące ich treści. ChatGPT potrafi analizować zawartość tych plików i udzielać odpowiedzi na pytania użytkowników.

Generowanie obrazów na podstawie przesłanych grafik: W ramach tej aktualizacji ChatGPT Plus pozwala użytkownikom przesłać grafikę i wydać polecenie generowania obrazu na jej podstawie. Użytkownicy mogą także dowolnie modyfikować wygenerowane obrazy, co otwiera nowe możliwości w zakresie tworzenia grafiki i projektowania.

New ChatGPT (All Tools) is INCREDIBLE! 🌟

With the new update, you can upload an image and ask to modify it!

All in 1 prompt, 30 seconds. Goodbye Photoshop?

Thoughts?pic.twitter.com/qjrUARjvdw

— Alex Northstar (@NorthstarBrain) October 29, 2023

Praca z dokumentami, także z wykorzystaniem sieci: Aktualizacja umożliwia chatbotowi obsługę i analizę różnego rodzaju plików, w tym plików PDF. Po krótkim zapoznaniu się z treścią dokumentu, ChatGPT jest w stanie odpowiedzieć na pytania użytkownika dotyczące tego dokumentu. Może także wykonać krótkie streszczenie zawartości pliku. Dla użytkowników planu Plus istnieje również możliwość korzystania z dostępu do internetu, co pozwala chatbotowi np. na znalezienie danych i stworzenie infografiki na ich podstawie.

Automatyczne przełączanie trybów: ChatGPT Plus będzie mógł automatycznie przełączać tryby, dzięki czemu użytkownicy nie będą musieli manualnie określać, w jakim trybie chcą pracować. Na przykład, chatbot sam rozpozna, kiedy należy generować kod w języku programistycznym, a kiedy użyć DALL-E do generowania obrazu.

My thoughts:

'Use Tools without Switching' is going to be a huge unlock.

Having everything in one spot feels like we're one step closer to the all-in-one AI assistant that we're all predicting.

Combining Data analysis with other features is going to be insanely powerful.

— Rowan Cheung (@rowancheung) October 29, 2023

Nowe funkcje bota ChatGPT w wersji Plus znacząco wpływają na przyszłość interakcji z sztuczną inteligencją. Możliwość pracy z plikami, generowania obrazów i automatycznego przełączania trybów sprawia, iż chatbot staje się jeszcze bardziej wszechstronny i przydatny dla użytkowników. Aktualizacja otwiera nową erę i nowy wyścig zbrojeń między pionierami rozwiązań z zakresu sztucznej inteligencji którzy będą starali się zaoferować użytkownikowi jak najlepsze doświadczenia w tym zakresie.

Idź do oryginalnego materiału