OpenAI ogłosił kolejną aktualizację ChatGPT! Jeden z najważniejszych graczy na rynku sztucznej inteligencji podnosi poprzeczkę. OpenAI, firma znana z innowacyjnych rozwiązań w dziedzinie AI, wprowadzi na dniach najnowszy update swojego flagowego produktu – ChatGPT. Rozpoznawanie obrazów ma dać użytkownikom ChatGPT jeszcze więcej możliwości. Jakich?
Korporacje technologiczne zdają sobie sprawę z tego, iż choć komputery bardzo gwałtownie zyskują zdolności przypominające ludzkie zmysły, to wciąż lata świetlne dzielą ją od osiągnięcia możliwości ludzkiego mózgu. Największy problem wynika z braku możliwości stworzenia sztucznej inteligencji dysponującej empatią i wrażliwością (choć niektórzy naukowcy uważają, iż i tego można AI nauczyć).
Na razie zaawansowane algorytmy sprawiają, iż sztuczna inteligencja widzi, słyszy, a choćby mówi. Jednym z liderów jest ChatGPT, którego kolejne aktualizacje wytyczają trendy dla branży, choć oczywiście istnieje cały peleton konkurentów, coraz skuteczniej goniących produkt OpenAI (w który zainwestował Microsoft). Jakie zmiany do ChatGPT ogłosił OpenAI tym razem?
Aktualizacja ChatGPT: teraz z botem poczatujesz i pooglądasz
Dotychczas ChatGPT większości z nas kojarzył się z bardzo rozbudowanym chatbotem – aplikacją umożliwiającą zadawanie pytań lub rozmowę w formie tekstowej. Teraz zdolności sztucznej inteligencji od OpenAI będą większe, najnowsza aktualizacja ChatGPT – ma być udostępniona wszystkim użytkownikom w ciągu dwóch tygodni – wprowadzi umiejętność rozpoznawania i interpretacji obrazów, dokumentów tekstowych i screenshotów. Oprócz tego, AI zyska – jak twierdzą jej twórcy – dar rozwiązywania problemów na podstawie przesłanej przez nas grafiki.
Co to znaczy i jakie daje nam potencjalnie możliwości? Możemy na przykład umieścić w aplikacji zdjęcie naszego roweru i poprosić ChatGPT o pomoc w konfiguracji siodełka lub kierownicy. Sztuczna inteligencja rozpozna, iż na zdjęciu jest rower i dołoży wszelkich starań, by ustalić czy wysokość siodełka i ustawienie kierownicy jest odpowiednie. Załóżmy, iż pokażemy ChatGPT nasz telewizor i powiemy, żeby znalazł nam w internecie podobny, ale większy. Czyżby już nie była potrzebna porównywarka cen?
To są relatywnie proste zastosowania. Ale w powiązaniu z bazami danych, do których ChatGPT mógłby otrzymać dostęp (i czas na „trening”) mówimy o poważnych zastosowaniach komercyjnych. Jestem bardzo ciekaw czy nowa funkcja ChatGPT w przyszłości nie zabierze części pracy pośrednikom nieruchomości. Czy na podstawie zdjęcia domu będzie można, korzystając z ChatGPT, uzyskać jego orientacyjną wycenę?
Nowe algorytmy pozwalają podobno nie tylko na rozpoznawanie obiektów. OpenAI zapewnia, iż ChatGPT w nowej wersji potrafi zidentyfikować także miejsca, twarze, a choćby emocje danej osoby na zdjęciu. Czy to oznacza, iż na podstawie zdjęcia będzie w stanie zaproponować sposoby na pocieszenie smutnej osoby? To się okaże, gdy potestujemy nową funkcję po jej finalnym udostępnieniu.
Innym przydatnym na co dzień zastosowaniem może być przesyłanie sztucznej inteligencji zdjęć z zawartością naszej lodówki. Wystarczy, iż dodamy konkretne polecenie (poinformujemy chatbota co ma z tym zdjęciem zrobić) i… może być ciekawie. ChatGPT – jak twierdzą jego twórcy – na podstawie zdjęć owoców, warzyw i innych składników, które uda mu się zidentyfikować, będzie potrafił np. zaproponować kilka przepisów na obiad z zastosowaniem posiadanego przez nas zestawu artykułów.
Co to może oznaczać dla biznesu takich firm jak np. producenci urządzeń typu Thermomix? Dziś to właśnie podawanie przepisów na konkretne dania jest główną przewagą tego typu robotów kuchennych nad kilka razy tańszymi. W sytuacji, gdy ChatGPT może „zobaczyć” naszą lodówkę i rozpoznać co w niej mamy – integracja z prostymi urządzeniami kuchennymi może przynieść dużą zmianę w zastosowaniach robotów. Oczywiście: wszystko zależy od dokładności i niezawodności oceny przedmiotów na zdjęciach. Czy i jak to może działać – przekonamy się wkrótce.
Czytaj też: Sztuczna inteligencja tworzy ubrania! Pierwszy AI Fashion Week już za nami
Oprócz rozpoznawania obrazów AI także mówi i słyszy?
Kolejną nowością wprowadzoną przez Open AI jest możliwość komunikacji z chatbotem dzięki głosu. Nie musimy już wpisywać naszych poleceń do aplikacji, wystarczy nagrać przysłowiową „głosówkę”. ChatGPT od dzisiaj może również odpowiedzieć nam jednym z pięciu dostępnych głosów, stworzonych przy współpracy z profesjonalnymi aktorami.
Zaawansowane systemy przetwarzania mowy TTS (text-to-speech) dostosowują również ton, tempo i styl mowy do kontekstu naszej wypowiedzi. Twórcy innowacyjnej technologii zapewniają też, iż sztuczna inteligencja zdolna jest choćby do analizy emocji wykrytych w naszym głosie.
Aktualizacja ChatGPT wywołała pozytywne emocje wśród internautów, dla wielu z nich korzystanie z funkcji mówienia jest dużo wygodniejsze od mozolnego wpisywania poleceń tekstowych. Zastosowań tego typu nowości jest więcej, technologia może okazać się szczególnie przydatna dla producentów interaktywnych asystentów głosowych, które dzięki umiejętności rozpoznawania emocji będą mogły uzyskać całkowicie nowe zastosowania i funkcje.
Innowacja w przyszłości może także stać się nieodłączną część naszego codziennego życia. Wyobraźmy sobie scenariusz, w którym na każdym przystanku autobusowym, lotnisku i dworcu znajduje się co najmniej jeden asystent głosowy, bazujący na technologii ChatGPT. Wówczas mógłby on udzielić nam informacji dotyczących naszego autobusu, pociągu czy samolotu i informować o potencjalnych opóźnieniach – na podstawie emocji wykrytych w głosie pasażera mógłby choćby sprytnie wytłumaczyć przyczynę zaniedbania.
Czytaj też: Dlaczego mój kot jest znacznie mądrzejszy niż zaawansowana sztuczna inteligencja? Pomimo iż nie potrafi grać w szachy.
Aktualizacja ChatGPT dostępna dla tych, którzy zapłacą
Żeby uzyskać dostęp do najnowszych możliwości oferowanych przez OpenAI, trzeba być subskrybentem planów Plus lub Enterprise. Koszt subskrypcji Plus, to 20 dolarów miesięcznie – czyli nieco ponad 87 zł. Z kolei cena najbardziej zaawansowanego ze wszystkich planów, czyli Enerprise, nie jest do końca jasna. o ile chcemy uzyskać wycenę, musimy skontaktować się z działem sprzedaży producenta.
Nowe funkcje ChatGPT to z pewnością kolejny argument, żeby dostęp do ChatGPT wykupić. Wybierając subskrypcję Plus otrzymujemy stały dostęp do ChatGPT 4, zaawansowaną analizę danych, dodatkowe wtyczki oraz dostęp do wszystkich funkcji Beta (czyli takich, które znajdują się jeszcze w fazie testów i nie są dostępne dla przeciętnego użytkownika). Możemy stać się więc poniekąd testerami flagowego produktu OpenAI. o ile jesteśmy typem użytkownika, który z aplikacji skorzysta 2-3 razy w miesiącu – to cena jest dość wygórowana. Szczególnie, iż dostępna darmowa wersja, ChatGPT 3.5.
Czytaj też: Czy sztuczna inteligencja podbije w końcu kosmos?
Czy najnowsza aktualizacja możliwości ChatGPT to będzie przełom? Połączenie umiejętności mówienia, słyszenia, a choćby interpretowania i rozumienia ludzkich emocji najprawdopodobniej w ciągu kilku lat zrewolucjonizuje funkcjonowanie bardzo wielu branż. Niestety, wraz z postępem technologii pojawią się również liczne wyzwania, takie jak kwestie prywatności czy etyki w zastosowaniach sztucznej inteligencji.
Mimo wszystko potencjał, jaki niesie ze sobą ChatGPT i podobne modele, jest ogromny (od zaawansowanych asystentów wirtualnych po narzędzia do generowania treści multimedialnych) i może w ciągu najbliższych kilu lat odmienić świat. Wydaje się, iż wprowadzona właśnie aktualizacja ChatGPT to kolejny punkt w programach rosnących jak grzyby po deszczu firm specjalizujących się we wdrażaniu wybranych funkcji ChatGPT w firmach w celu wygenerowania oszczędności.
Jak tylko najnowsza wersja ChatGPT zacznie wykonywać nowe funkcje – w Homodigital wszystko zrecenzujemy oraz podpowiemy jak tego używać, żeby nie zrobić sobie krzywdy.
źródło zdjęcia: PicsArt