To, iż OpenAI może czynić rzeczy spektakularne i wielkie, zdążyliśmy się już przekonać. Bez ich ChataGPT wiele osób nie jest sobie w stanie wyobrazić codziennego funkcjonowania. Czy to w życiu prywatnym, czy w pracy zawodowej — niezależnie od branży. Teraz pochwalili się stworzeniem prawdopodobnie kolejnego gamechangera, ale… Uznali, iż jest on tak „przerażający”, iż z udostępnieniem go wszystkim zainteresowanym jeszcze trochę poczekają. Chodzi o Voice Engine.
Voice Engine – ukryty gamechanger od OpenAI
Model ten stworzyli już pod koniec 2022 roku. Jego cel jest prosty — zamiana tekstu na naturalnie brzmiącą mowę. Wystarczy piętnastosekundowa próbka głosu i już możemy „mówić” głosem dowolnego zainteresowanego. W OpenAI stwierdzili, iż bardzo chętnie podzieliliby się tą funkcjonalnością. Niemniej jednak boją się tego, w którą stronę mogłoby pójść jej wykorzystanie. Tym bardziej, iż i bez tego internet zalany jest ściekiem mniej lub bardziej udanych deepfake’ów. Na te humorystyczne można przymknąć oko. Gorzej z takimi, które bezczelnie wprowadzają w błąd czy choćby wyłudzają pieniądze.
Na ten moment z Voice Engine korzystają jednak instytucje. Firmy takie jak Age of Learning wykorzystują silnik głosowy do spersonalizowanych treści edukacyjnych. HeyGen z kolei do tłumaczenia wideo, a Dimagi do zapewniania interaktywnych informacji zwrotnych pracownikom służby zdrowia.
Technologia tę pilotażowo zastosowano choćby w opiece zdrowotnej. Instytut Neurosciences Norman Prince w Lifespan wykorzystuje ją do przywracania głosu pacjentom z zaburzeniami mowy.
Zobacz także: Ogromna giełda krypto ma problem? Inwestorzy wycofują setki milionów dolarów
Narzędzie tylko dla wybranych. Na razie
Czy narzędzie zostanie oddane do użytku wszystkim zainteresowanym? Niekoniecznie, przynajmniej nie w tym momencie. Tym bardziej iż w Stanach Zjednoczonych w tym roku czekają nas wybory prezydenckie. Na ten moment firmy, które z niego korzystają, obwarowane są rozmaitymi przepisami i ograniczeniami.
Z całą pewnością, potencjał Voice Engine jako narzędzia do tworzenia realistycznie brzmiącej mowy jest ogromny, jednakże otacza go aura niepokoju. Obawy dotyczące możliwego nadużycia tej technologii, szczególnie w kontekście szerzenia dezinformacji, są jak najbardziej uzasadnione. Trudno nie docenić etycznego podejścia OpenAI, które decyduje się na ostrożność, zamiast ślepego pędzenia za innowacją oraz zyskiem za wszelką cenę.
Warto jednak pamiętać, iż technologia ta niesie ze sobą także wiele pozytywnych możliwości. Przywracanie głosu osobom z zaburzeniami mowy czy spersonalizowane treści edukacyjne to tylko niektóre z przykładów. Pozostaje pytanie, czy i kiedy Voice Engine stanie się dostępne szerokiej publiczności. I co ważniejsze, w jaki sposób zabezpieczą narzędzie przed potencjalnymi nadużyciami.
Może Cię również zainteresować: