Naukowcy z Microsoftu zaprezentowali nowy, imponujący model sztucznej inteligencji, który został oznaczony jako Vall-E. Opisywany software potrafi na podstawie zaledwie kilkusekundowej próbki głosu stworzyć jego realną kopię. Wszystko to w pakiecie z tonem emocjonalnym i rozbudowaną akustyką. W jaki sposób działa ta technologia?
Microsoft zaprezentował najnowszy z wielu algorytmów AI, które są w stanie na podstawie próbki głosu użytkownika sprawić, iż będzie mógł zostać on “sklonowany” w cyfrowej wersji. To, co jest jednak najbardziej niezwykłe w technologii amerykańskiej firmy to fakt, iż potrzebuje ona do skutecznego działania próbki o długości zaledwie trzech sekund.
W 2017 roku podobne algorytmy wymagały co najmniej minuty nagrania, aby móc skutecznie skopiować ton i barwę głosu.