AI przejmuje YouTube. Nie tylko dubbing, ale i ruchy warg

instalki.pl 1 miesiąc temu

YouTube idzie o krok dalej w rewolucji sztucznej inteligencji. Po automatycznym dubbingu, który pozwalał twórcom mówić w obcych językach bez udziału lektorów, platforma testuje nową funkcję – synchronizację ruchów warg. Dzięki temu widzowie mają usłyszeć nie tylko przetłumaczony głos, ale i zobaczyć usta poruszające się tak, jakby twórca naprawdę mówił w danym języku. Na razie technologia obejmie kilka języków i rozdzielczość Full HD, ale ambicje Google są znacznie większe.

Od sztucznego głosu do sztucznej mimiki – naturalna kolej rzeczy

Jeszcze niedawno automatyczny dubbing na YouTube wydawał się czymś z pogranicza science fiction. Twórca nagrywał film po angielsku, a my – jako polscy widzowie – mogliśmy usłyszeć go w naszym języku, i to w wersji AI, która starała się zachować barwę głosu autora. Teraz Google postanowiło pójść dalej. Skoro już mamy głos, to dlaczego nie dopasować do niego ust? Brzmi jak żart, ale to właśnie dzieje się na naszych oczach.

Nowa technologia polega na modyfikacji obrazu wideo na poziomie pikseli. Algorytmy analizują ułożenie ust, zębów i mimikę, a następnie „przepisują” je tak, by pasowały do przetłumaczonego dźwięku. Efekt? Twórca, który w rzeczywistości nigdy nie powiedział słowa po hiszpańsku, na ekranie wygląda tak, jakby był rodowitym mieszkańcem Madrytu.

Jak to działa i gdzie będzie dostępne

Na starcie funkcja ma wspierać pięć języków: angielski, francuski, niemiecki, portugalski i hiszpański. To logiczny wybór – to właśnie w tych językach YouTube ma największą bazę odbiorców. Co ważne, Google zapowiedziało, iż pierwsze testy obejmą głównie Stany Zjednoczone, Kanadę, Meksyk, Brazylię oraz część państw Europy Zachodniej. Jest jednak kilka ograniczeń. Po pierwsze, synchronizacja ust działa tylko w rozdzielczości 1080p – filmy 4K muszą jeszcze poczekać.

Oficjalna demonstracja synchronizacji dubbingu i ruchu warg / Źródło: youtube.com/@UpdatesFromYouTube

Po drugie, technologia nie trafi od razu do wszystkich. Podobnie jak w przypadku dubbingu, Google zacznie od pilotażu z wybranymi twórcami. Dopiero później funkcja zostanie udostępniona szerzej. Nie wiadomo też, kto zapłaci za tę nowinkę. Pojawiają się sygnały, iż może być to dodatkowo płatna opcja – czy koszt poniosą widzowie, czy sami twórcy, tego jeszcze nie ustalono.

Globalna rewolucja czy ryzyko deepfake?

YouTube nie jest jedyną platformą, która stawia na sztuczną inteligencję w wideo – podobne eksperymenty prowadzi już Meta w Reelsach. Trend jest jasny: bariery językowe w internecie znikają szybciej, niż się spodziewaliśmy. Nowa funkcja synchronizacji ust może całkowicie zmienić sposób, w jaki twórcy docierają do odbiorców – polski youtuber nagrywający po polsku może w kilka chwil stać się rozpoznawalny w Meksyku czy Niemczech. To ogromna szansa na globalne zasięgi, ale i ryzyko nadużyć, bo technologia balansuje na granicy deepfake’ów. YouTube zapowiada jednak zabezpieczenia, takie jak oznaczenia i cyfrowe „odciski palca”, które mają utrudnić manipulacje.

Źródło: androidauthority.com / Zdjęcie otwierające: Canva, YouTube

YouTube wygląda inaczej. Odtwarzacz wideo otrzymał nowe szaty
googlesztuczna inteligencjaYouTube
Idź do oryginalnego materiału