Google Veo 3 kończy erę niemych filmów AI. Pierwszy generator wideo z realistycznym dźwiękiem

itreseller.com.pl 1 tydzień temu

Google zaprezentowało Veo 3 – pierwszy generator wideo AI z realistycznym dźwiękiem. Narzędzie tworzy filmy z dialogami, efektami i muzyką w jakości kinowej za 249 dolarów miesięcznie.

Google oficjalnie zakończyło „niemą erę” generowania wideo przez sztuczną inteligencję. Veo 3 to pierwszy model AI zdolny do tworzenia kompletnych filmów z synchronizowanym dźwiękiem, dialogami i efektami audio. „Po raz pierwszy wychodzimy z niemej ery generowania wideo. Możesz podać Veo 3 prompt opisujący postacie i środowisko, a także zasugerować dialog z opisem tego, jak ma brzmieć” – wyjaśnia Demis Hassabis, szef Google DeepMind.

Do tej pory twórcy używający AI musieli osobno nagrywać lub kupować muzykę, efekty dźwiękowe i narrację, a następnie synchronizować to z wygenerowanym wideo. Veo 3 rozwiązuje ten problem, generując odgłosy ruchu ulicznego dla miejskich scen, śpiew ptaków w parkach czy naturalne rozmowy między postaciami. System rozumie zawartość wideo na poziomie pikseli – widzi samochód i wie, iż powinien dodać dźwięk silnika, dostrzega spadającą kroplę deszczu i generuje dźwięk uderzenia o powierzchnię.

Pierwsze treści wyprodukowane przez Veo 3 wzbudziły różnorodne reakcje oscylujące między zachwytem a obawami. Największą dyskusję wywołał fragment prezentujący YouTubera komentującego grę w Minecraft – nagranie jest na tyle realistyczne, iż zdecydowana większość odbiorców nie dostrzega sztucznego charakteru. Jedynymi wskazówkami sugerującymi wykorzystanie AI są niewielkie nieprawidłowości w funkcjonowaniu gry, które potrafią dostrzec wyłącznie zaawansowani użytkownicy. Jeszcze bardziej niepokojącym przykładem jest scena przedstawiająca żeglarza machającego fajką w stronę wzburzonych fal – jego głos brzmi tak autentycznie, iż niełatwo uwierzyć, iż każdy element dźwiękowy powstał w sposób cyfrowy.

Wraz z Veo 3 Google wprowadza Flow – kompleksowe narzędzie do tworzenia filmów łączące modele Veo, Imagen i Gemini. To prawdziwe studio filmowe w chmurze, które pozwala opisywać lokalizacje, ujęcia i preferencje stylistyczne w naturalnym języku. Artyści cyfrowi już eksperymentują z nową technologią – Henry Daubrez pracuje nad projektem „Electric Pink”, a Junie Lau tworzy „Dear Stranger” o uniwersalnej miłości między babcią a wnukiem w równoległych uniwersach.

Veo 3 demokratyzuje sztukę filmową, ale niesie też zagrożenia. Materiały są tak przekonujące, iż jedynymi sposobami rozpoznania AI są mikroskopijne szczegóły – powtarzające się twarze w tle czy drobne błędy w fizyce obiektów. Google implementuje środki bezpieczeństwa: każdy materiał oznaczany jest niewidocznym znakiem wodnym SynthID, a firma uruchomiła publiczne narzędzie SynthID Detector do sprawdzania pochodzenia treści. System ma też wbudowane filtry blokujące generowanie szkodliwych materiałów.

Dostęp do Veo 3 kosztuje 249,99 dolara miesięcznie w ramach planu Google AI Ultra i jest w tej chwili dostępny tylko w USA. W pakiecie użytkownicy otrzymują Flow, nowy Gemini 2.5 Pro Deep Think mode oraz inne zaawansowane narzędzia AI. To cena skierowana do profesjonalistów, którzy mogą wykorzystać pełny potencjał technologii do tworzenia treści komercyjnych.

Idź do oryginalnego materiału