Bierzesz zdjęcie i robisz z niego film. Super narzędzie od Google’a

konto.spidersweb.pl 3 miesięcy temu

Google udostępnił świetną funkcję, która potrafi ożywiać zdjęcia. Kilkoma kliknięciami zamienisz fotografię w prawdziwy film.

Gigant ulepszył swojego czatbota Gemini, bazującego na sztucznej inteligencji. Nowa funkcja została udostępniona tydzień po tym, jak Google pokazał swój najnowszy model sztucznej inteligencji Veo 3 wykorzystywany do generowania wideo.

Sztuczna inteligencja Google zamienia zdjęcia w filmy. To coś niesamowitego

Google pochwalił się nową funkcją zamiany zdjęcia w pełnoprawne kilkusekundowe filmy. Użytkownik może poprosić o wygenerowanie maksymalnie 8-sekundowego materiału obejmującego dźwięk, dialogi czy odgłosy tła. Dodatki oczywiście również są tworzone przez sztuczną inteligencję bazującą na technologii Google Veo 3.

Kto może skorzystać z rozwiązania? Niemalże każdy. Google Veo 3 od początku jest dostępny w Polsce, więc mieszkańcy kraju nad Wisłą nie powinni mieć problemu z ożywaniem zdjęć. Rozwiązanie jest dostępne tylko dla korzystających z czatbota Gemini ulepszonego abonamentem Google AI Pro lub Google AI Ultra.

Mam jednak dobrą wiadomość. Z subskrypcji Google AI Pro można skorzystać za darmo przez pierwszy miesiąc w formie okresu próbnego. Po tym czasie dostęp kosztuje 98 zł/mies. Oczywiście generowanie obrazków znajduje się bezpośrednio w aplikacji lub na stronie internetowej Gemini. Co trzeba zrobić, aby ożywić zdjęcie? To proste:

upewnić się, iż mamy aktywną subskrypcję Google AI Pro (nawet z darmowego okresu próbnego);
uruchomić Gemini;
wybrać opcję wideo na pasku poniżej pola wpisywania poleceń;
przesłać obrazek i dodać opis tekstowy, jak ma zostać zanimowany.

Można również dodać opisy dialogów, efektów dźwiękowych, odgłosów otoczenia. Te – jak twierdzi Google – mają być „idealnie zsynchronizowane z obrazem”. Gotowy 8-sekundowy film trafia do użytkownika w jakości 720p (16:9) w pliku z rozszerzeniem mp4.

Rozwiązanie działa adekwatnie tak jak zwykła wersja modelu Veo 3, a więc efekty powinny być niemal identyczne. Z taką różnicą, iż użytkownik nie musi tłumaczyć, co wideo ma zawierać. Zamiast tego ma gotową bazę w postaci zdjęcia, z którą może zrobić tak naprawdę wszystko, co przyjdzie mu do głowy. Im bardziej szczegółowy prompt (czyli polecenie), tym lepszy wynik – instruuje Google.

Każdy wygenerowany film ze zdjęcia zawiera widoczny znak wodny oraz obejmuje niewidoczny cyfrowy znak wodny SynthID. Oba rozwiązania zostały stworzone po to, aby łatwo zidentyfikować, iż film pochodzi od sztucznej inteligencji.

Google uważa, iż narzędzie jest zabezpieczone przed nadużyciami

W oficjalnym komunikacie Google podaje, iż narzędzie zostało stworzone z myślą o bezpieczeństwie i prywatności. Udostępnianie tego typu narzędzi na ogromną skalę może budzić obawy dotyczące potencjalnych nadużyć. Wiemy, iż narzędzia sztucznej inteligencji mogą być wykorzystywane w złych celach. Wystarczy tylko spojrzeć na problem deepfake, z którym państwa muszą walczyć za pomocą zmian w prawie autorskim.

Google ma określone zasady dotyczące treści niebezpiecznych. Oprogramowanie ma być zabezpieczone przed potencjalnymi problemami związanymi z nadużyciami. Nie próbuj zatem tworzyć filmów dla dorosłych z nowym Gemini Veo 3.

Więcej o sztucznej inteligencji przeczytasz na Spider’s Web: