Nowy generatywny model wideo AI firmy Google jest już dostępny

cyberfeed.pl 1 miesiąc temu


Veo jest w stanie generować „wysokiej jakości” filmy w rozdzielczości 1080p w różnych stylach wizualnych i kinowych na podstawie podpowiedzi tekstowych lub obrazowych. Kiedy modelka została ogłoszona po raz pierwszy, wygenerowane klipy mogły mieć długość „ponad minutę”, ale Google nie określa ograniczeń długości dla wersji poglądowej. Niektóre nowe przykładowe klipy w ogłoszeniu Google są porównywalne z tym, co widzieliśmy już w Veo — bez bystrego oka to niezwykle trudno stwierdzić, czy filmy są generowane przez sztuczną inteligencję.

Przykład psa w tych klipach Veo jest szczególnie imponujący — zwróć uwagę, iż wzór jego futra i kołnierz pozostają spójne podczas ruchu.GIF: Google

Najnowsza wersja generatora tekstu na obraz Imagen 3 firmy Google będzie także dostępna dla wszystkich klientów Google Cloud za pośrednictwem firmy Vertex „od przyszłego tygodnia”, rozszerzając tym samym pierwsza wersja w USA w Google AI Test Kitchen w sierpniu. Użytkownicy znajdujący się na liście dozwolonych Google mają także dostęp do nowych funkcji, takich jak błyskawiczna edycja zdjęć oraz możliwość „umieszczenia własnej marki, stylu, logo, tematu lub cech produktu” w wygenerowanych obrazach.

Veo nie jest jednak idealne — zobacz, jak światło prześwieca przez czyjąś dłoń w lewym górnym rogu nagrania wideo z koncertu wygenerowanego przez sztuczną inteligencję.Obraz: Google

Google twierdzi, iż Veo i Imagen 3 mają wbudowane zabezpieczenia, które zapobiegają generowaniu szkodliwych treści lub naruszaniu praw autorskich – chociaż odkryliśmy, iż to drugie nie było trudne do obejścia. Wszystko wyprodukowane przez Veo i Imagen 3 jest również osadzone Technologia SynthID firmy DeepMind — rodzaj niewidocznego cyfrowego znaku wodnego, który według Google może „zmniejszyć ryzyko dezinformacji i błędnego przypisania”. Jest to koncepcja podobna do koncepcji Adobe System poświadczeń treściktóre można osadzić w treści tworzonej przez własny wizerunek kreatywnego giganta systemu oraz modele AI generujące wideo.

Ponieważ model wideo Google jest już dostępny, OpenAI pozostaje w tyle za konkurencją i kończy się czas, aby dotrzymać obietnicy wypuścić Sorę do końca 2024 roku. Już teraz w reklamach pojawiają się treści generowane przez sztuczną inteligencję Najnowsza świąteczna kampania Coca-Colia firmy mają motywację, aby nie czekać na Sorę — według Google 86 procent organizacji już korzystających z generatywnej sztucznej inteligencji odnotowuje wzrost przychodów.



Source link

Idź do oryginalnego materiału