Gemini zyskało kolejną przydatną aktualizację. Użytkownicy mogą teraz przemienić statyczne zdjęcie w materiał wideo. Zostanie ono automatycznie wzbogacone o efekty dźwiękowe, a choćby dialogi. Nowość ma ogromny potencjał, choć nie brakuje kilku ograniczeń. Mowa bowiem o generowaniu dosyć krótkich (kilkusekundowych) klipów, ale to prawdopodobnie wyłącznie tymczasowy stan rzeczy. Amerykański koncern informuje też o konieczności opłacania dosyć drogiej subskrypcji.
Gemini ożywi zdjęcia, które mu podeślesz
Trzeba przyznać, iż ostatnie miesiące obfitują w przydatne rozwiązania napędzane przez sztuczną inteligencję. Ostatnio informowaliśmy chociażby o opcji analizowania filmików. Gemini jest w stanie rozwiązać szereg problemów dotyczących np. nieprawidłowego działania pojazdu lub innego sprzętu elektronicznego. To znacznie bardziej kompleksowe narzędzie, gdyż nie polega tylko na suchym tekstowym zleceniu.
- Gemini niczym prawdziwy asystent. Wykona zaplanowane zadania
Google poinformowało, iż najnowsza funkcja napędzana jest przez najnowszy model Veo 3 i jej zasada działania należy do stosunkowo prostych. Dochodzi do transformacji wrzuconych zdjęć w maksymalnie 8-sekundowe materiały wideo. Dopełniane są one generowaną ścieżką dźwiękową składającą się z m.in. szumów otoczenia oraz mowy. Zadowoleni będą (przynajmniej na razie) subskrybenci pakietów AI Ultra oraz Pro zamieszkujący wybrane regiony. Koniecznie zatem sprawdźcie czy aktualizacja trafiła do Polski.
Gemini (Android) – sprawdź dostępność nowości
Docelowo pojawi się ona wewnątrz przeglądarkowej, jak i mobilnej wersji popularnego asystenta. jeżeli zaś chodzi o jakość wypluwanych materiałów wideo, to pozostawia ona sporo do życzenia. Klipy zostaną dostarczone do użytkownika w formie plików MP4, których maksymalna rozdzielczość wynosi 720p. Google daje też znać o opcji załączenia tekstowego promptu zawierającego szczegółowe prośby. Nic nie stoi na przeszkodzie, by wzbogacić nagranie o audiodeskrypcję.
Poniżej możecie natomiast zobaczyć przykład zastosowania wprowadzonego właśnie rozwiązania. Robi spore wrażenie, prawda?
Wykonano kolejny krok w stronę istotnego przełomu
Amerykański gigant wspomniał również o oczywistym elemencie. Każdy wygenerowany klip wideo opatrzony będzie widocznym i niewidocznym znakiem wodnym. Użytkownicy będą zatem wiedzieć, iż patrzą na coś stworzonego przez sztuczną inteligencję. Warto też wiedzieć, iż podobna funkcjonalność występuje wewnątrz narzędzia Flow. Właśnie trafiło ono do mieszkańców kilkudziesięciu kolejnych państw – Polska też znajduje się na liście.
Dostępność wewnątrz Gemini likwiduje jednak konieczność pobierania odrębnej aplikacji, co także należy uznać za bardzo dobrą wiadomość. Trudno natomiast stwierdzić czy Google kiedykolwiek postanowi udostępnić Veo 3 osobom nieopłacającym drogiej subskrypcji. w tej chwili za opcję generowania klipów należy zapłacić około 100 zł miesięcznie.
- Walka z AI przez cały czas trwa. YouTube wprowadza nowe zasady
Możliwość przekształcenia zdjęć w materiały wideo dostarcza sztucznej inteligencji dodatkowy kontekst oraz porcję istotnych danych. Filmiki powinny być więc jeszcze bardziej szczegółowe oraz naturalne.
Źródło: Google / Zdjęcie otwierające: Google