Generator Whisk AI firmy Google „zremiksuje” podłączone zdjęcia

cyberfeed.pl 1 tydzień temu


Google ogłosiło nowe narzędzie AI o nazwie Trzepaczka która umożliwia generowanie obrazów przy użyciu innych obrazów jako podpowiedzi, zamiast wymagać długiego podpowiedzi tekstowej.

Dzięki Whisk możesz oferować obrazy sugerujące, jaki chcesz temat, scenę i styl obrazu wygenerowanego przez sztuczną inteligencję, a także możesz wyświetlać Whiskowi wiele obrazów dla każdej z tych trzech rzeczy. (Jeśli chcesz, możesz także wypełnić podpowiedzi tekstowe). jeżeli nie masz pod ręką obrazów, możesz kliknąć ikonę kostki, aby Google wypełnił niektóre obrazy w odpowiedziach (chociaż te obrazy również wydają się być generowane przez sztuczną inteligencję). Możesz także wpisać tekst w polu tekstowym na końcu procesu, jeżeli chcesz dodać dodatkowe szczegóły na temat szukanego obrazu, ale nie jest to wymagane.

Whisk wygeneruje następnie obrazy i monit tekstowy dla wszystkich obrazu. Możesz dodać obraz do ulubionych lub pobrać, jeżeli jesteś zadowolony z wyników, lub możesz udoskonalić obraz, wpisując więcej tekstu w polu tekstowym lub klikając obraz i edytując monit tekstowy.

Zrzut ekranu Whiska. Kliknąłem kostkę, aby wygenerować temat, scenę i styl. Zamieniłem automatycznie wygenerowaną scenę, wprowadzając monit tekstowy. Whisk stworzył pierwsze dwa obrazy, które powtórzyłem, prosząc Whiska, aby dodał trochę pary wokół obiektu (ponieważ jest to ogień w wodzie), w wyniku czego powstały dwa kolejne obrazy.Zrzut ekranu: Jay Peters / The Verge

W wpis na bloguGoogle podkreśla, iż ​​Whisk został zaprojektowany z myślą o „szybkiej eksploracji wizualnej, a nie edycji doskonałej co do piksela”. Firma twierdzi również, iż Whisk może „nie trafić w cel”, dlatego pozwala edytować podstawowe podpowiedzi.

W ciągu kilku minut, kiedy korzystałem z tego narzędzia podczas pisania tej historii, majstrowanie przy nim było zabawne. Generowanie obrazów zajmuje kilka sekund, co jest denerwujące, i chociaż obrazy były trochę dziwne, iterowanie wszystkiego, co wygenerowałem, było przyjemne.

Google twierdzi, iż Whisk korzysta z „najnowszej” wersji modelu generowania obrazu Imagen 3, co ogłosiła dzisiaj. Google również wprowadziło Weo 2kolejna wersja modelu generowania wideo, która według firmy rozumie „unikalny język kinematografii” i ma halucynacje takie jak dodatkowe palce „rzadziej” niż inne modele (jeden z tych innych modeli to prawdopodobnie Sora z OpenAI). Veo 2 jako pierwszy pojawi się w programie Google VideoFX, który można znaleźć na liście oczekujących w Laboratorium Google, a w przyszłym roku zostanie rozszerzony o „inne produkty” YouTube Shorts.



Source link

Idź do oryginalnego materiału