Sztuczna inteligencja nauczyła się nowych sztuczek. Nowy model Stability AI pokazał, jakie cudne grafiki tworzy

spidersweb.pl 1 rok temu

Papież w kurtce od Midjourney to wierzchołek góry lodowej o ile chodzi o to, co może wygenerować SI. Stability AI wydało właśnie model tak dobry w fotorealizmie, iż nowa fala deep fake’ów to tylko kwestia czasu.

Pomimo iż Stability AI ma na karku kilka problemów – zarówno ze względu na naruszenia praw autorskich, jak i typowo finansowych. Mimo to startup nie spowalnia rozwoju, a swój najnowszy model stworzyło z myślą o głębokich kieszeniach dużych firm i koncernów.

Stability AI ogłosiło stworzenie nowego modelu generatywnej SI Stable Diffusion XL (SDXL). Nowy model to ulepszona wersja popularnego Stable Diffusion 2.1, jednak jak zaznacza Stability AI „to jeszcze nie jest Stable Diffusion 3.0”. Co więc nowego?

Nowy model Stable Diffusion to mistrz deep fa… fotorealizmu

Przede wszystkim Stability AI skupiło się na ulepszeniu możliwości SI w generowaniu fotorealistycznych obrazów. Poprawiono także generowanie twarzy i dłoni oraz dostosowano SDXL do działania na krótszych, mniej złożonych promptach. Jak podaje firma, model oprócz generowania obrazów metodą text-to-image jest w stanie generować je innymi metodami, takimi jak image-to-image (tworzenie wariacji innego obrazu), inpaiting (rekonstruowanie brakujących części obrazu) czy outpainting (tworzenie „rozwinięć” istniejących obrazów).

Przykładowy obraz wygenerowany dzięki Stable Diffusion XL. Prompt: „Middle eastern man holding a rose, visible hand, city background, purple clothes”
„Tasty tacos filled with seasoned beef, fresh salsa, melted cheese, and crunchy lettuce, served on a warm corn tortilla, Mexican-style, high resolution, focused on texture and flavor, food photography”
„Skilled archer, bow and quiver of arrows, standing in forest clearing, intense, detailed, high detail, portrait”
„Modern nursery with minimalistic design, white crib, rocking chair, wall mounted bookshelves, abstract art, neutral color palette, warm lighting, high detail, cozy and inviting”
„Tranquil pond surrounded by tall trees, with a beautiful lily pad garden and calm reflection of the sky, serene, peaceful, high detail, water landscape, photography”

Jak podaje Stability AI, za potencjałem modelu stoi znacznie zwiększona liczba parametrów. W przypadku innych modeli Stable Diffusion ich liczba wynosiła około 900 milionów, z kolei SDXL został wytrenowany na 2,3 miliarda parametrów. Ponadto firma stale dostraja model na podstawie opinii testerów.

Przykładowy obraz wygenerowany dzięki Stable Diffusion XL. Prompt: „Rustic kitchen with exposed brick wall, reclaimed wood cabinetry, large farmhouse sink, industrial lighting fixtures, antique baking tools on open shelving, cast iron cookware, vintage accents, warm and inviting, detailed textures”

Choć model brzmi jako idealny generator deep fake’ów, to jego pełna wersja jest w fazie zamkniętej bety. w tej chwili Stability AI daje dostęp do ograniczonej wersji poglądowej Stable Diffusion XL Beta Preview poprzez aplikację webową DreamStudio. Jednak jak zapowiada brytyjska firma, Stable Diffusion XL – pomimo bycia stworzonym z myślą o klientach biznesowych – również stanie się modelem open-source, do którego dostęp będą mogli zyskać wszyscy zainteresowani.

Idź do oryginalnego materiału