Stabilna sztuczna inteligencja stara się wyprzedzić konkurencję dzięki nowemu modelowi sztucznej inteligencji generującej obrazy

cyberfeed.pl 3 miesięcy temu


Najnowszym modelem generowania obrazu Stability AI jest Stabilna kaskada zapowiada się szybciej i potężniej niż jego wiodący w branży poprzednik, Stable Diffusion, który jest podstawą wielu innych narzędzi AI do generowania tekstu na obraz.

Stable Cascade może generować zdjęcia i podawać odmiany dokładnie utworzonego obrazu lub próbować zwiększyć rozdzielczość istniejącego obrazu. Inne funkcje edycji tekstu na obraz obejmują inpainting i outpainting, w przypadku których model wypełni edycję tylko określonej części obrazu, a także sprytną krawędź, w której użytkownicy mogą utworzyć nowe zdjęcie, po prostu wykorzystując krawędzie istniejącego obrazu.

Obrazy Stable Cascade wygenerowane na podstawie podpowiedzi „Kinowe zdjęcie antropomorficznego pingwina siedzącego w kawiarni, czytającego książkę i pijącego kawę”.Obraz: Stabilność AI

Nowy model jest dostępny na GitHubie dla badaczy, ale nie do użytku komercyjnego, i zapewnia więcej opcji, choćby gdy firmy takie jak Google, a choćby Apple udostępniają własne modele generowania obrazów.

W przeciwieństwie do flagowych modeli Stable Diffusion firmy Stability, Stable Cascade nie jest jednym dużym modelem językowym — to trzy różne modele, które opierają się na Architektura WürstchenaPierwszy etap, etap C, kompresuje podpowiedzi tekstowe do postaci ukrytych (lub mniejszych fragmentów kodu), które są następnie przekazywane do etapów A i B w celu zdekodowania żądania.

Porównanie czasu wnioskowania Stable Cascade z innymi modelamiStabilność AI

Podział żądań na mniejsze bity kompresuje żądanie, wymagając mniej pamięci (i mniej godzin szkolenia). na tych trudnych do znalezienia procesorach graficznych) i biegaj szybciej. jednocześnie osiągając lepsze „zarówno pod względem szybkiego dopasowania, jak i jakości estetycznej”. Utworzenie obrazu trwało około 10 sekund w porównaniu do 22 sekund w przypadku w tej chwili używanego modelu SDXL.

Stabilna sztuczna inteligencja pomogła spopularyzować metodę stabilnej dyfuzji, a także była przedmiotem kilku procesów sądowych zarzucających, iż Stable Diffusion została przeszkolona na danych chronionych prawem autorskim bez zgody posiadaczy praw — zaplanowany jest pozew w Wielkiej Brytanii złożony przez Getty Images przeciwko Stability AI iść na rozprawę w grudniu. Zaczęło oferować licencje komercyjne poprzez abonament w grudniu, co zdaniem firmy było konieczne, aby pomóc w finansowaniu badań.



Source link

Idź do oryginalnego materiału