Gada dziad do obrazu, a tu AI - 3

jacekh.substack.com 11 miesięcy temu

Kolejne odcinki można odnaleźć na mojej stronie głównej https://jacekh.substack.com/

Na początek zagadka, jak powstały powyższe obrazy?

Być może przynudzam, zajmując się sprawami dosyć technicznym, ale tego rodzaju poszukiwania pozwalają na poznanie nowego narzędzia, jakim jest generowanie obrazów dzięki AI. Nie jest to może droga do sukcesu, ale na pewno lampa pozwalająca nieco oświetlić tę drogę.

To już trzecia część relacji z mojej podróży do świata AI. W poprzedniej badaliśmy, jak dwie techniki drzeworytnicze są interpretowane przez różne modele AI dostępne na NightCafe. Teraz jeszcze pozostało sprawdzenie wpływu podania nazwiska artysty. Warto wybrać kogoś znanego i o charakterystycznym stylu. Niech będzie to Albrecht Dürer. Po pierwsze to mój ulubiony artysta a po drugie na tyle znany, iż być może słyszały o nim różne AI. Zatem nasz nowy prompt:

Portrait of terrible and monstrous personification of Death, woodcut, Albrecht Dürer

Oto wyniki:

Stable Diffusion 1.5
DreamShaper v8
SDXL 1.0 (a dokładniej Juggernaut XL v5)
DALL-E 2

Jak widać, w przypadku drzeworytu przywołanie artysty nie zawsze dookreśla styl, zwłaszcza gdy brak jest u niego silnie zaznaczonych cech. Czasem użyte modele AI mają swój ulubiony styl drzeworytu, który jest na tyle znaczny, iż maskuje cechy stylu dodanego deklaracją. Zwłaszcza trudno podejrzewać model DALL-E 2 o niewolnicze przywiązanie do twórczości Albrechta Dürera.

Dajmy sztucznej inteligencji jeszcze jedną szansę. Jeszcze jeden drzeworytnik, tym razem nasz rodzimy Władysław Skoczylas. Zatem testujemy nowy prompt w postaci:

Portrait of terrible and monstrous personification of Death, woodcut, Władysław Skoczylas

Stable Diffusion
Dream Shaper v8
SDXL 1.0 (Juggernaut XL v5)
DALL-E 2

Wydaje się, iż model Stable Diffusion 1.5 posłuchał wezwania do przyjęcia nowego stylu. Być może także model DALL-E 2, więc aby się upewnić, pokażmy więcej próbek produkcji obu tych modeli.

Stable Diffusion 1.5
DALL-E 2

Jak dalece zadanie zostało wykonane, każdy musi ocenić sam. W sumie prawdopodobnie nie jest szczególnie istotne, czy obrazy dobrze imitują styl konkretnego artysty. Nie zamierzamy produkować falsyfikatów, a powołania na różnych twórców są formą nadania określonego charakteru generowanym obrazom przez przyjęcie ich sposobu rysowania, czy wykonywania innej techniki. Co więcej, do generacji obrazów wcale nie jest konieczne zadanie techniki graficznej ani stylu. Można generować interesujące i udane obrazy bez tego korzystając z ustawień domyślnych. Tutaj zaprezentowałem wyniki prób w zakresie, który mnie interesował.

Przy okazji stało się widoczne interesujące zjawisko. Mianowicie działanie modeli AI w pewnym stopniu przypomina meandrowanie strumyka, który rzeźbi w podłożu koryto, przez jakiś czas płynie nim, nieznacznie tylko zmieniając swój bieg, aby w końcu porzucić pewien odcinek koryta, wyrzeźbiwszy nowe. Można to zjawisko zaobserwować, wykonując dłuższe serie generacji. Tym razem są to czerwone oczy, które pojawiły się w modelu Dream Shaper pomimo nakazu b&w. Często tak bywa, iż najoryginalniejszy i najlepszy obraz uzyskujemy podczas pierwszego użycia danego promptu. Później model nabiera swoich przyzwyczajeń, nie zawsze nam na rękę. Zatem przed generacją dobrze jest się upewnić, iż wszystko przygotowaliśmy bez błędów.

Co więcej, podczas kolejnych prób dochodzę do wniosku, iż bardzo trudno jest przewidzieć wyniki kolejnej generacji obrazów. Czasem może wydawać się, iż nauczyliśmy się jak osiągnąć jakieś cechy obrazu, ale kolejna generacja, czasem drobna zmiana promptu i już nasza pewność siebie upada. Nie bardzo rozumiem występujące prawidłowości. Być może postawione przez nas warunki (również te, o których nie wiemy, powstałe podczas treningu AI) zawierają jakieś sprzeczności, których rozwiązaniem jest pominięcie części instrukcji, raz jednej, a innym razem drugiej. Wiele tu czeka jeszcze niespodzianek.

I na zakończenie wyjaśnienie pokazanej na wstępie zagadki. Do generacji dwu pierwszych obrazów tego odcinka użyłem promptu:

Portrait of terrible and monstrous personification of Death, woodcut, Pablo Picasso, colour.

Dwa modele SDXL obraz lewy i Dream Shaper obraz po prawej stronie. Jak widać, styl Pablo Picasso jest na tyle wyrazisty, iż choćby w przypadku tych dwu niechętnych modeli nadał obrazom zdecydowany charakter. Picasso stworzył wiele, podobno ponad 2000 grafik, w tym również drzeworyty, ale te dwa nie były do tej pory znane. Na zakończenie dla porównania jeszcze wyniki uzyskane z tym samym promptem w modelu Stable Diffusion. Zwróćmy uwagę, iż tym razem reprezentują one inny styl, to znaczy odpowiadający innemu okresowi twórczości Picassa.

Stable Diffusion 1.5

Dziękuję za przeczytanie Substacka Jacka! Zapisz się bezpłatnie, aby otrzymywać nowe posty i wspierać moją pracę.

Idź do oryginalnego materiału