Midjourney ma konkurencję: Ten system sztucznej inteligencji wygląda obłędnie

pl.beincrypto.com 2 lat temu

Cyfrowy świat tętni rozwojem sztucznej inteligencji. Transformacyjne moce AI już dawno dotarły do branży artystycznej, w której platformy rywalizują o prymat.

W tej intensywnej rywalizacji dwóch graczy wyłoniło się jako czołowi pretendenci. Midjourney, ze swoim skrupulatnym podejściem do generowania obrazu, oraz Runway, który rzuca wyzwanie konwencjom dzięki technologii przetwarzania obrazu na wideo.

Generatory obrazów AI stają się coraz lepsze

Midjourney, potężny gracz w sektorze generowania obrazów opartych na sztucznej inteligencji, działa w systemie opartym na siatce. Użytkownicy rozpoczynają swoją podróż od wyboru opcji obrazu o niskiej rozdzielczości, dostarczając początkowe płótno, z którego mogą stworzyć swoją wizję.

Sprawność platformy staje się oczywista, gdy użytkownicy zagłębiają się w proces skalowania. Yash Thakker, założyciel ExplainX.ai, powiedział:

“Jako ktoś, kto regularnie tworzy obrazy do mediów społecznościowych, postów na blogach i innych treści online, odkryłem, iż to narzędzie zmienia zasady gry. Jego algorytmy oparte na sztucznej inteligencji generują obrazy, które są oszałamiające wizualnie i bardzo angażujące.”

Rzeczywiście, Midjourney oferuje wiele modeli skalowania, które zaspokajają różne potrzeby. Na przykład Light Upscaler służy tym, którzy koncentrują się na obrazach twarzy. Tworzy ulepszone obrazy w rozdzielczości 1024×1024 pikseli.

Na drugim końcu spektrum wyróżnia się Beta Upscaler, generujący obrazy o rozdzielczości 2048×2048 pikseli. Te modele doskonale sprawdzają się w portretowaniu twarzy i gładkich powierzchni.

Podczas gdy jego zdolność do generowania obrazów o wysokiej rozdzielczości, osiągającej szczyt 1664×1664 pikseli, okazuje się imponująca, na rynku generowania obrazów AI pojawiają się nowi konkurenci.

YouTuber MattVidPro potwierdził, iż OpenAI przeprowadzał prywatne testy swojej najnowszej wersji generatywnego modelu obrazowania AI w ciągu ostatnich kilku miesięcy. Powiedział on:

“Niezwykle ekscytujące – to powala wszystko, co widzieliśmy wcześniej, to szaleństwo. Midjourney nie może konkurować na tym poziomie – nie sądzę nawet, by Midjourney w wersji szóstej był w stanie konkurować na tym poziomie.”

Nowa rzeczywistość: Obraz-do-Wideo (Image-to-Video)

Kolejnym poważnym rywalem Midjourney w generowaniu obrazów AI jest Runway. Firma identyfikuje się przede wszystkim jako podmiot zajmujący się badaniami nad sztuczną inteligencją. Wyróżnia swoją platformę, koncentrując się na przejściu od obrazów do filmów.

Ostatnie aktualizacje firmy podkreślają znaczący rozwój tej technologii. Kładą nacisk zarówno na jakość, jak i płynność wyników.

Generated greenery. Made with the new Image to Video mode in Gen-2. pic.twitter.com/Souui3kk87

— Runway (@runwayml) July 26, 2023

W przeciwieństwie do szczegółowego podejścia Midjourney do ulepszania obrazu, Runway umożliwia użytkownikom przejście od statycznych obrazów do dynamicznych treści wideo bez polegania na deskryptorach tekstowych. Zmiana ta ma szansę na nowo zdefiniować procesy tworzenia treści i przepływy pracy.

Tatiana Tsiguleva, Head of Design w Vial, twierdzi, iż algorytmy sztucznej inteligencji stają się coraz bardziej wyrafinowane. W rezultacie tworząc treści, które na pierwszy rzut oka wydają się bardzo realistyczne. Tsiguleva powiedziała:

“Kilka miesięcy temu byłam sceptycznie nastawiona do możliwości sztucznej inteligencji do tworzenia wysokiej jakości filmów jeszcze w tym roku. Myślałam, iż zajmie to więcej czasu.”

Midjourney is great, but Midjourney+ Runway is better

Day 161#Midjourney #Runway pic.twitter.com/57ZkwcQ4Qn

— Tatiana Tsiguleva (@ciguleva) July 24, 2023

Jednak droga Runway była pełna wyzwań. Wczesne wersje filmów generowanych przez sztuczną inteligencję cierpiały z powodu niespójności. Często filmy te wykazywały nienaturalne wzorce ruchowe, osłabiając wrażenia, które powinny oferować filmy.

“Kiedy napotykamy postacie generowane przez sztuczną inteligencję, które są bliskie odzwierciedlenia ludzkiego wyglądu, ale nie spełniają niektórych aspektów, nasze mózgi interpretują to jako zagrożenie. Może to zabrzmieć dziwnie, ale jest to głęboko zakorzeniony instynkt przetrwania naszych przodków. Zauważenie czegoś, co wygląda prawie jak człowiek, ale nie do końca, może wskazywać na potencjalne zagrożenie lub chorobę” – dodała Tsiguleva.

Chociaż ostatnie postępy zmniejszyły te niespójności, udoskonalenie tego procesu pozostaje wyzwaniem.

Konkurujące wizje czy uzupełniające się oferty?

Rywalizacja między generatorami obrazów AI – Midjourney i Runway – to coś więcej niż walka o dominację. Dzięki swoim mocnym i słabym stronom platformy te podkreślają potencjał i wyzwania związane z integracją sztucznej inteligencji z cyfrowym artyzmem.

Ich konkurencja podkreśla znaczenie projektowania zorientowanego na użytkownika i innowacje. Platformy muszą traktować priorytetowo potrzeby i preferencje swoich użytkowników. Muszą zapewnić, iż postępy nie tylko przesuną granice technologiczne, ale także zaspokoją praktyczne wymagania. YouTuber MachineAlpha powiedział:

“Obraz-do-Wideo AI to początek nowej, przełomowej ery, w której GPU pozwala każdemu, kto ma dobry pomysł, konkurować z Hollywood, reklamą i branżą gier.”