W filmie demonstracyjnym Google pokazało kilka różnych światów generowanych przez sztuczną inteligencję, każdy z własnymi interaktywnymi postaciami, od wnętrza statku kosmicznego badanego przez astronautę po robota przechadzającego się po futurystycznym cyberpunkowym środowisku miejskim, a choćby żaglówkę płynącą nad wodą i kowbojem jadącym konno przez trawiaste równiny. Być może najbardziej interesujące w środowiskach generowanych w Genie 2 jest to, iż Genie najwyraźniej nadał każdemu światu inną perspektywę i schemat sterowania kamerą. Niektóre z pokazanych przykładów są przedstawiane z perspektywy pierwszej osoby, podczas gdy inne są z perspektywy trzeciej osoby, a kamera jest albo skupiona na postaci, albo swobodnie unosi się wokół niej. Oczywiście, jako iż jest to generatywna sztuczna inteligencja, istnieje pewna dziwność, a Google najwyraźniej starannie wybierał swoje klipy demonstracyjne, aby uniknąć pojawienia się anomalii graficznych w centrum uwagi. Co więcej, przynajmniej kilka klipów wydaje się bardzo przypominać światy z popularnych gier wideo, Assassin’s Creed, Red Dead Redemption, serii Sony’s Horizon i czegoś, co wydaje się być mieszanką różnych gier science-fiction, w tym Warframe, Destiny, Mass Efekt i Subnautica. Nie jest to zaskakujące, ponieważ wszystkie światy, których Google użył do zaprezentowania sztucznej inteligencji, są generowane z obrazem i podpowiedzią tekstową jako danymi wejściowymi, a biorąc pod uwagę to, co Google twierdzi, iż wykorzystało jako dane szkoleniowe, wydaje się prawdopodobne, iż klipy z gier z tych gier zostały utworzone go do danych szkoleniowych modelu AI.
W pierwszym klipie przyciski, z którymi postać wchodzi w interakcję, wyglądają, jakby nie mogły się zdecydować, czy są okrągłe, czy kanciaste. W niektórych innych klipach widać dziwne, rozmyte tekstury, a w niektórych klipach są momenty, w których interakcje między postaciami wydają się nieco nienaturalne. Google nie stroni jednak od takich wpadek i zamieścił bardzo zabawną kolekcję wpadek na dole wpisu na blogu z ogłoszeniem.
Oczywiście każdy generatywny system sztucznej inteligencji jest tylko tak dobry, jak jego dane szkoleniowe, a Google twierdzi, iż Genie 2 został wytrenowany na zbiorze danych wideo na dużą skalę i iż model prawdopodobnie zawierał mieszankę różnych klipów z gier wideo, z których część prawdopodobnie wykazywał pewne artefakty wizualne typowe dla rozgrywki strumieniowej. Google wyobraża sobie wykorzystanie Dżina do wszystkiego, od szybkiego prototypowania światów gier oraz szkolenia i oceny NPC wyposażonych w sztuczną inteligencję w nowatorskich światach i scenariuszach.
Google twierdzi, iż jego sztuczna inteligencja jest rozwijana „odpowiedzialnie”, stwierdzając:
Genie 2 pokazuje potencjał podstawowych modeli świata w tworzeniu różnorodnych środowisk 3D i przyspieszaniu badań nad agentami. Ten kierunek badań jest na wczesnym etapie i nie możemy się doczekać dalszego ulepszania możliwości generowania świata przez Genie pod względem ogólności i spójności.
Podobnie jak w przypadku SIMA, nasze badania zmierzają w kierunku bardziej ogólnych systemów i agentów AI, które potrafią zrozumieć i bezpiecznie wykonywać szeroki zakres zadań w sposób pomocny dla ludzi w Internecie i w świecie rzeczywistym