
Gemini, chatbot AI od Google, właśnie dostaje nową funkcjonalność. To nano banana, podobno najlepszy model do edycji grafiki. Według oficjalnej terminologii Google nazywa się Gemini 2.5 Flash Image, ale prawdopodobnie będzie lepiej znany pod bananową nazwą, pod którą był testowany od jakiegoś czasu w LM Arenie. Na razie będzie udostępniany w mobilnych aplikacjach Gemini. Na wersję przeglądarkową chwilę poczekamy.
Modele AI już od pewnego czasu imponują zdolnościami generowania grafiki. Midjourney, Dall-E czy Imagen świetnie nadają się do generowania ilustracji. Korzysta z tego wielu wydawców serwisów internetowych, jak i zwykłych użytkowników, na przykład do tworzenia zabawnych memów. Jednak nieco gorzej było z edycją – czy to grafik, czy to zdjęć. Teraz nano banana wnosi tę umiejętność na nowy poziom.
Najlepszy model AI do edycji grafiki
Czy faktycznie z nowym modelem jest aż tak dobrze? jeżeli wierzyć rankingowi na LM Arenie – to jak najbardziej. Tutaj nano banana dostał 1362 punkty, podczas gdy wyniki wszystkich innych modeli są poniżej 1200 puntów. Qwen Image Edit, darmowy model od Alibaby, o którym niedawno pisaliśmy, a który był ostatnio bardzo chwalony, dostał raptem 1145 punktów.
A przypomnijmy, iż ranking LM Areny powstaje w oparciu o porównania anonimowych modeli. Użytkownicy oceniają, który z 2 modeli jest lepszy, nie wiedząc, jakie modele są testowane. Jest to więc ranking mało podatny na sympatie i uprzedzenia użytkowników.
Matt Berman, znany podcaster komentujący wydarzenia ze świata AI i często testujący różne modele nazywa nowy model od Google najlepszym modelem do edycji grafiki jaki kiedykolwiek wypróbowywał.
Co, według Google, potrafi Gemini 2.5 Flash Image? Możemy na przykład wgrać zdjęcie osoby i poprosić o umieszczenie jej w innym kontekście. Może to być na przykład torreador, artyst czy aktor z serii komediowej z lat 90. poprzedniego stulecia. Możemy również wgrać dwa zdjęcia i poprosić o stworzenie obrazka, który by łączył postaci z obu zdjęć.
Google poleca również umiejętności do edycji grafiki w kilku krokach. Możemy sobie wirtualnie „umeblować” pokój, korzystając ze zdjęcia pustego pomieszczenia a następnie dodając kolejne elementy. Tylko pamiętajcie, iż to obrazki poglądowe a nie gotowy projekt. Jak pokazują testy Matta Bermana, nano banana nie zawsze sobie świetnie radzi z zachowaniem proporcji między przedmiotami. jeżeli zbyt zaufamy AI, to może się okazać, iż upragniona kanapa nam się po prostu do pokoju nie zmieści…
Nano banana może się też okazać przydatnym narzędziem dla projektantów. Może przenieść styl z jednego obrazka na obiekt na drugim obrazku. Na przykład – wzór ze skrzydeł motyla na suknię.
Wszystkie zmodyfikowane przez model obrazki mają widoczny znak wodny „ai” i niewidoczny cyfrowy znak wodny SynthID.
Nano banana – jak skorzystać?
A teraz podstawowa informacja – gdzie możemy korzystać z nowego modelu? Przede wszystkim w aplikacji mobilnej Gemini. Jak się wydaje, jeszcze nie jest to opcja dla wszystkich. Moja apka Gemini i owszem edytuje zdjęcia, ale mniej imponująco a znakiem wodnym nie jest napis 'ai’ tylko ikonka Gemini, co sugeruje, iż na mój telefon aktualizacja modeli Google jeszcze nie dotarła.
Jeśli jesteście niecierpliwi, a nano banana nie pojawiła się jeszcze na waszym telefonie, to możecie spróbować w Google AI Studio – ale musicie się liczyć z ograniczeniami ilościowymi. jeżeli jeszcze nie korzystaliście z tej opcji dostępu do modeli Google, to szczerze polecam – często pozwala ona na testowanie modeli niedostępnych gdzie indziej.
Model jest również dostępny dla płacących klientów przez API Gemini i w platformie Vertex AI. Na razie nie pozostało dostępny przez internetową stronę Gemini.
Źródło grafiki: Google