Gemini Advanced robi największe wrażenie, gdy współpracuje z Google

cyberfeed.pl 2 miesięcy temu


Chatboty zajmują trudne dla użytkowników miejsce – muszą być wyszukiwarką, narzędziem do tworzenia i asystentem jednocześnie. Jest to szczególnie prawdziwe w przypadku chatbota pochodzącego od Google, który coraz bardziej liczy na sztuczną inteligencję jako uzupełnienie swojej wyszukiwarki, asystenta głosowego i niemal każdego narzędzia zwiększającego produktywność w swoim arsenale.

W tej chwili ostateczną wersją sztucznej inteligencji Google jest Gemini Advanced, która została wprowadzona w zeszłym tygodniu dla użytkowników, którzy chcą płacić 20 dolarów miesięcznie za ten przywilej – tyle samo, ile OpenAI pobiera za ulepszony ChatGPT Plus. Odłożyłem więc 20 dolarów i postanowiłem zobaczyć, jak Gemini Advanced poradzi sobie z usługami konkurencji.

Starszy był Bliźnięta już całkiem nieźle. Można w nim podsumować Szekspira, podać rekomendacje dotyczące herbat i stworzyć w miarę znośny przepis na ciasto czekoladowe. Ale nie mógł dać ci zdjęcia majestatycznego konia — przynajmniej do niedawna — i może reagować wolniej niż ChatGPT.

Teraz Gemini Advanced obiecuje zrobić więcej niż tylko odpowiadać na pytania lub publikować streszczenia książek w Cliffs Notes. Gemini Advanced działa na potężniejszym modelu sztucznej inteligencji – Gemini Ultra – który ma pozwolić mu tłumaczyć tekst, obsługiwać wiele instrukcji w jednym zdaniu i generować obrazy z bardziej złożonych podpowiedzi.

Ostatecznie odkryłem, iż Gemini Advanced działa zgodnie z obietnicą — po prostu nie robi niektórych z tych rzeczy zbyt dobrze. Jego konkurentowi, ChatGPT Plus, udaje się generować mniej przerażające zdjęcia dzięki integracji z DALL-E 3. Ale Gemini Advanced, choćby lepiej niż Gemini, lepiej informuje użytkowników o bieżących wydarzeniach, a dzięki Mapom Google dostarcza choćby lepszych informacji o firmach, których szukają ludzie. Płatne Gemini często lepiej radzą sobie z tego rodzaju „zadaniami Google” niż generatywne zadania AI.

Uzyskanie spójnych i dokładnych wyników z tych chatbotów wymaga jeszcze dużo pracy, a ludzie muszą przez cały czas z nich korzystać, aby boty uczyły się, jak najlepiej odpowiadać na pytania. Oto kilka testów, które przeprowadziłem, aby zobaczyć, jak się trzymają.

ChatGPT Plus kontra Gemini Advanced

Narysuj mi obrazek przedstawiający biały złoty bazgroł biegnący przez pole stokrotek przy świecącym słońcu

Co dziwne, być może ze względu na specyfikę podpowiedzi, oba chatboty zwróciły bardzo podobnie wygenerowane obrazy. Zdjęcie psa Gemini Ultra przyniosło jednak coś jeszcze Skraj pracownicy określili to mianem „mniejszego horroru”. Jego pies ma dwa języki i dodatkową kończynę. Za bardzo uwypuklił fakturę futra, przez co wygląda… obłędnie. Nie wiem, czy taki piesek przez cały czas radośnie bawiłby się na polu stokrotek. Tymczasem ChatGPT wywołuje DALL-E 3 w celu wygenerowania obrazów. Jego pies nie wywołuje przerażenia, ale przez cały czas widać, iż to zdjęcie cyfrowe.

Jaki śliczny pies! Czekaj, czy to dwa języki? Nie…

DALL-E 3 i ChatGPT nie śniły mi się po nocach.

Przetłumacz to: Panatang makabayan, iniibig ko ang Pilipinas, tahanan ng aking lahi

Google stwierdziło, iż Gemini Ultra zostało stworzone do obsługi „bardzo złożonych zadań”, więc zapytałem Gemini Advanced, jakie to zadania. Chatbot odpowiedział: „Tłumaczenie”. Poprosiłem więc firmę Gemini Advanced o przetłumaczenie kilku pierwszych linijek filipińskiej przysięgi patriotycznej. To dość niejasna przysięga, zwłaszcza iż znana mi wersja była w ciągu ostatnich 20 lat kilkakrotnie zmieniana.

Firma Gemini Advanced natychmiast odpowiedziała, iż ​​chociaż jest „przeszkolona w zakresie reagowania w podzbiorze języków”, nie może mi pomóc w spełnieniu mojej prośby. Zapytałem, jakie języki obsługuje, ale chatbot odmówił odpowiedzi, twierdząc, iż nie może podać ostatecznej listy języków, które rozumie. Następnie zapytałem Gemini Advanced, czy zna język filipiński, i odpowiedział pozytywnie. Oficjalnie jednakGoogle nie wyświetla filipińskiego wśród 40 języków w tej chwili obsługiwanych przez Gemini.

Zmień tło tego zdjęcia na zwykłe różowe tło

Nawiedzony obrazem zmutowanych psów biegających po kwiatowych polach, musiałem oczyścić podniebienie. Przesłałem więc zdjęcie psa mojej przyjaciółki, Sundae, żeby wyglądało, jakby brała udział w sesji zdjęciowej. Poprosiłem oba chatboty o usunięcie istniejącego tła i zastąpienie go różowym. To był ten, który testowałem w porównaniu z ChatGPT Plus, ponieważ DALL-E 3 powinien móc po prostu edytować zdjęcia. Mogłem niechcący zepsuć oba chatboty, ponieważ żaden nie był w stanie dać mi tego, o co prosiłem. Zamiast tego Gemini przerobiło wcześniejsze zdjęcie złotego bazgrołu ze stokrotkami, ale tym razem z różowym tłem. ChatGPT nie mógł niczego wygenerować, stwierdzając, iż analiza monitu trwała zbyt długo.

Kolejny pies z pokolenia Bliźniąt.

Jaka jest dobra restauracja filipińska w Nowym Jorku? Jaka jest dobra restauracja etiopska w Nowym Jorku?

Gemini Advanced może korzystać z innych produktów Google, co zadziałało na jego korzyść, gdy w przypadku obu pytań wykorzystano Mapy Google. Pojawiło się zestawienie kilku restauracji filipińskich i etiopskich w Nowym Jorku, załączając współrzędne każdej z nich w Mapach Google.

Kilka dni temu poprosiłem ChatGPT Plus o rekomendacje restauracji – nie na potrzeby tego testu, po prostu szukałem nowych restauracji – i wyniki były niedokładne. Nazwy restauracji były prawidłowe – były to lokale, które istnieją – jednak żadna z lokalizacji nie była adekwatna. Ponownie poprosiłem ChatGPT Plus o wykonanie tego testu i uzyskałem znacznie dokładniejsze lokalizacje, ale mniejszą listę restauracji. Zatem w tym przypadku Gemini wyraźnie lepiej spełniło tę prośbę.

Podsumuj te akapity, a następnie napisz na ten temat artykuł na 150 słów

Jednym z głównych powodów, dla których ktoś taki jak ja korzysta z chatbota, jest streszczanie skomplikowanych dokumentów. Nakarmiłem Gemini Advanced dwa akapity od Najnowsza publikacja Apple NA Edycja obrazu AI. Gazeta rozbolała mnie od pierwszego przeczytania, więc pomyślałem, iż Bliźniakom będzie łatwo przekazać mi przynajmniej sedno. Aby w pełni przetestować jego nowe możliwości, chciałem również zobaczyć, jak chatbot łączy dwie różne instrukcje. Jeden z nich prosił o podsumowanie; drugim jest wygenerowanie tekstu.

Podsumowanie było… zadowalające. Rzeczywiście dało mi to ogólny zarys koncepcji omawianych w tych dwóch akapitach, ale nie „przełożyło” tego na prosty język. Prawdopodobnie powinienem był o to skłonić. Następnie Gemini zaczął pisać artykuł, o który prosiłem, i wiesz co? Te 150 słów wyjaśniło sprawę o wiele lepiej niż streszczenie, o które prosiłem.

Gemini Advanced jest w stanie. Nie można zaprzeczyć, iż działa znacznie lepiej niż Gemini z niższego poziomu. Zdecydowanie działa najlepiej, gdy jest zintegrowany z innymi produktami Google, takimi jak wyszukiwarka i Mapy. Jednak w przypadku bardziej „kreatywnych” żądań multimodalnych – na przykład obejmujących obrazy – Gemini ma przed sobą długą drogę. Chatbot rozumie dłuższe ciągi instrukcji, ale po dodaniu zdjęć prawdopodobnie lepszym rozwiązaniem będzie wybranie modelu sztucznej inteligencji zaprojektowanego specjalnie do tworzenia zdjęć.



Source link

Idź do oryginalnego materiału