Gemini 3 zmienia zasady gry? Co potrafi nowy model AI

instalki.pl 4 miesięcy temu

Google właśnie zaprezentowało Gemini 3 – najnowszą generację swojego AI, którą firma opisuje jako przełomową jeżeli chodzi o multimodalne rozumowanie. Model ma „pamiętać” bardzo duży kontekst, lepiej rozumieć polecenia i trafniej generować odpowiedzi.

Producent chwali się, iż Gemini 3 zajmuje czołowe pozycje w benchmarkach. Aktualizacja stopniowo zostanie wdrożona do wyszukiwarki w trybie AI, aplikacji Gemini, AI Studio i Vertex AI. Google przedstawiło też coś dla miłośników vibe-codingu: deweloperską platformę agentową.

Co potrafi Gemini 3?

Google opisuje Gemini 3 jako model charakteryzujący się „najnowocześniejszym rozumowaniem” i multimodalny – łączący tekst, obraz, wideo, audio i kod. Ma osiągać znaczną przewagę nad konkurencją w benchmarkach takich jak LMArena (1501 pkt). Gemini 3 potrafi obsługiwać kontekst do około 1 miliona tokenów, co pozwala analizować bardzo długie dokumenty i duże zbiory danych.

„Model ten wykazuje zdolność rozumowania na poziomie doktoranckim, uzyskując najwyższe wyniki w testach Humanity’s Last Exam (37,5% bez użycia narzędzi) i GPQA Diamond (91,9%). Wyznacza też nowy standard dla modeli granicznych w matematyce, osiągając nowy stan wiedzy na poziomie 23,4% w MathArena Apex”.

Twórcy zdają sobie sprawę, iż użytkownicy mają już dosyć modeli-przytakiwaczy. Gemini 3 „zamiast banałów i pochlebstw oferuje prawdziwe spostrzeżenia” – twierdzą. Nowy model może się też pochwalić przydatnymi funkcjami agentowymi.

Wariant Deep Think i platforma agentowa Antigravity

Wraz z Gemini 3 Google wprowadza warianty Pro i Deep Think, które według firmy jeszcze bardziej podnoszą zdolności rozumowania i rozwiązywania złożonych problemów. To ma pomóc w zadaniach wymagających wieloetapowego myślenia. Firma chwali się jeszcze lepszymi osiągami tych wariantów:

„Gemini 3 Deep Think […] może się poszczycić imponującymi wynikami w kategoriach Humanity’s Last Exam (41,0% bez użycia narzędzi) i GPQA Diamond (93,8%). Osiąga też bezprecedensowy wynik 45,1% w teście ARC-AGI (z wykonywaniem kodu).”

Gemini 3 ma wyróżniać się wyjątkową efektywnością w vibe-codingu. Ale Google przygotowało dla programistów coś jeszcze. Przedstawia deweloperską platformę agentową Antigravity, która ma ułatwić pracę z kodem. Platforma ma „spełniać obietnicę realizacji dowolnego pomysłu programistów”. Agenci Gemini na platformie mają dostęp jednocześnie do edytora kodu, terminala i przeglądarki, dzięki czemu tworzą, testują i poprawiają projekty na bieżąco. Dodatkowym atutem jest integracja z Nano Banana – modelem generującym i edytującym grafiki.

Przykłady

Google we wpisie podaje konkretne przykłady użycia, które dobrze obrazują co potrafi model:

Tworzenie interaktywnych fiszek na podstawie artykułów naukowych lub wykładów
Generowanie wizualizacji na podstawie tekstu lub kodu
Analiza wideo meczów sportowych – identyfikacja obszarów do poprawy i generowanie planu treningowego
Tłumaczenie odręcznych przepisów kuchennych w różnych językach i stworzenie rodzinnej książki kucharskiej
Kodowanie gier: np. retro gra 3D statku kosmicznego z lepszą wizualizacją i interakcją
Tworzenie szczegółowej grafiki wokselowej 3D i shaderów
Realizacja złożonych wieloetapowych procesów: np. porządkowanie skrzynki Gmaila lub planowanie podróży

Wątpliwości i wyzwania

Choć wyniki benchmarków robią wrażenie, eksperci przypominają, iż testy syntetyczne nie zawsze odzwierciedlają realne ryzyko błędów merytorycznych czy stronniczości. Dodatkowo model o ogromnym oknie kontekstu i agentowych funkcjach stawia wyzwania infrastrukturalne i kosztowe – korzystanie z wariantów Pro/Deep Think prawdopodobnie będzie wymagać znacznych zasobów obliczeniowych.

Dostępność

Google informuje, iż Gemini 3 będzie integrowane stopniowo: część funkcji jest już dostępna w trybie AI w wyszukiwarce, aplikacji Gemini oraz dla deweloperów w AI Studio i Vertex AI. Tryby Pro i Deep Think trafią najpierw do wybranych testerów i klientów, a ich dostępność regionalna może być ograniczona – niektóre redakcje zwracają uwagę na to, iż użytkownicy w Polsce mogą dłużej czekać na pełne udostępnienie wszystkich opcji.

Źródło: Blog Google Polska

AIGeminigooglesztuczna inteligencja

Idź do oryginalnego materiału