Google chce, by sztuczna inteligencja miała zastosowanie także w namacalnym świecie. Pomogą w tym dwa nowe modele (Gemini Robotics oraz Gemini Robotics-ER), które będą napędzać humanoidalne roboty. Dzięki temu zyskają one umiejętności rozumowania i postrzegania rzeczywistości tak, jak robią to prawdziwi ludzie. AI pozwoli także na skuteczniejsze wykonywanie poszczególnych zadań, a także płynniejsze reagowanie na przeróżne bodźce. Czy zatem jesteśmy blisko realizacji przerażającej wizji rodem z futurystycznych filmów?
Gemini Robotics to odpowiedź na rosnące zapotrzebowanie humanoidalnych robotów
Technologiczny gigant zasypuje nas ostatnio wieściami o rozwoju sztucznej inteligencji. Zaledwie wczoraj dawali Wam znać o powiewie świeżości dla deweloperów i twórców zaawansowanych narzędzi. Gemma 3 to zestaw modeli open source charakteryzujących się wysoką wydajnością, a także niewielkim rozmiarem. Dlatego też są wyjątkowo wszechstronne, znajdą zastosowanie zarówno na tabletach, telefonach, laptopach czy komputerach stacjonarnych.
Teraz mamy do czynienia z kolejną innowacją. Gemini Robotics to projekt wykorzystujący potencjał drzemiący w modelu językowym Gemini 2.0, który zadebiutował kilka miesięcy temu. Google przygotowało narzędzia pozwalające na kontrolowanie humanoidalnych robotów, a także usprawnianie ich zdolności. Technologiczny gigant chce sprawić, by maszyny jeszcze lepiej radziły sobie z przestrzenną orientacją. Do tego dochodzi szybsze i dokładniejsze wykonywanie poszczególnych zadań, by w przyszłości wyręczać swoich ludzkich właścicieli.
- Sprawdź także: Powstaną kolejne roboty. Pracują nad nimi twórcy Facebooka
Na poniższym materiale zobaczyć możecie dotychczasowe osiągnięcia sztucznej inteligencji, a także czynione starania, by roboty stały się bardziej zaawansowane. Google zwraca przy okazji uwagę na trzy główne cechy Gemini Robotics. Modele muszą przede wszystkim być w stanie dostosowywać się do najróżniejszych sytuacji. Kluczowa jest także interaktywność (rozumienie i reagowanie na instrukcje czy zmiany w otoczeniu) oraz zręczność (wykonywanie typowo ludzkich czynności przy użyciu rąk/palców).
Obsługa zróżnicowanych robotów i orientacja w przestrzeni
Warto mieć też na uwadze, iż nie każdy humanoidalny robot wygląda jak ten ze zdjęcia otwierającego wpis. Dlatego też postarano się, by Gemini Robotics dopasowywał się do różnych rodzajów maszyn, co zresztą zademonstrowano na powyższym, jak i poniższym materiale.
Do tego wszystkiego dochodzi model Gemini Robotics-ER skupiający się na rozumieniu rzeczywistego świata. Technologia udoskonala aspekt orientacji w przestrzeni udostępniając robotom umiejętności pokroju wskazywania czy rozpoznawania trójwymiarowych obiektów. Google podaje przykład kubka do kawy – sztuczna inteligencja analizuje przedmiot w czasie rzeczywistym, co prowadzi do płynniejszego wykonania konkretnej czynności. Chodzi o to, by tego typu czynności stały się dla humanoidalnych robotów intuicyjne.

Technologiczny moloch informuje oczywiście o poczynionych krokach w stronę zapewnienia bezpieczeństwa. Zastosowane ograniczenia i mechanizmy mają uniemożliwić maszynom przejęcie świata czy wykonanie akcji bez zgody właściciela.
Źródło: Google / Zdjęcie otwierające: Google