
Na naszych oczach dzieje się historia. Na Międzynarodowej Stacji Kosmicznej przetestowano robota Astrobee, który w przyszłości ma zająć miejsce astronautów.
Amerykańskie Laboratorium Badawcze Marynarki Wojennej (NRL) ogłosiło, iż na Międzynarodowej Stacji Kosmicznej (ISS) pomyślnie przeprowadzono test robota Astrobee, który sam poruszał się w środowisku pozbawionym grawitacji.
Mały, niepozorny robot Astrobee, przypominający wielkością piłkę do siatkówki, samodzielnie odłączył się od swojej stacji dokującej, wykonał kilka manewrów w warunkach mikrograwitacji, a następnie wrócił na miejsce. Brzmi prosto? Cała sztuka w tym, iż zrobił to całkowicie sam, bez pomocy człowieka, korzystając wyłącznie z algorytmów sztucznej inteligencji i metod tzw. uczenia przez wzmacnianie (reinforcement learning, RL). To pierwszy w historii udany autonomiczny lot robota w przestrzeni kosmicznej.
Uczenie przez wzmacnianie to rodzaj uczenia maszynowego, w którym agent, a w tym przypadku robot, otrzymuje zadanie do wykonania i jest nagradzany w zależności od tego, jak dobrze je wykona. Agent nie otrzymuje instrukcji, jak wykonać zadanie, ale uczy się metodą prób i błędów, aby zmaksymalizować swoją nagrodę.
No dobrze, bardziej dociekliwi czytelnicy mogą zauważyć, iż roboty w kosmosie to nie nowość. Łaziki czy sondy mogą by również traktowane jako roboty. Tym razem chodzi jednak o robota, takiego jak sobie go zwykle wyobrażamy, czyli wszechstronną maszynę, która sama się porusza i wykonuje niemal dowolne zadane przez nas polecenia.
Jak wyglądał kosmiczny egzamin?
Eksperyment przeprowadzono 27 maja 2025 r., ale dopiero teraz ujawniono jego szczegóły. Było to pionierskie wykorzystanie uczenia przez wzmacnianie do sterowania robotami latającymi swobodnie w środowisku zerowej grawitacji w kosmosie. Uczenie przez wzmacnianie może umożliwić robotom wykonywanie bardzo złożonych zadań, takich jak montaż dużych teleskopów kosmicznych i stacji nadawczych energii słonecznej.

Był to dowód na to autonomiczne roboty mogą być przydatne w eksploracji kosmosu i logistyce kosmicznej, a także na to, iż roboty mogą uczyć się nowych zachowań (niezbędnych do wykonania misji) w ciągu kilku minut lub godzin.
Definitywnie udowodniliśmy zasadność wykorzystania uczenia się przez wzmacnianie do sterowania robotami kosmicznymi. To osiągnięcie jest przełomowe, ponieważ potwierdza naszą zdolność do wdrażania wysoce złożonych zachowań autonomicznych, torując drogę nowej erze zaawansowanych operacji i usług robotycznych na orbicie – mówi dr Samantha Chapin, specjalistka ds. robotyki kosmicznej.
Ten test stanowił istotny przełom naukowy: udaną demonstrację złożonych algorytmów robotyki w środowisku kosmicznym. Algorytmy zadziałały bezbłędnie już przy pierwszej próbie, a to rzadkość w robotyce.
Więcej na Spider’s Web:
Kosmos potrzebuje robotów
Roboty Astrobee poruszają się dzięki wentylatorów kanałowych, czyli śmigieł zamkniętych w ochronnych klatkach, aby zapobiec ich zaczepianiu. Wyposażone w wiele kamer, zapewniają różnorodne perspektywy. Roboty noszą imiona Bumble, Honey i Queen.
Astrobee to swobodnie latające roboty zaprojektowane do pracy na Międzynarodowej Stacji Kosmicznej. Dzięki systemowi kamer pozwalają zespołom naziemnym na zdalną inspekcję sprzętu lub monitorowanie operacji bez konieczności interwencji astronautów, oszczędzając cenny czas załogi. Nasz projekt koncentruje się na wykorzystaniu swobodnie latających robotów do złożonych procesów montażu, produkcji i serwisowania w kosmosie – powiedziała dr Samantha Chapin, specjalistka ds. robotyki kosmicznej
Dodała ona, iż „aby przyspieszyć eksplorację głębokiego kosmosu i budowę na dużą skalę, pilnie potrzebujemy wyższego poziomu autonomii robotów”.
Jak uczono roboty?
Uczenia przez wzmacnianie zwykle wymaga od robota intensywnej interakcji z otoczeniem, aby się uczyć. Podejmuje on działanie, otrzymuje informacje zwrotne z otoczenia i ocenia je w oparciu o „funkcję nagrody”. Ten iteracyjny proces jest niepraktyczny w kosmosie, nie można wysłać robota w kosmos wyłącznie w celu szkolenia.

Z tego powodu zespół wykorzystał Omniverse firmy NVIDIA, niezwykle dokładny symulator fizyczny, który precyzyjnie modeluje fizykę środowiska zerowej grawitacji. Pozwoliło im to skutecznie „wyłączyć” grawitację, umożliwiając robotowi manewrowanie tak, jakby znajdował się w kosmosie. Ponieważ symulacja była tak wierna rzeczywistości, zespół z powodzeniem wypełnił lukę między symulacją a rzeczywistością: trening w symulowanym środowisku zerowej grawitacji bezpośrednio przełożył się na skuteczne dowodzenie i kontrolę nad robotem w rzeczywistych warunkach zerowej grawitacji.
W szczególności wykorzystaliśmy algorytm Proximal Policy Optimization, metodę głębokiego uczenia się przez wzmacnianie. Oznacza to, iż zastosowaliśmy głębokie sieci neuronowe, a konkretnie w konfiguracji równoległej. «Sieć aktora» uczy robota wykonywania czynności takich jak manewrowanie, podczas gdy «sieć krytyczna» ocenia jego wydajność. Te dwie sieci współpracują ze sobą, aby skutecznie nauczyć robota efektywnego poruszania się w trójwymiarowym środowisku zerowej grawitacji – wyjaśnia dr Kenneth Stewart, specjalista ds. badań komputerowych.
AI w kosmosie, wojsko na Ziemi
Choć eksperyment odbył się na pokładzie ISS, NRL nie ukrywa, iż technologia może mieć także wojskowe zastosowania. Algorytmy RL pozwalają na tworzenie maszyn zdolnych działać w nieprzewidywalnych warunkach, tam, gdzie nie da się zaprogramować wszystkich scenariuszy. To może dać amerykańskim siłom zbrojnym przewagę w sytuacjach taktycznych, gdzie szybka, autonomiczna decyzja maszyny ma najważniejsze znaczenie.
Ale potencjał jest szerszy. Autonomiczne drony morskie, pojazdy lądowe czy systemy obserwacyjne – wszędzie tam, gdzie liczy się szybkość i niezależność działania, reinforcement learning może okazać się złotym standardem.
Robot, który pisze historię
Patrząc na Astrobee, trudno uwierzyć, iż to właśnie taki niewielki robot może zmienić oblicze eksploracji kosmosu. Mały sześcian z wentylatorami, kamerami i modułami nawigacyjnymi stał się pierwszą maszyną, która naprawdę „nauczyła się” latać w przestrzeni kosmicznej.
To dopiero początek. Naukowcy planują kolejne testy, bardziej złożone manewry i zadania, które z czasem mogą doprowadzić do tego, iż na orbicie czy na Księżycu zobaczymy całe roje autonomicznych robotów.