AWS re:Invent 2025: Autonomiczne agenty, Trainium3 oraz AI Factories

itreseller.com.pl 8 godzin temu

Pierwsze dwa dni konferencji AWS re:Invent 2025 w Las Vegas pokazały, iż Amazon Web Services chce być nie tylko dostawcą chmury, ale pełnym dostawcą stosu dla sztucznej inteligencji. Firma zaprezentowała nową generację modeli Amazon Nova, autonomicznych agentów klasy Frontier oraz infrastrukturę Trainium3 i AI Factories dla obciążeń w ultra skali. W tle widać wyraźny sygnał dla konkurentów, iż AWS stawia na agentowe systemy AI, które mają realnie pracować za ludzi, a nie tylko generować tekst.

Nova 2, Nova Forge i Nova Act, czyli od modeli do agentów

AWS znacząco rozbudował rodzinę modeli Amazon Nova, wprowadzając cztery nowe warianty Nova 2 Lite, Nova 2 Pro, Nova 2 Sonic i Nova 2 Omni. Mają one obsługiwać zaawansowane wnioskowanie, zadania multimodalne, dialog w czasie rzeczywistym oraz złożone scenariusze agentowe, od generowania kodu po automatyzację procesów biznesowych.

Nowością o strategicznym znaczeniu jest Nova Forge usługa otwartego szkolenia, która pozwala organizacjom tworzyć własne warianty modeli Nova z użyciem ich danych i wiedzy.

Kolejnym elementem układanki jest Nova Act, ogólnodostępna usługa do tworzenia i wdrażania agentów AI automatyzujących złożone sekwencje działań w interfejsach użytkownika. AWS deklaruje, iż w testach z klientami agenci zbudowani w Nova Act osiągają około 90% niezawodności w rzeczywistych procesach roboczych, co ma pozwalać na wdrażanie ich w produkcji, a nie jedynie w eksperymentach. Według oficjalnych danych AWS jest to poziom przewyższający konkurencyjne rozwiązania tego typu.

Równolegle Amazon Bedrock otrzymał największe jak dotąd rozszerzenie o 18 nowych w pełni zarządzanych modeli otwartych. W sumie platforma oferuje już blisko 100 modeli dostępnych w trybie bezserwerowym, w tym cztery modele od Mistral AI, które debiutują na Bedrock. To wyraźna odpowiedź na zapotrzebowanie dużych firm, które chcą łączyć modele zamknięte, otwarte i własne w jednym środowisku.

AWS re:Invent 2025 Photo Copyright Noah Berger

Frontier Agents i AgentCore nowa warstwa operacyjna dla biznesu

Najmocniejszym akcentem pierwszych dni re:Invent 2025 są Frontier Agents, nowa klasa agentów AI zdolnych pracować autonomicznie przez wiele godzin, a choćby dni, bez ingerencji człowieka. AWS pokazał trzy konkretne przykłady: Kiro jako wirtualnego programistę, AWS Security Agent jako doradcę do spraw bezpieczeństwa oraz AWS DevOps Agent jako zespół operacyjny na wezwanie. Ci agenci nie są jedynie chatbotami, ale oprogramowaniem, które ma samodzielnie podejmować decyzje, korzystać z narzędzi i finalizować zadania.

Fundamentem dla tej wizji jest Amazon Bedrock AgentCore, platforma do wdrażania agentów w sposób bezpieczny i kontrolowany. Wprowadzono w niej kilka kluczowych funkcji: Policy pozwala zespołom definiować w języku naturalnym, co agent może zrobić, a czego ma unikać, co ogranicza ryzyko nieautoryzowanych działań. AgentCore Evaluations udostępnia trzynaście gotowych narzędzi do oceny jakości, które automatycznie pobierają próbki interakcji i zgłaszają spadek jakości, a AgentCore Memory dodaje pamięć operacyjną, dzięki której agenci uczą się na bazie wcześniejszych doświadczeń i interakcji z użytkownikami.

W praktyce widać już realne wdrożenia. Sony wykorzystuje wewnętrzną platformę AI opartą na AgentCore, przetwarzając w tej chwili około 150 000 żądań dziennie i planując skokowy wzrost obciążenia. Klienci tacy jak Commonwealth Bank of Australia, SmugMug czy Western Governors University używają agentów Frontier do modernizacji systemu i procesów operacyjnych.

AWS re:Invent 2025 Photo Copyright Noah Berger

Trainium3, P6e GB300 i AI Factories

Nowe możliwości agentów i modeli wymagają adekwatnej infrastruktury. AWS pokazał EC2 Trn3 UltraServers oparte na chipie Trainium3, które według danych firmy zapewniają 4,4 x większą moc obliczeniową, czterokrotnie lepszą efektywność energetyczną i niemal czterokrotnie większą przepustowość pamięci w porównaniu z poprzednią generacją. Z rozwiązania korzysta już między innymi Anthropic. Jednocześnie zapowiedziano układ Trainium4, który ma przynieść co najmniej sześciokrotny wzrost wydajności przetwarzania.

Dla najbardziej wymagających obciążeń inferencyjnych wprowadzono instancje P6e GB300 UltraServers z architekturą NVIDIA GB300 NVL72, zaprojektowane do obsługi modeli liczących biliony parametrów. To oferta dla klientów, którzy chcą utrzymywać bardzo duże modele w jednym środowisku chmurowym, bez potrzeby dzielenia ich między wielu dostawców.

Nowością o dużym znaczeniu regulacyjnym są AWS AI Factories. Jest to usługa, która dostarcza kompletną infrastrukturę AI AWS, łącznie z procesorami graficznymi Nvidii, układami Trainium, sieciami i usługami, bezpośrednio do centrów danych klienta. Fabryki AI działają jak prywatny region AWS, co umożliwia budowę suwerennych środowisk AI w sektorach o ścisłych wymaganiach dotyczących lokalizacji danych, takich jak administracja publiczna czy finanse.

AWS re:Invent 2025 Photo Copyright Noah Berger

Dane, wielochmura i ekosystem partnerów

W warstwie danych AWS przedstawił Amazon S3 Vectors, usługę do natywnego przechowywania i wyszukiwania wektorów w S3. Pojedynczy indeks może obejmować do dwóch miliardów wektorów, a całość skaluje się do dwudziestu bilionów wektorów na jeden bucket. AWS deklaruje przy tym dwu lub trzykrotny wzrost wydajności i redukcję kosztów choćby o 90% względem dotychczasowych rozwiązań tego typu.

Direct Connect Multi Cloud w wersji zapoznawczej z Google Cloud ma z kolei uprościć łączność wielochmurową. Jest to w pełni zarządzana usługa, która pozwala gwałtownie zestawiać prywatne połączenia o dużej przepustowości między AWS a innymi dostawcami, bez konieczności samodzielnego projektowania i utrzymywania złożonej infrastruktury sieciowej.

Istotną rolę odgrywa także ekosystem partnerów. Adobe rozszerza współpracę z AWS, wykorzystując chmurę do szkolenia i wdrażania modeli generatywnych. BlackRock udostępnia na AWS swoją platformę Aladdin, co ma umożliwić klientom zaawansowane modelowanie ryzyka i analizę portfeli. Visa i AWS wspólnie pracują nad tym, aby agenci AI mogli w sposób bezpieczny przeprowadzać transakcje w imieniu użytkowników, a S&P Global integruje swoje dane z agentami AI w środowisku AWS. Nissan raportuje skrócenie czasu testów systemu o 75% dzięki platformie opartej na AWS.

AWS re:Invent 2025 Photo Copyright Noah Berger

Marketplace, bezpieczeństwo i inicjatywy non profit

AWS Marketplace zyskuje funkcje generatywne, w tym wyszukiwanie oparte na AI oraz narzędzia, które pomagają klientom szybciej znajdować i łączyć oferty wielu dostawców. Wprowadzono także nowe kompetencje w obszarze sztucznej inteligencji agentowej w kategoriach aplikacje, narzędzia i usługi konsultingowe, które mają wyróżniać partnerów specjalizujących się w systemach AI podejmujących działania przy minimalnej interwencji człowieka.

W obszarze bezpieczeństwa CrowdStrike jako pierwszy partner cyberbezpieczeństwa dostarczył ulepszoną wersję SaaS Quick Launch dla Falcon Next Gen SIEM, a usługa Falcon Cloud Security jest dostępna w modelu płatności za faktyczne zużycie. Według danych Omdia partnerzy AWS mogą generować średnio 7,13 USD przychodów z usług na każdy 1 USD sprzedanej technologii AWS, co pokazuje, jak silnie firma buduje swój kanał partnerski.

Nie zabrakło również akcentów społecznych. Bonterra GiveGab Giving Platform i Amazon Business Solution Donation Driver ogłosiły wspólną ofertę platformy darowizn opartej na AWS, przygotowaną na Giving Tuesday. AWS przedstawił także laureatów programu grantowego Imagine 2025 dla organizacji non profit, które wykorzystują chmurę do rozwiązywania globalnych problemów, między innymi w obszarze zdrowia dzieci.

Pierwsze dni reInvent 2025 jasno pokazują, iż AWS chce przejąć inicjatywę w wyścigu o biznesowe zastosowania AI, łącząc własne modele, agentów, sprzęt i ekosystem partnerów w jeden spójny stos technologiczny. Dla klientów oznacza to większy wybór, ale także konieczność przemyślenia strategii, w której agenci AI będą coraz częściej nie dodatkiem, ale pełnoprawnym uczestnikiem procesów biznesowych.

Idź do oryginalnego materiału