Rosnące zużycie energii przez systemy sztucznej inteligencji stało się jednym z największych wyzwań technologicznych dekady. Firmy technologiczne i start-upy intensyfikują prace nad nową generacją chipów AI, które mają zrewolucjonizować efektywność energetyczną i ograniczyć uzależnienie rynku od Nvidii. Stawka jest wysoka, a bez przełomowych innowacji przyszłość rozwoju AI może napotkać poważne bariery.
Nowe układy AI w walce o efektywność energetyczną
Wzrost zapotrzebowania na energię przez systemy AI szacowany jest na 50% rocznie do 2030 roku. Odpowiedzią na te prognozy są prace nad specjalistycznymi mikroprocesorami, zdolnymi do realizacji tzw. Inferencji, czyli generowania wyników przez wytrenowane modele, przy znacznie niższym zużyciu energii.
Największe wyzwanie stanowi obsługa coraz bardziej złożonych modeli generatywnych, których wymagania mogą niedługo przewyższyć możliwości dzisiejszych centrów danych. Z tego powodu zarówno start-upy, jak i giganci branży IT, w tym Google, Amazon oraz Microsoft, inwestują w rozwój autorskich rozwiązań sprzętowych.
Start-upy kontra Nvidia
Rynek chipów AI zdominowany jest w tej chwili przez Nvidię, która narzuca tempo innowacji i poziom cen. Jednak firmy takie jak Positron i Groq również budują własne, wysoce wyspecjalizowane procesory. Positron deklaruje, iż jego nowa generacja układów zapewnia od dwóch do trzech razy wyższą wydajność na wydanego dolara oraz choćby sześciokrotnie większą efektywność energetyczną w porównaniu do zapowiadanego układu Nvidia Vera Rubin.
Groq obrał inną drogę, integrując pamięć bezpośrednio w strukturę chipu, co radykalnie ogranicza straty energii i czas przetwarzania wynikające z przesyłania danych między procesorem a pamięcią. Z kolei Positron koncentruje się na uproszczeniu architektury i ścisłej specjalizacji, aby maksymalnie przyspieszyć wybrane zadania AI. Podejście to przypomina rewolucję, jaką niegdyś wniosły pierwsze układy GPU do grafiki komputerowej.
Giganci technologiczni przyspieszają inwestycje w autorskie układy
Google, Amazon oraz Microsoft nie czekają na rozwiązania start-upów. Inwestują ogromne środki w rozwój własnych chipów do obsługi inferencji, chcąc uniezależnić się od Nvidii i lepiej kontrolować koszty w swoich chmurach obliczeniowych. Przykładem mogą być układy Google TPU Ironwood oraz Amazon Inferentia czy Trainium, które już teraz obsługują duże modele AI wewnątrz centrów danych tych firm.
Własne procesory nie tylko zwiększają przewidywalność kosztów i wydajności, ale są także udostępniane klientom zewnętrznym. Pozwala to budować nowe źródła przychodów i tworzyć przewagi konkurencyjne na globalnym rynku usług chmurowych.

Bariera energetyczna
Eksperci ostrzegają, iż choćby najbardziej zaawansowane układy mogą nie nadążyć za rosnącymi wymaganiami generatywnej AI. Kluczowym ograniczeniem niedługo może stać się nie wydajność sprzętu, a możliwości produkcji i dostarczania energii elektrycznej do centrów danych. Google czy Microsoft rozważają już inwestycje w elektrownie jądrowe i projekty fuzji jądrowej, by w przyszłości zabezpieczyć zapotrzebowanie na moc obliczeniową.
W opinii branży, tylko połączenie innowacji sprzętowych oraz transformacji energetyki pozwoli uniknąć poważnych ograniczeń w dalszym rozwoju AI.
Pilotaż Cloudflare to pierwszy sprawdzian dla Positron
Na pierwszej linii testów nowych układów znalazła się firma Cloudflare, obsługująca kluczową infrastrukturę internetową na świecie. Jej dyrektor ds. sprzętu Andrew Wee, wcześniej związany z Apple i Meta, uznał technologię Positron za jedną z nielicznych alternatyw, które warto testować na masową skalę. Wyniki pilotażu są na tyle obiecujące, iż Cloudflare rozważa wdrożenie tych układów globalnie. jeżeli projekt się powiedzie, może to przyspieszyć odejście od jednostronnej dominacji Nvidii i wymusić większe inwestycje w efektywność energetyczną na całym rynku.
Energooszczędność AI
Stawka rosnącego wyścigu o nowe chipy AI nie ogranicza się do rywalizacji firm. Od efektywności tych rozwiązań zależy tempo innowacji, koszty usług cyfrowych oraz możliwość dalszego rozwoju kluczowych technologii – od automatyzacji przemysłu po zaawansowane systemy analityczne. W nadchodzących latach sektor półprzewodników i energetyki będzie musiał ściśle współpracować, by sprostać rosnącym wymaganiom cyfrowego świata.