XAI podwaja moc superkomputera Colossus — w sumie będzie to 200 tys. GPU!

itbiznes.pl 2 tygodni temu
Zdjęcie: Elon Muska xAI Colossus Nvidia


Elon Musk nie przestaje wyznaczać nowych granic w rozwoju technologii sztucznej inteligencji. Jego firma xAI ogłosiła ambitny plan rozbudowy superkomputera Colossus, znajdującego się w Memphis, Tennessee, z pierwotnych 100 tys. układów GPU Hopper do imponujących 200 tys! Decyzja ta zbiega się z zapowiedzią, iż Colossus stanie się jednym z najpotężniejszych na świecie superkomputerów dedykowanych sztucznej inteligencji, zdolnym do obsługi zadań obliczeniowych wymaganych przez zaawansowane modele AI.

NVIDIA i Spectrum-X – nowoczesna technologia dla maksymalnej wydajności

Podstawą tej imponującej mocy obliczeniowej jest technologia Spectrum-X od NVIDIA, zapewniająca wydajność i niezawodność w obsłudze dużych obciążeń obliczeniowych. Infrastruktura Colossus, zamiast standardowej sieci InfiniBand, oparta jest na platformie ethernetowej Spectrum-X z wykorzystaniem RDMA (Remote Direct Memory Access), co umożliwia bezstratny przepływ danych na poziomie 95%.

Jak podkreślił Gilad Shainer, wiceprezes ds. sieci w NVIDIA – AI staje się kluczowa dla biznesu i wymaga zwiększonej wydajności, bezpieczeństwa, skalowalności i efektywności kosztowej.

Dzięki zastosowaniu Spectrum-X xAI może szybciej przetwarzać, analizować i realizować złożone zadania AI, co przyspiesza rozwój i wdrożenie rozwiązań opartych na sztucznej inteligencji.

Każdy z układów GPU w superkomputerze Colossus posiada własny kontroler Nvidia BlueField-3 SuperNIC o przepustowości 400 GbE, współpracujący z przełącznikami Spectrum-X SN5600 o przepustowości 800 Gbps. Dzięki tak zaawansowanej konfiguracji Colossus osiąga wysokie przepustowości i eliminuje problem opóźnień czy strat pakietów, co jest istotne przy obciążeniach dla setek tysięcy GPU.

Colossus to centrum sztucznej inteligencji w dawnym zakładzie produkcyjnym

Superkomputer Colossus, mieszczący się na terenie dawnego zakładu Electrolux o powierzchni około 69,700 m², został zmontowany w niespełna 122 dni. Musk ogłosił, iż system został uruchomiony 22 lipca 2024 roku, a błyskawiczne tempo realizacji tego projektu przyciągnęło uwagę całego świata technologii, a także komentarze ze strony samego CEO NVIDIA, Jensena Huanga, który określił Musk’a mianem „nadludzkiego” za jego niebywałe zdolności organizacyjne i techniczne.

Rozbudowa infrastruktury Colossus ma przynieść korzyści nie tylko w zakresie mocy obliczeniowej, ale także pozwolić na rozwój rodziny dużych modeli językowych Grok, z których xAI korzysta, aby rozwijać działalność w zakresie sztucznej inteligencji. Musk sam potwierdził na platformie X (dawniej Twitter), iż obiekt w Memphis przekształca się w ogromny klaster składający się z 200 tys. układów H100 i H200 – wszystko pod jednym dachem.

Kontrowersje związane z wpływem na środowisko i społeczność lokalną

Mimo entuzjazmu związanego z technologicznymi osiągnięciami xAI nie brakuje głosów krytyki. Firma spotkała się z zarzutami dotyczącymi braku konsultacji z mieszkańcami Memphis, którzy obawiają się negatywnych skutków działalności tak dużego obiektu w swoim sąsiedztwie. Obawy dotyczą również wpływu na środowisko, zwłaszcza iż Colossus jest zasilany energią pochodzącą z gazu, co budzi wątpliwości ekologów.

Elon Musk jest też krytykowany za zastosowanie tysięcy układów GPU, które były przeznaczone dla publicznej spółki Tesla, na potrzeby prywatnych przedsięwzięć, takich jak xAI oraz platformy społecznościowej X. Decyzja ta wywołała obawy o przejrzystość alokacji zasobów w przedsiębiorstwach Musk’a oraz o to, w jaki sposób jego prywatne projekty mogą wpływać na działalność i interesy akcjonariuszy Tesli.

xAI i NVIDIA – kooperacja dla przyszłości AI

Rozbudowa superkomputera Colossus jest dowodem na rosnące zapotrzebowanie na moc obliczeniową w sektorze sztucznej inteligencji. Partnerstwo xAI i NVIDIA wyznacza nowe standardy, które mogą być punktem odniesienia dla innych firm technologicznych dążących do wdrażania zaawansowanych systemów AI. Dzięki wsparciu NVIDIA oraz nowoczesnym technologiom sieciowym Spectrum-X xAI staje się jednym z liderów na polu sztucznej inteligencji, co bez wątpienia wpłynie na dalszy rozwój tej dynamicznej branży.

W dobie gwałtownie rosnących potrzeb obliczeniowych oraz nieustannie rozwijających się technologii sztucznej inteligencji Colossus jako największy superkomputer AI nie tylko wzmocni pozycję xAI na rynku, ale również przyczyni się do postępu w rozwoju i wdrożeniu rozwiązań AI na szeroką skalę. Czekamy na ruch konkurencji.

Źródło: X, Nvidia, DCD

Idź do oryginalnego materiału