Szafy rackowe NVIDIA GB200 „Blackwell” borykają się z problemami z przegrzaniem

cyberfeed.pl 11 godzin temu


Nowe stojaki NVIDIA GB200 „Blackwell” (znowu) wpadają w kłopoty. Duże firmy działające w chmurze, takie jak Microsoft, Amazon, Google i Meta Platforms, ograniczają swoje zamówienia z powodu problemów z ciepłem, podaje Reuters, cytując The Information. Z raportu wynika, iż ​​pierwsze dostawy stojaków z chipami Blackwell nagrzewają się zbyt mocno i występują problemy z połączeniami między chipami. Te problemy technologiczne sprawiły, iż niektórzy klienci, którzy zamówili szafy o wartości 10 miliardów dolarów lub więcej, dwa razy zastanowili się nad zakupem.

Niektórzy wstrzymują się z zamówieniami do czasu, aż NVIDIA będzie miała lepsze wersje stelaży. Inni zamiast tego rozważają zakup starszych układów NVIDIA AI. Na przykład Microsoft planował ustawić w jednej ze swoich lokalizacji w Phoenix szafy GB200 z nie mniej niż 50 000 chipów Blackwell. Jednak The Information donosi, iż OpenAI zwróciło się do Microsoftu z prośbą o dostarczenie starszych chipów „Hopper” firmy NVIDIA, zamiast tego wskazywać na opóźnienia związane z szafami Blackwell. Problemy NVIDII z procesorami graficznymi Blackwell umieszczonymi w szafach o dużej gęstości nie są niczym nowym; w listopadzie 2024 r. Reuters, powołując się również na The Information, odkrył problemy z przegrzaniem w serwerach wyposażonych w 72 procesory. Aby rozwiązać te problemy, NVIDIA wprowadziła kilka zmian w projektach swoich szaf serwerowych, jednak wydaje się, iż problem nie został całkowicie rozwiązany.



Source link

Idź do oryginalnego materiału