Serwery NVIDIA „Blackwell” NVL72 podobno wymagają przeprojektowania ze względu na problemy z przegrzaniem

cyberfeed.pl 6 dni temu


Według InformacjeWedług doniesień najnowsze procesory NVIDIA „Blackwell” napotykają poważne problemy z zarządzaniem temperaturą w konfiguracjach serwerów o dużej gęstości, co może mieć wpływ na harmonogram wdrażania w dużych firmach technologicznych. Wyzwania pojawiają się szczególnie w szafach NVL72 GB200 mieszczących 72 procesory GB200, które mogą zużywać do 120 kilowatów mocy na szafę. Te problemy termiczne zmusiły firmę NVIDIA do wielokrotnego przeglądu i modyfikacji projektów szaf serwerowych, aby zapobiec spadkowi wydajności i potencjalnemu uszkodzeniu sprzętu. Hiperskalerzy lubią Google, MetaI Microsoftuktóre w dużym stopniu polegają na procesorach graficznych NVIDIA przy szkoleniu swoich zaawansowanych modeli językowych, rzekomo wyraziły obawy dotyczące możliwych opóźnień w harmonogramach wdrażania swoich centrów danych.

Problemy z zarządzaniem ciepłem wynikają z wcześniejszych niepowodzeń związanych z wadą projektową w procesie produkcyjnym Blackwell. Problem wynikał ze złożonej technologii pakowania CoWoS-L, która łączy podwójne chiplety dzięki przekładki RDL i mostków LSI. Niedopasowanie rozszerzalności cieplnej pomiędzy różnymi komponentami doprowadziło do problemów z wypaczeniem, wymagających modyfikacji metalowych warstw i struktur GPU. Rzecznik firmy scharakteryzował te modyfikacje jako część standardowego procesu rozwoju, zauważając, iż a nowa fotomaska ​​rozwiązała ten problem. Z informacji wynika, iż ​​masowa produkcja poprawionych procesorów graficznych Blackwell rozpoczęła się pod koniec października, a dostawy mają rozpocząć się pod koniec stycznia. Jednakże te terminy nie zostały potwierdzone przez firmę NVIDIA i niektórych producentów serwerów Dolina potwierdziło, iż systemy chłodzone cieczą GB200 NVL72 będą dostarczane teraz, a nie w styczniu, a klientem będzie dostawca chmury GPU CoreWave. Oryginalny raport mógł wykorzystywać starsze informacje, ponieważ Dell jest jednym z najważniejszych partnerów NVIDII i jednym z pierwszych w łańcuchu dostaw, który uzyskał dostęp do nowych partii procesorów graficznych.



Source link

Idź do oryginalnego materiału