Chińska firma AI Deepseek wstrzymała premierę swojego nowego modelu R2. Powód? Problemy z wydajnością krajowych procesorów, które miały być dowodem na technologiczną niezależność Chin od USA.
Ambitne plany Pekinu dotyczące uniezależnienia się od zachodniej technologii w dziedzinie sztucznej inteligencji właśnie zderzyły się z twardą rzeczywistością. Chiński startup AI, Deepseek, który zyskał rozgłos po udanej premierze swojego otwartego modelu językowego, musi odłożyć debiut swojego flagowego produktu, jakim jest model R2. Przyczyną opóźnienia są poważne problemy techniczne, jakie napotkano podczas próby wytrenowania modelu wyłącznie na procesorach Ascend, dostarczanych przez Huawei.
Decyzja o wykorzystaniu chińskich chipów nie była przypadkowa. Po sukcesie poprzedniego modelu, trenowanego na układach NVIDII, chińskie władze miały zachęcać Deepseek do postawienia na krajowe rozwiązania. Miało to być symboliczne zwycięstwo w technologicznej wojnie z USA i dowód na to, iż Chiny potrafią samodzielnie tworzyć i rozwijać zaawansowane systemy AI.

Problemy pojawiły się jednak na najbardziej wymagającym etapie – podczas treningu, czyli procesu, w którym model uczy się wzorców na podstawie gigantycznych zbiorów danych. Krajowe chipy Ascend po prostu nie sprostały zadaniu, co zmusiło firmę do podjęcia decyzji o powrocie do sprawdzonych, choć objętych sankcjami, procesorów NVIDII.
Co ciekawe, Deepseek nie porzuca całkowicie współpracy z Huawei. Firma planuje wykorzystać chipy Ascend do tak zwanej inferencji, czyli procesu, w którym już wytrenowany model generuje odpowiedzi na zapytania użytkowników. Jest to zadanie znacznie mniej wymagające obliczeniowo niż sam trening. Model R2 miał mieć początkowo swoją premierę w maju, później zaś wspomniano o debiucie w sierpniu. w tej chwili nie padają żadne sugestie co do kolejnego terminu.