DeepSeek wypuścił nowy model AI, który ma dorównywać czołówce z USA, a jest od niej dużo tańszy

itreseller.com.pl 1 tydzień temu

Chiński startup DeepSeek wypuścił nowy model AI o nazwie V3.1. Firma twierdzi, iż dorównuje on najlepszym amerykańskim modelom, a kosztuje dziesiątki razy mniej. Niezależne testy są jednak póki co ograniczone.

DeepSeek, startup z Hangzhou, wprowadził na rynek nową wersję swojego modelu językowego – DeepSeek V3.1. Firma ogłosiła to w dość nietypowy sposób, publikując krótki komunikat w oficjalnej grupie WeChat, bez większego rozgłosu czy szczegółowej dokumentacji. Największą nowością ma być wydłużony “kontekst” do 128 tysięcy tokenów, co oznacza, iż model może “zapamiętać” około 96 tysięcy słów, czyli mniej więcej dwie książki po 200 stron każda. To ma pozwalać na prowadzenie dłuższych, bardziej spójnych rozmów.

Jeśli chodzi o główne twierdzenie dotyczące cen, sytuacja wymaga wyjaśnienia. W internecie krążą informacje o tym, iż DeepSeek V3.1 ma być aż “70 razy tańszy” od konkurencji, ale to twierdzenie prawdopodobnie odnosi się do bardzo specyficznego przypadku użycia – konkretnego zadania kodowania, gdzie różnica może rzeczywiście sięgać tej wartości. Rzeczywiste porównania cenowe pokazują jednak znacznie mniejsze, choć wciąż imponujące różnice. Według dostępnych danych, DeepSeek V3 kosztuje około 0,27 dolara za milion tokenów wejściowych, podczas gdy GPT-4 – około 2,5-5 dolarów. To daje różnicę 10-15 razy, a nie 70.

Co do wydajności, dostępne są tylko fragmentaryczne informacje i testy społecznościowe. Jeden z użytkowników przeprowadził test dzięki narzędzia SVGBench i stwierdził, iż V3.1 uzyskał wynik o 13% lepszy niż poprzednia wersja DeepSeek-R1, zajmując 13. miejsce w ogólnym rankingu i 2. wśród chińskich modeli. To jednak jedyny publicznie dostępny niezależny test. Wcześniejsze wersje DeepSeeka rzeczywiście pokazywały konkurencyjne wyniki – DeepSeek V3 osiągał podobne rezultaty do GPT-4o w niektórych testach matematycznych i programistycznych, ale Claude przez cały czas przewyższał go w zadaniach kodowania.

Problem w tym, iż V3.1 to na razie głównie obietnica bez pełnej weryfikacji. Firma nie opublikowała jeszcze dokumentacji na głównych platformach jak Hugging Face, nie ma też oficjalnych, niezależnych testów porównawczych z najnowszymi konkurencyjnymi modelami. To, co mamy, to głównie doniesienia społecznościowe i wstępne testy użytkowników, którzy sprawdzali model przez interfejs internetowy DeepSeeka. Choć różnice cenowe są rzeczywiście znaczące – mówimy o modelach dziesiątki razy tańszych od amerykańskiej konkurencji – ich rzeczywista wydajność pozostaje kwestią otwartą do momentu przeprowadzenia rzetelnych, niezależnych badań.

Idź do oryginalnego materiału