DeepSeek-V3 jest rozwiązaniem otwartoźródłowym, które zdobyło sporą popularność dzięki niezwykle niskim kosztom wytrenowania. Pojawił się jednak pewien problem.
Sztuczna inteligencja rozwija się tak dynamicznie, iż ciężko za nią nadążyć. Na początku mieliśmy ChatGPT opracowany przez OpenAI, a niedługo na fali popularności i potencjalnych zysków do wyścigu o miano najlepszego modelu dołączyły takie firmy jak Google z Gemini czy Anthropic z Claude. Swoją propozycję przygotowali też Chińczycy. DeepSeek-V3 to LLM typu open-source opracowany przez chińską firmę DeepSeek AI, o którym jest dość głośno ze względu na jego imponującą wydajność i efektywność kosztową.
DeepSeek AI w pewnym sensie ma rację
Pomimo jego możliwości, użytkownicy zauważyli dziwne zachowanie modelu językowego. DeepSeek-V3 czasami twierdzi bowiem, iż jest ChatGPT. Na przykład na pytanie „Jakim modelem jesteś?” odpowiada „ChatGPT, opartym na architekturze GPT-4”. Zjawisko to, znane jako „pomylenie tożsamości”, występuje, gdy LLM błędnie się identyfikuje. Podobne przypadki zaobserwowano też w przypadku innych modeli, takich jak Gemini-Pro, który twierdził, iż jest Wenxin Baidu, gdy zapytano go o to w języku chińskim.
Co jest przyczyną takiego zachowania? DeepSeek AI nie odpowiedziało na to pytanie, ale można założyć iż winne są użyte dane treningowe. DeepSeek-V3 prawdopodobnie korzystał z odpowiedzi wygenerowanych przez ChatGPT. W takim wypadku oczywiste jest, iż gdy model stworzony przez OpenAI odpowiadał prawidłowo na postawione pytanie, to jego chiński odpowiednik już tylko powtarzał tę odpowiedź niczym papuga. Co ciekawe, zjawisko to nie jest wcale tak rzadkie, jak mogłoby się wydawać – dotyka bowiem aż 25% modeli.