Kontrowersje wokół DeepSeek: Podejrzenia o kradzież danych od Google Gemini

itreseller.com.pl 3 dni temu

Chiński startup DeepSeek wypuścił zaktualizowany model AI R1, który osiąga świetne wyniki w testach matematycznych i kodowaniu. Jednak badacze spekulują, iż dane do jego treningu mogły pochodzić z… Google Gemini.

W zeszłym tygodniu chińska firma DeepSeek zaprezentowała nową wersję swojego modelu sztucznej inteligencji, R1-0528, który wyróżnia się wysoką skutecznością w benchmarkach matematycznych i programistycznych. Firma nie ujawniła jednak, skąd pochodzą dane użyte do treningu modelu, co wywołało spekulacje wśród badaczy AI. Jak informuje TechCrunch, niektórzy eksperci podejrzewają, iż przynajmniej część danych mogła zostać zaczerpnięta z modeli Google Gemini.

Sam Paech, deweloper z Melbourne tworzący testy „inteligencji emocjonalnej” dla AI, zauważył w poście na platformie X, iż model DeepSeek R1-0528 używa słów i wyrażeń bardzo podobnych do tych preferowanych przez Google Gemini 2.5 Pro. Kolejny programista, anonimowy twórca projektu SpeechMap, zwrócił uwagę, iż ślady myślowe modelu DeepSeek – czyli sposób, w jaki formułuje wnioski – przypominają te generowane przez Gemini. Choć nie jest to ostateczny dowód, podobieństwa budzą pytania o etykę praktyk chińskiej firmy.

To nie pierwsze oskarżenia wobec DeepSeek o korzystanie z danych konkurencji. W grudniu 2024 roku deweloperzy zauważyli, iż model V3 DeepSeek często przedstawiał się jako ChatGPT od OpenAI, co sugerowało trening na logach rozmów tego właśnie modelu. Z kolei na początku 2025 roku OpenAI poinformowało Financial Times o dowodach wskazujących na stosowanie przez DeepSeek techniki ekstrakcji danych – metody polegającej na ekstrakcji informacji z większych modeli AI. Bloomberg doniósł również, iż Microsoft, partner OpenAI, wykrył pod koniec 2024 roku wyciek dużych ilości danych przez konta deweloperskie powiązane z DeepSeek. Proces ekstrakcji danych to rozpowszechniona praktyka w branży AI, niemniej jednak warunki użytkowania OpenAI wyraźnie zakazują wykorzystywanie ich systemów w celu tworzenia konkurencyjnych rozwiązań technologicznych.

Idź do oryginalnego materiału