Chiński wyścig AI: Jak DeepSeek zrewolucjonizował rynek i zmusił Alibabę do odpowiedzi

chiny24.com 5 godzin temu

W styczniu 2025 roku chińska firma DeepSeek, zaledwie półtora roku po swoim powstaniu, wstrząsnęła światem sztucznej inteligencji, wprowadzając model DeepSeek-R1. Dzięki niezwykle niskim kosztom szkolenia i wydajności przewyższającej rozwiązania OpenAI czy Meta, stał się globalnym fenomenem. Sukces DeepSeek zmobilizował gigantów technologicznych, takich jak Alibaba, do przyspieszenia prac nad własnymi modelami AI, rozpoczynając prawdziwy wyścig technologiczny w Chinach.

DeepSeek – rewolucja niskim kosztem

Założona w lipcu 2023 roku przez Lianga Wenfenga, współtwórcę funduszu hedgingowego High-Flyer, DeepSeek od początku stawiała na innowacyjne podejście do uczenia modeli. Firma zaskoczyła branżę, szkoląc swoje modele za ułamek kosztów konkurencji:

  • DeepSeek-V3 – koszt szkolenia: 6 mln USD (dla porównania, GPT-4 kosztował OpenAI 100 mln USD w 2023 r.)

  • 10-krotnie mniejsza moc obliczeniowa niż Meta potrzebowała do Llama 3.1

  • Mieszana precyzja obliczeń i optymalizacja komunikacji między układami GPU

Kluczem do sukcesu okazały się techniki mieszanin ekspertów (MoE) oraz własne rozwiązania sprzętowo-programowe, takie jak Fire-Flyer 2 – klaster obliczeniowy zbudowany z 5000 układów Nvidia A100, połączonych szybką siecią 200 Gbps.

QWen3 Alibaby – otwartoźródłowa odpowiedź na DeepSeek

Podczas gdy DeepSeek zaskakiwał świat niskimi kosztami i wydajnością, Alibaba Group postawiła na otwartość i skalowalność, wypuszczając w maju 2025 roku rodzinę modeli Qwen3. To nie tylko odpowiedź na sukcesy konkurencji, ale strategiczny ruch, który ma umocnić pozycję Alibaby jako lidera w globalnej społeczności open-source.

Dlaczego Qwen3 to przełom?

  1. Pełna otwartość vs. “open-weight” DeepSeek

    • W przeciwieństwie do DeepSeek, który udostępnia jedynie wagi modeli (open-weight), Qwen3 to w pełni otwartoźródłowy projekt na licencji MIT.

    • Deweloperzy mogą modyfikować kod, poprawiać błędy i dodawać nowe funkcje – to kluczowa przewaga nad półotwartymi rozwiązaniami.

  2. 8 modeli w jednej rodzinie – od urządzeń brzegowych po chmurę
    Alibaba zaprezentowała najszerszą gamę modeli wśród chińskich firm AI:

    • Qwen3-0.6B (600 mln parametrów) – dla urządzeń mobilnych i IoT

    • Qwen3-235B (235 mld parametrów) – konkurent GPT-4, specjalizujący się w zadaniach wymagających zaawansowanego rozumowania

    • Modele pośrednie (7B, 14B, 72B) – zoptymalizowane pod kątem konkretnych zastosowań (medycyna, finanse, kodowanie)

  3. Benchmarki nie kłamią: Qwen3 bije rekordy
    Według LiveBench, Qwen3-235B osiągnął 87,3% w testach matematycznych (vs. 85,1% DeepSeek-R1) i 91% w generowaniu kodu – wyniki porównywalne z GPT-4, ale przy koszcie użytkowania 10-krotnie niższym niż OpenAI.

  4. Ekonomia AI: 4 juany za milion tokenów

    • Qwen3 jest najtańszym wysokowydajnym modelem na rynku:

      Model Koszt (1M tokenów)
      Qwen3 4 CNY (~0,55 USD)
      DeepSeek-R1 6 CNY (~0,83 USD)
      OpenAI o3 10 USD
    • Niższe koszty to efekt optymalizacji w chmurze Alibaba Cloud – największej infrastruktury obliczeniowej w Chinach.

Strategia Alibaby: open-source jako broń

Justin Lin Junyang, lider zespołu Qwen, podkreśla:
“Wierzymy, iż przyszłość AI należy do społeczności. Każdy feedback od developerów sprawia, iż Qwen staje się lepszy”.

Konkretne działania:

  • Hugging Face Integration – Qwen3 zasila już 10 najlepszych otwartych modeli na platformie

  • Wsparcie chipsetów – kooperacja z Huawei, Hygon i nawet Nvidią (pomimo sankcji)

  • Partnerstwa korporacyjne – Qwen3 będzie podstawą “Apple Intelligence” w Chinach (niepotwierdzony, ale prawdopodobny deal z Apple)

Inni gracze wchodzą do gry

Sukces DeepSeek zmotywował również innych chińskich gigantów do rozwoju własnych modeli AI:

  • Huawei – rozwija własne rozwiązania, współpracując z lokalnymi producentami chipów.

  • Xiaomi – pracuje nad otwartoźródłowym MiMo dla Chin, a na Zachodzie współpracuje z Google (Gemini).

  • Oppo, Vivo, Honor – już wdrożyły DeepSeek-R1 w swoich telefonach, ulepszając asystentów głosowych.

DeepSeek udowodnił, iż niski koszt i otwartość mogą konkurować z zamkniętymi rozwiązaniami OpenAI czy Google. W odpowiedzi Alibaba postawiła na Qwen3, a cały chiński rynek AI przyspieszył rozwój własnych modeli. Czy R2 utrzyma przewagę DeepSeek? Czy USA nałożą kolejne sankcje? Konkurenci dopiero się rozgrzewają.

Qwen3 to nie tylko technologia – to manifest filozofii Alibaby: otwartość, kooperacja i dominacja przez ekosystem. Podczas gdy DeepSeek skupia się na niskich kosztach, Alibaba buduje coś więcej niż model – buduje społeczność. W tym wyścigu liczy się nie tylko kto ma lepsze AI, ale kto zdefiniuje przyszłość rozwoju sztucznej inteligencji.

Źródła:

  • Wikipedia – Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
  • South China Morning Post (10.05.2025) – „Alibaba’s open-source Qwen AI models eclipse DeepSeek” (Bien Perez)
  • LiveBench – ranking modeli AI
  • Doniesienia branżowe (Huawei, Xiaomi, Oppo, Vivo)
  • The Wall Street Journal – „DeepSeek vs. OpenAI: The Low-Cost AI Disruptor” (2025)

Leszek B. Ślazyk

e-mail: kontakt@chiny24.com

© www.chiny24.com

Idź do oryginalnego materiału