W styczniu 2025 roku chińska firma DeepSeek, zaledwie półtora roku po swoim powstaniu, wstrząsnęła światem sztucznej inteligencji, wprowadzając model DeepSeek-R1. Dzięki niezwykle niskim kosztom szkolenia i wydajności przewyższającej rozwiązania OpenAI czy Meta, stał się globalnym fenomenem. Sukces DeepSeek zmobilizował gigantów technologicznych, takich jak Alibaba, do przyspieszenia prac nad własnymi modelami AI, rozpoczynając prawdziwy wyścig technologiczny w Chinach.
DeepSeek – rewolucja niskim kosztem
Założona w lipcu 2023 roku przez Lianga Wenfenga, współtwórcę funduszu hedgingowego High-Flyer, DeepSeek od początku stawiała na innowacyjne podejście do uczenia modeli. Firma zaskoczyła branżę, szkoląc swoje modele za ułamek kosztów konkurencji:
-
DeepSeek-V3 – koszt szkolenia: 6 mln USD (dla porównania, GPT-4 kosztował OpenAI 100 mln USD w 2023 r.)
-
10-krotnie mniejsza moc obliczeniowa niż Meta potrzebowała do Llama 3.1
-
Mieszana precyzja obliczeń i optymalizacja komunikacji między układami GPU
Kluczem do sukcesu okazały się techniki mieszanin ekspertów (MoE) oraz własne rozwiązania sprzętowo-programowe, takie jak Fire-Flyer 2 – klaster obliczeniowy zbudowany z 5000 układów Nvidia A100, połączonych szybką siecią 200 Gbps.
QWen3 Alibaby – otwartoźródłowa odpowiedź na DeepSeek
Podczas gdy DeepSeek zaskakiwał świat niskimi kosztami i wydajnością, Alibaba Group postawiła na otwartość i skalowalność, wypuszczając w maju 2025 roku rodzinę modeli Qwen3. To nie tylko odpowiedź na sukcesy konkurencji, ale strategiczny ruch, który ma umocnić pozycję Alibaby jako lidera w globalnej społeczności open-source.
Dlaczego Qwen3 to przełom?
-
Pełna otwartość vs. “open-weight” DeepSeek
-
W przeciwieństwie do DeepSeek, który udostępnia jedynie wagi modeli (open-weight), Qwen3 to w pełni otwartoźródłowy projekt na licencji MIT.
-
Deweloperzy mogą modyfikować kod, poprawiać błędy i dodawać nowe funkcje – to kluczowa przewaga nad półotwartymi rozwiązaniami.
-
-
8 modeli w jednej rodzinie – od urządzeń brzegowych po chmurę
Alibaba zaprezentowała najszerszą gamę modeli wśród chińskich firm AI:-
Qwen3-0.6B (600 mln parametrów) – dla urządzeń mobilnych i IoT
-
Qwen3-235B (235 mld parametrów) – konkurent GPT-4, specjalizujący się w zadaniach wymagających zaawansowanego rozumowania
-
Modele pośrednie (7B, 14B, 72B) – zoptymalizowane pod kątem konkretnych zastosowań (medycyna, finanse, kodowanie)
-
-
Benchmarki nie kłamią: Qwen3 bije rekordy
Według LiveBench, Qwen3-235B osiągnął 87,3% w testach matematycznych (vs. 85,1% DeepSeek-R1) i 91% w generowaniu kodu – wyniki porównywalne z GPT-4, ale przy koszcie użytkowania 10-krotnie niższym niż OpenAI. -
Ekonomia AI: 4 juany za milion tokenów
-
Qwen3 jest najtańszym wysokowydajnym modelem na rynku:
Model Koszt (1M tokenów) Qwen3 4 CNY (~0,55 USD) DeepSeek-R1 6 CNY (~0,83 USD) OpenAI o3 10 USD -
Niższe koszty to efekt optymalizacji w chmurze Alibaba Cloud – największej infrastruktury obliczeniowej w Chinach.
-
Strategia Alibaby: open-source jako broń
Justin Lin Junyang, lider zespołu Qwen, podkreśla:
“Wierzymy, iż przyszłość AI należy do społeczności. Każdy feedback od developerów sprawia, iż Qwen staje się lepszy”.
Konkretne działania:
-
Hugging Face Integration – Qwen3 zasila już 10 najlepszych otwartych modeli na platformie
-
Wsparcie chipsetów – kooperacja z Huawei, Hygon i nawet Nvidią (pomimo sankcji)
-
Partnerstwa korporacyjne – Qwen3 będzie podstawą “Apple Intelligence” w Chinach (niepotwierdzony, ale prawdopodobny deal z Apple)
Inni gracze wchodzą do gry
Sukces DeepSeek zmotywował również innych chińskich gigantów do rozwoju własnych modeli AI:
-
Huawei – rozwija własne rozwiązania, współpracując z lokalnymi producentami chipów.
-
Xiaomi – pracuje nad otwartoźródłowym MiMo dla Chin, a na Zachodzie współpracuje z Google (Gemini).
-
Oppo, Vivo, Honor – już wdrożyły DeepSeek-R1 w swoich telefonach, ulepszając asystentów głosowych.
DeepSeek udowodnił, iż niski koszt i otwartość mogą konkurować z zamkniętymi rozwiązaniami OpenAI czy Google. W odpowiedzi Alibaba postawiła na Qwen3, a cały chiński rynek AI przyspieszył rozwój własnych modeli. Czy R2 utrzyma przewagę DeepSeek? Czy USA nałożą kolejne sankcje? Konkurenci dopiero się rozgrzewają.
Qwen3 to nie tylko technologia – to manifest filozofii Alibaby: otwartość, kooperacja i dominacja przez ekosystem. Podczas gdy DeepSeek skupia się na niskich kosztach, Alibaba buduje coś więcej niż model – buduje społeczność. W tym wyścigu liczy się nie tylko kto ma lepsze AI, ale kto zdefiniuje przyszłość rozwoju sztucznej inteligencji.
Źródła:
- Wikipedia – Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
- South China Morning Post (10.05.2025) – „Alibaba’s open-source Qwen AI models eclipse DeepSeek” (Bien Perez)
- LiveBench – ranking modeli AI
- Doniesienia branżowe (Huawei, Xiaomi, Oppo, Vivo)
- The Wall Street Journal – „DeepSeek vs. OpenAI: The Low-Cost AI Disruptor” (2025)
Leszek B. Ślazyk
e-mail: kontakt@chiny24.com
© www.chiny24.com