Alibaba prezentuje Qwen3-Max – model AI o bilionie parametrów

instalki.pl 1 tydzień temu

Alibaba ogłosił premierę swojego najnowszego modelu sztucznej inteligencji Qwen3-Max. To największy i najbardziej zaawansowany system, jaki do tej pory stworzył chiński gigant technologiczny. Według firmy model osiąga skalę ponad jednego biliona parametrów i został zaprojektowany tak, aby konkurować z rozwiązaniami od OpenAI, Google czy Anthropic.

Jakie są najważniejsze cechy Qwen3-Max?

Nowy model został zbudowany w architekturze Mixture-of-Experts, co pozwala mu aktywować jedynie część parametrów w trakcie działania. Dzięki temu udało się osiągnąć balans między ogromną mocą obliczeniową a efektywnością kosztową. Alibaba podkreśla, iż Qwen3-Max potrafi pracować z kontekstami długości choćby miliona tokenów, co oznacza, iż może przetwarzać wyjątkowo długie fragmenty tekstu bez utraty spójności.

Podczas treningu firma zastosowała szereg autorskich rozwiązań technicznych. Jednym z nich jest mechanizm kontroli strat, który pozwolił uniknąć typowych problemów (nagłe skoki wartości czy konieczność restartu całego procesu). Zastosowano również system równoważenia obciążenia i metody zwiększające stabilność przy bardzo dużych zbiorach danych.

Alibaba poinformował także o wprowadzeniu narzędzi SanityCheck i EasyCheckpoint, które ułatwiają przywracanie procesu szkolenia po awariach sprzętowych.

Jak Qwen3-Max wypada na tle konkurencji?

Wersja użytkowa Qwen3-Max Instruct osiąga bardzo dobre wyniki w międzynarodowych benchmarkach. W testach programistycznych np. SWE-Bench model zdobył prawie siedemdziesiąt punktów, co stawia go w czołówce narzędzi do automatyzacji kodu. W rankingach skupiających się na wykorzystaniu narzędzi i zdolnościach agentowych np. Tau2-Bench, wynik sięga około siedemdziesięciu pięciu punktów, przewyższając niektórych konkurentów z USA.

Alibaba twierdzi, iż pod względem umiejętności rozumowania, generowania kodu i pracy w długim kontekście Qwen3-Max jest bezpośrednim rywalem dla najnowszych modeli od OpenAI czy Google DeepMind. Podkreśla też, iż jego skuteczność jest szczególnie widoczna w zastosowaniach biznesowych i badawczych, gdzie praca z danymi wymaga dużej precyzji i stabilności.

Jakie to ma znaczenie dla rynku?

Premiera Qwen3-Max to element szerszej strategii Alibaby, który planuje ogromne inwestycje w rozwój sztucznej inteligencji. W 2025 roku firma ogłosiła przeznaczenie setek miliardów juanów na rozbudowę infrastruktury i rozwój własnych modeli językowych. To jasny sygnał, iż chiński koncern chce umocnić pozycję w globalnym wyścigu AI i stać się jednym z liderów tej branży.

Dostęp do Qwen3-Max Instruct został już uruchomiony poprzez platformę Alibaba Cloud i aplikację Qwen Chat. Firma zapowiada także kolejną odsłonę modelu w wariancie Thinking, który ma kłaść jeszcze większy nacisk na zdolności analityczne i zaawansowane wnioskowanie. Przyszłość pokaże, czy Qwen3-Max znajdzie w praktyce szerokie zastosowania komercyjne, czy pozostanie przede wszystkim narzędziem demonstracyjnym.

Źródło: Gizmochina / Zdjęcie otwierające: Qwen

AIOpenAIsztuczna inteligencja
Idź do oryginalnego materiału