ByteDance udostępnił Seed-OSS-36B – potężny, otwartoźródłowy model AI. Jest wielojęzyczny, a jego zdolność przetwarzania długich tekstów przewyższa wielu płatnych rywali, w tym modele od OpenAI.
W świecie sztucznej inteligencji doszło do nieoczekiwanego zwrotu akcji. ByteDance, chiński gigant technologiczny i właściciel aplikacji TikTok, wypuścił nową serię otwartoźródłowych modeli językowych o nazwie Seed-OSS-36B. To ruch, który może zmienić układ sił na rynku zdominowanym przez amerykańskie firmy. Modele udostępniono na licencji Apache-2.0, co oznacza, iż każdy może z nich korzystać, modyfikować je i budować na ich bazie własne produkty całkowicie za darmo, również w celach komercyjnych.
Tym, co wyróżnia Seed-OSS-36B, jest jego zdolność do przetwarzania ogromnych ilości informacji za jednym razem. Model obsługuje kontekst o długości aż 512 000 tokenów, co w przybliżeniu odpowiada 1600 stronom tekstu. Ta cecha otwiera zupełnie nowe możliwości – AI może teraz analizować całe książki, obszerne raporty finansowe czy skomplikowaną dokumentację techniczną w jednej sesji. To przełom w funkcjonalności, który pozwala na realizację zadań niedostępnych do tej pory dla większości systemów.
Model został zaprojektowany z myślą o zastosowaniach międzynarodowych. Jak podaje ByteDance, jest on zoptymalizowany do pracy w wielu językach. W dokumentacji potwierdzono doskonałe działanie w języku angielskim i chińskim, a także wskazano na wsparcie dla innych, w tym hiszpańskiego. Chociaż język polski nie jest wymieniony z nazwy, wydajność w różnych językach można oceniać na podstawie testu porównawczego FLORES-200, w którym model brał udział. Mimo relatywnie niewielkiego rozmiaru (36 mld parametrów) model osiąga w wielu zadaniach wyniki lepsze od znacznie większych rywali.