Mamy nowe Bieliki – przygotowane do systemów agentowych

homodigital.pl 6 miesięcy temu

Mamy nowe Bieliki – twórcy polskich modeli językowych zaprezentowali je na wideokonferencji z siedziby Google w Paryżu. Dostaliśmy dwa „maluchy” oznaczone numerkiem 3 i poprawioną wersję znanego już modelu w wersji 2. Wszystkie te nowe modele mają możliwość użycia zewnętrznych narzędzi, nadają się więc do systemów agentowych.

To wydarzenie już zapowiadaliśmy – twórcy Bielika z Fundacji Spichlerz i krakowskiego Cyfronetu już wcześniej sygnalizowali, iż na GOSIM AI Spotlight zaprezentują swoje nowe modele. Okazja była doskonała – Bielik.ai, czyli projekt stojący za modelami Bielik, został nominowany do czołowej dziesiątki projektów open source w ramach GOSIM AI Spotlight. GOSIM to Global Open-Source Innovation Meetup – globalna inicjatywa promująca projekty open source.

Mamy nowe Bieliki – najmniejsze jak dotąd

Pierwszą nowością są dwa nowe „maluchy” – modele językowe o liczbie parametrów 1,5 miliarda i 4 miliardy. Jak tłumaczyli twórcy Bielika na wideokonferencji, są to modele przeznaczone do wąskich zastosowań. Mogą więc być stosowane na przykład do analizy wydźwięku emocjonalnego wypowiedzi (sentiment analysis) czy jako podstawa do budowania systemu wyspecjalizowanych agentów.

I właśnie do systemów agentów te małe modele wydają się najlepiej przygotowane. Ich twórcy zadbali, żeby miały one możliwość korzystania z zewnętrznych narzędzi – takich jak zewnętrzne skrypty czy przeglądarki internetowe.

Potrafią też zwracać odpowiedzi w bardziej ustrukturyzowaney sposób – zwłaszcza w postaci plików JSON – formatu powszechnie w tej chwili używanego do wymiany informacji w internecie, zwłaszcza przez interfejsy programistyczne, czyli tak zwane API. Ta lepsza obsługa JSON-a jest szczególnie istotna w systemach agentów, w których odpowiedź jednego modelu (agenta) staje się zestawem danych wejściowych dla drugiego. Im bardziej ustrukturyzowane są takie dane, tym większa pewność, iż zostaną adekwatnie przetworzone.

Te dwa małe modele wyposażono w polski tokenizer – a więc narzędzie do zamiany ciągów znaków w reprezentację cyfrową użyteczną dla modeli językowych. To istotnie poprawia efektywność tych modeli. Ma to jednak swoją cenę – istotnie pogarsza to korzystanie z innych języków, dlatego też polskiego tokenizera nie znajdziemy w większych modelach, które co do zasady mają obsługiwać też inne języki, zwłaszcza europejskie.

Maluchy Bielika są dostępne w serwisie Hugging Face.

Nowy-stary Bielik 2.5 – rozumujący i z narzędziami

Dostaliśmy też większy model, ulepszoną wersję Bielika 11B. Nowy model, oznaczony jako wersja 2.5, jest kontynuatorem serii 2, ale z dwoma istotnymi ulepszeniami. Po pierwsze, tak jak maluchy z serii 3, potrafi wykorzystywać narzędzia, a po drugie – można w nim uruchomić tryb „rozumujący”.

Jak poinformowali twórcy Bielika, z nowego modelu już teraz możemy skorzystać w chatbocie Bielik.ai. Niestety, nie widać tam opcji, żeby skorzystać z trybu rozumującego.

Ci, którzy chcieliby wypróbować Bielika 11B 2.5 na własnym sprzęcie muszą się uzbroić w cierpliwość. Karta modelu w serwisie Hugging Face wskazuje, iż ukaże się on dopiero 6 czerwca.

Jakie będą kolejne Bieliki?

Twórcy Bielików planują już kolejne modele. Mamy dostać wersję 3 flagowego modelu 11B i kolejny model, tym razem multimodalny, a więc potrafiący obsługiwać nie tylko tekst, ale i na przykład obrazy. Jak duży będzie to model? Jak sugerowano podczas wtorkowej konferencji, będzie on istotnie większy niż 11 miliardów parametrów, ale mniejszy niż 400B – co wyklucza, iż byłby oparty na Llamie 405B.

Nowe modele powinny się ukazać, jak sugerował Sebastian Kondracki – spiritus movens Bielika, albo tuż przed wakacjami, albo po wakacjach, we wrześniu.

Źródło grafiki: Sztuczna inteligencja, model Dall-E 3.

Idź do oryginalnego materiału