Anthropic, amerykański startup założony przez byłych pracowników OpenAI, udostępnił nowy duży model językowy (LLM) Claude 3 Opus, który według wewnętrznych testów firmy jest potężniejszy niż GPT-4. Opus to największy z trzech modeli serii Claude 3 ogłoszonych przez firmę.
Jak widać na zestawieniu przygotowanym przez Anthropic, Opus co najmniej dorównuje GPT-4 we wszystkich testach przeprowadzonych przez firmę, a w kilku – znacząco bije model OpenAI. Tę przewagę Opus widać zwłaszcza w rozumowaniu na poziomie studiów magisterskich i zdolności matematycznych,
Model od Anthropic jest również lepszy od Gemini 1.0 Ultra, najpotężniejszego dostępnego modelu od Google.
Niestety nie wiemy, której konkretnie podwersji GPT-4 używał Anthropic do testów.
Co rozumie nowy model firmy Anthropic?
Claude 3 Opus jest dostępny dla programistów przez API oraz przez Claude Pro, płatną wersję chatbota firmy. Za darmo można korzystać z mniejszego modelu Claude 3 Sonnet. Jest on nieco gorszy od GPT-4 pod względem wiedzy (co jest naturalną konsekwencją wielkości modelu) i umiejętności językowych, jednak ma przewagę nad modelem OpenAI pod względem niektórych typów rozumowania, umiejętności matematycznych czy wytwarzania kodu.
Alex Albert, jeden z deweloperów modelu Opus przytoczył zabawną historyjkę, która pokazuje umiejętności rozumowania tej sztucznej inteligencji. Badacze sprawdzali zdolność zapamiętywania przez model elementów bardzo dużych zapytań – Opus ma tzw. okno kontekstowe wielkości 200 tysięcy tokenów, czyli nieco ponad 100 tysięcy słów.
Używa się do tego testu zwanego „igła w stogu siana”. W tym przypadku w duży zbiór tekstów o językach programowania wpleciono fragment o dodatkach do pizzy. Następnie poproszono model, by je wymienił. Opus nie tylko zapamiętał dodatki do pizzy, ale wyraził też przypuszczenie, iż jest testowany…
Chcesz wiedzieć, czym jest okno kontekstowe? Przeczytaj: W bitwie na LLM-y Google wytacza nowe działo
Claude, w odróżnieniu od Copilota od Microsoftu nie generuje obrazów (może i dobrze, biorąc pod uwagę ostatnie problemy Google), za to dobrze rozumie grafikę i plik graficzny można uczynić elementem zapytania (tzw. promptu).
Nie przegap najważniejszych trendów w technologiach!
Zarejestruj się, by otrzymywać nasz newsletter!
Claude a sprawa polska
Niestety chatbot Claude nie jest dostępny z terenu Unii Europejskiej. Możecie z niego skorzystać podczas wakacji w Albanii, czy choćby bardziej egzotycznych w Papui-Nowej Gwinei, a w Polsce… musicie użyć VPN. Chatbot co prawda wymaga weryfikacji telefonem, ale przyjmuje polskie numery.
Za to po połączeniu się z Opusem możemy z nim porozmawiać po polsku. Claude jest więc jednym z nielicznych (obok produktów OpenAI i Google) modeli językowych generujących tekst w naszym ojczystym języku. Inne popularne LLM-y tego nie potrafią, choć często po polsku rozumieją. Na przykład Mistral 8x7b jest w stanie streścić artykuł napisany po polsku – tylko iż streści go po angielsku.
Dowiedz się. dlaczego polskie firmy nie spieszą się z adaptacją GenAI. I czy polski model PLLuM to zmieni?
Źródło grafiki: Sztuczna inteligencja, model Dall-E 3