
Claude pozostało lepszy w kodowaniu! Nowy model Anthropica Sonnet 4.5 bije na głowę konkurencję w tej dziedzinie, zarazem istotnie poprawiając wyniki w takich dziedzinach jak matematyka i nauki ścisłe. Tymczasem ChatGPT, chatbot od OpenAI, zrobi za użytkowników zakupy. Widać, iż podział „Claude dla firm, ChatGPT dla konsumentów” zaznacza się coraz wyraźniej. Pojawia się pytanie — gdzie tutaj miejsce dla Google’a?
Claude, grupa modeli od Anthropica, od już dość dawna stała się ulubionym narzędziem programistów. Przez chwilę — w momencie debiutu GPT-5 i ulepszonego Codeksu — wydawało się, iż narzędzia od OpenAI być może doganiają konkurenta. Jednak Anthropic nie próżnuje i niecałe dwa miesiące po debiucie GPT-5 daje nam Claude’a Sonnet 4.5, który nie pozostawia wątpliwości, kto jest królem programowania w świecie AI.
Czytaj też: Sztuczna inteligencja zmienia naukę programowania? Zalicz semestr z AI!
Claude AI jeszcze lepszy w kodowaniu
Skąd taki wniosek? Po pierwsze, Sonnet 4.5 wyraźnie wyprzedza konkurencję w benchmarku SWE-bench Verified, w tej chwili najczęściej używanym do sprawdzenia umiejętności modeli związanych z inżynierią oprogramowania. Nowy model Anthropica uzyskał tu 77,2% wobec 74,5% dla większego Claude Opus i dla Codeksa, specjalizowanego w kodowaniu modelu od OpenAI. Standardowy GPT-5 zostaje w tyle z 72,5%.
Bije również konkurencję w systemach agentowych do programowania w terminalu — osiąga tu 50% wobec 43,8% dla GPT-5. Z kolei w agentowym użyciu narzędzi wygrywa w dwóch z trzech podkategorii, w trzeciej ustępując tylko większemu bratu, Opus 4.1.
Dla programistów równie ważne jak benchmarki jest to, jak model sobie radzi z dużymi bazami kodu — wszak kontekst modeli jest ograniczony, więc często nie widzą one całości kodu, a to utrudnia skuteczne budowanie oprogramowania. By temu zaradzić, Anthropic już wcześniej wprowadził pamięć — możliwość zapisywania podsumowań kontekstu na plikach lokalnych. Teraz, wraz z Sonnetem 4.5, wprowadza „edytowanie kontekstu” — zdolność modelu do usunięcia niepotrzebnych fragmentów kontekstu, kiedy dochodzi do końca „okna” kontekstowego.
Programowanie z użyciem AI? To możliwe
Połączenie pamięci z edytowaniem kontekstu pozwala modelowi na długotrwałą pracę nad złożonymi zadaniami. Anthropic twierdzi, iż Sonnet 4.5 jest w stanie koncentrować się na zadaniu przez przeszło 30 godzin. W przypadku Claude 4.0 (i GPT-5), było to znacznie mniej, bo 7 godzin.
Kolejnym ważnym dodatkiem jest wprowadzenie do Claude Code, agentowego systemu Anthropica do programowania, tak zwanych punktów kontrolnych (ang. checkpoints).
„Nasz nowy system punktów kontrolnych automatycznie zapisuje stan Twojego kodu przed każdą zmianą, a Ty możesz natychmiast cofnąć się do poprzednich wersji” – Pisze Anthropic. „Punkty kontrolne pozwalają Ci realizować bardziej ambitne i szeroko zakrojone zadania, wiedząc, iż zawsze możesz wrócić do wcześniejszego stanu kodu”.
Biorąc pod uwagę wolniejszy cykl rozwoju modeli u konkurencji w stosunku do Anthropica, wydaje się, iż modele Claude przynajmniej na jakiś czas pozostaną ulubieńcami programistów. A to prawdopodobnie oznacza, iż Anthropic przez cały czas będzie wyprzedzał OpenAI, jeżeli chodzi o adopcję modeli AI w firmach.
Zwłaszcza iż Anthropic odrobił też lekcję w innych niż programowanie dziedzinach — wyniki testów poprawiły się znacząco w przypadku matematyki czy nauk ścisłych.
Nie przegap najważniejszych trendów w technologiach!
Zarejestruj się, by otrzymywać nasz newsletter!
ChatGPT wchodzi w zakupy. Co na to Google?
Tymczasem OpenAI najwyraźniej chce umocnić swoją, i tak już mocną, pozycję u konsumentów. Mianowicie ChatGPT zrobi za nich zakupy — i nie będą w tym celu musieli opuszczać chatbota. Do tego ma służyć funkcja „natychmiastowa płatność” (ang. Instant Chackout). Dostępna będzie na razie tylko w USA i tylko w przypadku sprzedawców na platformach Etsy (już teraz) i Shopify (już wkrótce).
Na razie konsumenci będą mogli nabywać w ten sposób tylko pojedyncze produkty, jednak w przyszłości OpenAI wprowadzi koszyki zakupowe. Firma ma również plany wejścia na inne rynki niż USA.
Nowa oferta OpenAI wydaje się być ciosem wymierzonym w Google i Amazona. Temu pierwszemu potencjalnie odbiera użytkowników szukających produktów (i oglądających reklamy sprzedawane przez Google), temu drugiemu zaś klientów, bo kieruje konsumentów do konkurencyjnych platform zakupowych.
Dodatkowo możliwość robienia zakupów przez ChatGPT wydaje się być częścią planu OpenAI, by użytkownicy w ogóle nie odczuwali potrzeby wychodzenia z chatbota firmy — by wszystkie ich potrzeby zaspakajał ChatGPT. Bez internetu, Google’a, Amazona itp. A to śmiertelne zagrożenie dla giganta z Mountain View.
Jak Google zareaguje na nowe AI konkurencji?
Pytanie jak na to zareaguje Google. O ile Anthropic najwyraźniej skupia się na swoich klientach z sektora korporacyjnego a OpenAI usiłuje jeszcze zwiększyć uzależnienie konsumentów od jego platformy, to Google wydaje się stać w rozkroku, nie wiedząc, co zrobić w zmieniającym się świecie, w którym jego rola gwałtownie słabnie. Jego ostatnie modele, choć w chwili debiutu zbierały świetne recenzje, to mają już kilka miesięcy i konkurencja im trochę odjechała.
Czas by gigant z Mountain View się obudził. Bo jak nie, to firma Sama Altmana chętnie go zastąpi w roli „wrót do wszystkiego”. A to może oznaczać koniec internetu, jaki znamy.
Źródło grafiki: Sztuczna inteligencja, model Dall-E 3