Claude Sonnet 5 — nowy model AI z możliwościami agentycznymi za ułamek ceny Opus

Anthropic wypuścił Claude Sonnet 5, model sztucznej inteligencji zaprojektowany z myślą o autonomicznej pracy. Potrafi planować działania, używać narzędzi takich jak przeglądarki i terminale, a jego możliwości jeszcze kilka miesięcy temu wymagały droższych modeli. To istotna zmiana w segmencie Sonnet — wcześniej największe postępy w AI agentycznej dotyczyły głównie klas Opus.

Najważniejsze wnioski w pigułce

Wydajność i możliwości:

Sonnet 5 zbliża się wydajnością do Opus 4.8, ale kosztuje znacznie mniej
Znacząco przewyższa poprzednika (Sonnet 4.6) w reasoning, używaniu narzędzi, kodowaniu i pracy z wiedzą
Dostępny w promocyjnej cenie $2 za milion tokenów wejściowych i $10 za milion wyjściowych (do 31 sierpnia 2026)

Bezpieczeństwo:

Niższy wskaźnik niepożądanych zachowań niż Sonnet 4.6
Lepiej radzi sobie z odmawianiem złośliwych zapytań i atakami prompt injection
Istotnie słabsze możliwości cybernetyczne niż Opus 4.8 (celowo nie trenowany na zadaniach cyberbezpieczeństwa)

Praktyczne zastosowania:

Kończy złożone zadania wieloetapowe, gdzie poprzednie modele się zatrzymywały
Samodzielnie sprawdza własne wyniki bez wyraźnej prośby
Idealny do pracy z „brownfield code" — wykrywaniem błędów i naprawami trudnych fragmentów kodu

Sonnet 5 jako most między ceną a możliwościami

Era AI agentycznej dla wielu deweloperów rozpoczęła się wraz z modelami klasy Sonnet: Claude Sonnet 3.5, 3.6 i 3.7 jako pierwsze wykazały imponujące umiejętności w kodowaniu i obsłudze narzędzi. Ostatnio jednak najwyraźniejsze postępy w możliwościach agentycznych dotyczyły modeli klasy Opus.

Sonnet 5 zmienia tę dynamikę. Nowy model oferuje wydajność zbliżoną do Opus 4.8, ale przy znacznie niższych kosztach. Wykresy kosztów i wydajności przy różnych poziomach wysiłku w ewaluacjach BrowseComp (wyszukiwanie agentyczne) i OSWorld-Verified (użycie komputera) pokazują, że Sonnet 5 stanowi znaczącą poprawę nad Sonnet 4.6 i pokrywa szerszy zakres opcji koszt-wydajność niż Opus 4.8.

Dla zespołów oznacza to konkretną wartość: przy średnim poziomie wysiłku Sonnet 5 oferuje znacznie lepszą efektywność kosztową, a przy wyższym poziomie może dorównać Opus 4.8 w niektórych zadaniach. Użytkownicy mogą dostosować poziom wysiłku między Sonnet 5 a Opus 4.8, aby znaleźć odpowiednią równowagę między kosztem a wydajnością.

Opinie partnerów — konkretne przypadki użycia

Testerzy z wczesnego dostępu zgłaszali spójne wnioski: Sonnet 5 jest znacznie bardziej agentyczny niż poprzednicy. Zimu Li z zespołu technicznego podkreśla, że model „dobrze radzi sobie z ciągłym kodowaniem, używaniem narzędzi i debugowaniem w zagmatanych kontekstach technicznych" — szczególnie w przepływach pracy, gdzie liczy się konsekwencja i solidność techniczna.

Daniel Shepard z Vellum opisuje konkrety: „Przekazaliśmy Claude Sonnet 5 dwuczęściowe zadanie — aktualizację poziomów kont Salesforce i wysłanie ogłoszenia o uruchomieniu do kontaktów enterprise — i zakończył je od początku do końca. Wcześniej to się zatrzymywało w połowie".

Neel Chotai, inżynier Rust w Zed, dzieli się przypadkiem debugowania: „Poprosiłem Claude Sonnet 5 o zbadanie błędu. Bez podpowiedzi napisał test reprodukujący problem, zaimplementował poprawkę, następnie schował ją, aby potwierdzić, że błąd wraca bez zmiany. Wszystko w jednym przebiegu".

Dominic Elm z Morph Labs dodaje: „Claude Sonnet 5 najlepiej sprawdza się przy brownfield code — race conditions, ukryte testy, części, których nikt nie chce dotykać. Śledzi awarię do jej rzeczywistej przyczyny źródłowej i dostarcza trwałą poprawkę zamiast łatania objawu".

Bezpieczeństwo — niższe ryzyko, wyższe zabezpieczenia

Oceny bezpieczeństwa przed wdrożeniem wykazały, że Sonnet 5 stanowi ogólną poprawę w stosunku do Sonnet 4.6. Pod względem bezpieczeństwa agentycznego model lepiej radzi sobie z odmawianiem złośliwych zapytań i opiera się próbom przejęcia w atakach prompt injection. Wykazuje niższe wskaźniki halucynacji i sycofancji niż Sonnet 4.6.

W automatycznym audycie behawioralnym, który testuje szeroki zakres niewłaściwych zachowań (takich jak współpraca z nadużyciami i oszustwa), Sonnet 5 uzyskał niższe wyniki — czyli jest bezpieczniejszy. Jednak w porównaniu z bardziej zaawansowanymi modelami Opus 4.8 i Claude Mythos Preview wykazywał nieco wyższe wskaźniki niewłaściwego zachowania w tej ocenie.

Anthropic celowo nie trenował Sonnet 5 na zadaniach cyberbezpieczeństwa. Model potrafi wykonywać rutynowe, nieszkodliwe zadania cyber, ale w ewaluacjach testujących potencjalnie niebezpieczne umiejętności cybernetyczne — takie jak tworzenie exploitów oprogramowania — wykazuje znacznie słabszą wydajność niż Opus 4.8 i Mythos 5. W testach opracowanych we współpracy z Mozillą, sprawdzających zdolność modeli do tworzenia exploitów dla luk w Firefox 147, żaden z modeli Sonnet nie był w stanie opracować działającego exploita (wynik 0,0%). Sonnet 5 wykazał jedynie nieznacznie wyższy wskaźnik częściowego sukcesu niż Sonnet 4.6.

Ponieważ Sonnet 5 jest nieco silniejszy od poprzednika w tych zadaniach, Anthropic uruchomił go z domyślnie włączonymi zabezpieczeniami cybernetycznymi — takimi samymi jak w Claude Opus 4.7 i 4.8, które wykrywają i blokują niebezpieczne użycie cyber w czasie rzeczywistym.

Dostępność i ceny — ekonomia wdrożenia

Claude Sonnet 5 jest dostępny od 30 czerwca 2026 we wszystkich planach: to domyślny model dla planów darmowych i Pro, dostępny również dla użytkowników Max, Team i Enterprise. Obecny jest w Claude Code i na Claude Platform.

Wprowadzająca cena do 31 sierpnia 2026 to $2 za milion tokenów wejściowych i $10 za milion tokenów wyjściowych. Po tej dacie przechodzi na standardową cenę: $3 za milion tokenów wejściowych i $15 za milion wyjściowych.

Warto zauważyć, że Sonnet 5 używa zaktualizowanego tokenizera, który zmienia sposób przetwarzania tekstu przez model — ten sam input może mapować się na więcej tokenów (około 1,0–1,35× w zależności od typu treści). Wprowadzająca cena jest ustalona tak, aby przejście na Sonnet 5 było w przybliżeniu neutralne kosztowo.

Anthropic zwiększył również limity stawek w Chat, Cowork, Claude Code i Claude Platform, aby dostosować się do wyższego zużycia tokenów przy wyższych poziomach wysiłku.

Podsumowanie

Claude Sonnet 5 zmienia równanie ceny i możliwości w segmencie modeli średniej klasy. Dla zespołów deweloperskich i firm oznacza to dostęp do możliwości agentycznych, które do niedawna wymagały znacznie droższych rozwiązań — przy zachowaniu wyższych standardów bezpieczeństwa niż poprzednik.

Źródło: Anthropic, „Introducing Claude Sonnet 5", 30 czerwca 2026