Anthropic wypuścił Claude Sonnet 5, model sztucznej inteligencji zaprojektowany z myślą o autonomicznej pracy. Potrafi planować działania, używać narzędzi takich jak przeglądarki i terminale, a jego możliwości jeszcze kilka miesięcy temu wymagały droższych modeli. To istotna zmiana w segmencie Sonnet — wcześniej największe postępy w AI agentycznej dotyczyły głównie klas Opus.
Najważniejsze wnioski w pigułce
Wydajność i możliwości:
- Sonnet 5 zbliża się wydajnością do Opus 4.8, ale kosztuje znacznie mniej
- Znacząco przewyższa poprzednika (Sonnet 4.6) w reasoning, używaniu narzędzi, kodowaniu i pracy z wiedzą
- Dostępny w promocyjnej cenie $2 za milion tokenów wejściowych i $10 za milion wyjściowych (do 31 sierpnia 2026)
Bezpieczeństwo:
- Niższy wskaźnik niepożądanych zachowań niż Sonnet 4.6
- Lepiej radzi sobie z odmawianiem złośliwych zapytań i atakami prompt injection
- Istotnie słabsze możliwości cybernetyczne niż Opus 4.8 (celowo nie trenowany na zadaniach cyberbezpieczeństwa)
Praktyczne zastosowania:
- Kończy złożone zadania wieloetapowe, gdzie poprzednie modele się zatrzymywały
- Samodzielnie sprawdza własne wyniki bez wyraźnej prośby
- Idealny do pracy z „brownfield code" — wykrywaniem błędów i naprawami trudnych fragmentów kodu
Sonnet 5 jako most między ceną a możliwościami
Era AI agentycznej dla wielu deweloperów rozpoczęła się wraz z modelami klasy Sonnet: Claude Sonnet 3.5, 3.6 i 3.7 jako pierwsze wykazały imponujące umiejętności w kodowaniu i obsłudze narzędzi. Ostatnio jednak najwyraźniejsze postępy w możliwościach agentycznych dotyczyły modeli klasy Opus.
Sonnet 5 zmienia tę dynamikę. Nowy model oferuje wydajność zbliżoną do Opus 4.8, ale przy znacznie niższych kosztach. Wykresy kosztów i wydajności przy różnych poziomach wysiłku w ewaluacjach BrowseComp (wyszukiwanie agentyczne) i OSWorld-Verified (użycie komputera) pokazują, że Sonnet 5 stanowi znaczącą poprawę nad Sonnet 4.6 i pokrywa szerszy zakres opcji koszt-wydajność niż Opus 4.8.
Dla zespołów oznacza to konkretną wartość: przy średnim poziomie wysiłku Sonnet 5 oferuje znacznie lepszą efektywność kosztową, a przy wyższym poziomie może dorównać Opus 4.8 w niektórych zadaniach. Użytkownicy mogą dostosować poziom wysiłku między Sonnet 5 a Opus 4.8, aby znaleźć odpowiednią równowagę między kosztem a wydajnością.
Opinie partnerów — konkretne przypadki użycia
Testerzy z wczesnego dostępu zgłaszali spójne wnioski: Sonnet 5 jest znacznie bardziej agentyczny niż poprzednicy. Zimu Li z zespołu technicznego podkreśla, że model „dobrze radzi sobie z ciągłym kodowaniem, używaniem narzędzi i debugowaniem w zagmatanych kontekstach technicznych" — szczególnie w przepływach pracy, gdzie liczy się konsekwencja i solidność techniczna.
Daniel Shepard z Vellum opisuje konkrety: „Przekazaliśmy Claude Sonnet 5 dwuczęściowe zadanie — aktualizację poziomów kont Salesforce i wysłanie ogłoszenia o uruchomieniu do kontaktów enterprise — i zakończył je od początku do końca. Wcześniej to się zatrzymywało w połowie".
Neel Chotai, inżynier Rust w Zed, dzieli się przypadkiem debugowania: „Poprosiłem Claude Sonnet 5 o zbadanie błędu. Bez podpowiedzi napisał test reprodukujący problem, zaimplementował poprawkę, następnie schował ją, aby potwierdzić, że błąd wraca bez zmiany. Wszystko w jednym przebiegu".
Dominic Elm z Morph Labs dodaje: „Claude Sonnet 5 najlepiej sprawdza się przy brownfield code — race conditions, ukryte testy, części, których nikt nie chce dotykać. Śledzi awarię do jej rzeczywistej przyczyny źródłowej i dostarcza trwałą poprawkę zamiast łatania objawu".
Bezpieczeństwo — niższe ryzyko, wyższe zabezpieczenia
Oceny bezpieczeństwa przed wdrożeniem wykazały, że Sonnet 5 stanowi ogólną poprawę w stosunku do Sonnet 4.6. Pod względem bezpieczeństwa agentycznego model lepiej radzi sobie z odmawianiem złośliwych zapytań i opiera się próbom przejęcia w atakach prompt injection. Wykazuje niższe wskaźniki halucynacji i sycofancji niż Sonnet 4.6.
W automatycznym audycie behawioralnym, który testuje szeroki zakres niewłaściwych zachowań (takich jak współpraca z nadużyciami i oszustwa), Sonnet 5 uzyskał niższe wyniki — czyli jest bezpieczniejszy. Jednak w porównaniu z bardziej zaawansowanymi modelami Opus 4.8 i Claude Mythos Preview wykazywał nieco wyższe wskaźniki niewłaściwego zachowania w tej ocenie.
Anthropic celowo nie trenował Sonnet 5 na zadaniach cyberbezpieczeństwa. Model potrafi wykonywać rutynowe, nieszkodliwe zadania cyber, ale w ewaluacjach testujących potencjalnie niebezpieczne umiejętności cybernetyczne — takie jak tworzenie exploitów oprogramowania — wykazuje znacznie słabszą wydajność niż Opus 4.8 i Mythos 5. W testach opracowanych we współpracy z Mozillą, sprawdzających zdolność modeli do tworzenia exploitów dla luk w Firefox 147, żaden z modeli Sonnet nie był w stanie opracować działającego exploita (wynik 0,0%). Sonnet 5 wykazał jedynie nieznacznie wyższy wskaźnik częściowego sukcesu niż Sonnet 4.6.
Ponieważ Sonnet 5 jest nieco silniejszy od poprzednika w tych zadaniach, Anthropic uruchomił go z domyślnie włączonymi zabezpieczeniami cybernetycznymi — takimi samymi jak w Claude Opus 4.7 i 4.8, które wykrywają i blokują niebezpieczne użycie cyber w czasie rzeczywistym.
Dostępność i ceny — ekonomia wdrożenia
Claude Sonnet 5 jest dostępny od 30 czerwca 2026 we wszystkich planach: to domyślny model dla planów darmowych i Pro, dostępny również dla użytkowników Max, Team i Enterprise. Obecny jest w Claude Code i na Claude Platform.
Wprowadzająca cena do 31 sierpnia 2026 to $2 za milion tokenów wejściowych i $10 za milion tokenów wyjściowych. Po tej dacie przechodzi na standardową cenę: $3 za milion tokenów wejściowych i $15 za milion wyjściowych.
Warto zauważyć, że Sonnet 5 używa zaktualizowanego tokenizera, który zmienia sposób przetwarzania tekstu przez model — ten sam input może mapować się na więcej tokenów (około 1,0–1,35× w zależności od typu treści). Wprowadzająca cena jest ustalona tak, aby przejście na Sonnet 5 było w przybliżeniu neutralne kosztowo.
Anthropic zwiększył również limity stawek w Chat, Cowork, Claude Code i Claude Platform, aby dostosować się do wyższego zużycia tokenów przy wyższych poziomach wysiłku.
Podsumowanie
Claude Sonnet 5 zmienia równanie ceny i możliwości w segmencie modeli średniej klasy. Dla zespołów deweloperskich i firm oznacza to dostęp do możliwości agentycznych, które do niedawna wymagały znacznie droższych rozwiązań — przy zachowaniu wyższych standardów bezpieczeństwa niż poprzednik.
Źródło: Anthropic, „Introducing Claude Sonnet 5", 30 czerwca 2026

