Claude Fable 5 i Mythos 5: nowa generacja modeli AI z wyjątkowymi możliwościami i nowymi zabezpieczeniami

Najważniejsze wnioski w pigułce

Możliwości techniczne:

Claude Fable 5 to model klasy Mythos osiągający najlepsze wyniki niemal we wszystkich testach benchmarkowych AI
Największą przewagę wykazuje w długich, złożonych zadaniach — szczególnie w inżynierii oprogramowania, pracy analitycznej i badaniach naukowych
Podczas testów Stripe skompresował pracę kilkumiesięczną do jednego dnia w migracji 50-milionowej bazy kodu Ruby

Bezpieczeństwo i dostęp:

Model wymaga nowych zabezpieczeń — niektóre zapytania są przekierowywane do mniej zaawansowanego Claude Opus 4.8
Claude Mythos 5 (ten sam model bez ograniczeń) dostępny jest tylko dla cybernetycznej obrony i krytycznej infrastruktury
Zabezpieczenia uruchamiają się średnio w mniej niż 5% sesji, choć generują czasami fałszywie pozytywne wyniki

Praktyczne zastosowania:

W badaniach nad lekami Mythos 5 przyspieszył procesy projektowania około dziesięciokrotnie
Model po raz pierwszy konsekwentnie generuje nowatorskie hipotezy naukowe — w 80% przypadków uznawane za lepsze od wcześniejszych modeli
Cena: 10 USD za milion tokenów wejściowych i 50 USD za milion wyjściowych — o ponad połowę taniej niż poprzednik

Przełom w długotrwałych zadaniach analitycznych

Claude Fable 5 reprezentuje nową klasę możliwości w sztucznej inteligencji. Model wyróżnia się nie tylko wyższymi wynikami benchmarkowymi, ale przede wszystkim zdolnością do autonomicznej pracy przez dłuższy czas — im bardziej złożone zadanie, tym większa jego przewaga nad wcześniejszymi wersjami.

W praktyce oznacza to możliwość realizacji projektów, które dotychczas wymagały tygodni ludzkiej pracy. Stripe podczas wczesnych testów przeprowadził migrację w 50-milionowej bazie kodu Ruby w jeden dzień — zadanie, które ręcznie zajęłoby zespołowi ponad dwa miesiące. Co więcej, Fable 5 osiąga te wyniki przy mniejszym zużyciu tokenów niż poprzednie modele Claude, co bezpośrednio przekłada się na niższe koszty operacyjne.

Najsilniejsze możliwości w cyberbezpieczeństwie na świecie

Właśnie ze względu na wyjątkowe kompetencje w cyberbezpieczeństwie Anthropic zdecydował się na dwutorowe udostępnienie modelu. Claude Mythos 5 — ta sama podstawa techniczna co Fable 5, ale bez części zabezpieczeń — jest dostępny wyłącznie dla wąskiej grupy specjalistów obrony cybernetycznej i dostawców infrastruktury krytycznej.

Model jest wdrażany w ramach Project Glasswing we współpracy z rządem USA jako ulepszenie Claude Mythos Preview. Jego możliwości w zakresie cyberbezpieczeństwa przewyższają wszystkie dostępne obecnie modele na świecie. W najbliższych miesiącach Anthropic planuje rozszerzyć dostęp poprzez program zaufanego dostępu dla większej liczby organizacji.

Decyzja o ograniczonym dostępie wynika z prostego powodu: bez odpowiednich zabezpieczeń możliwości Fable 5 w obszarze cyberbezpieczeństwa mogłyby zostać nadużyte i spowodować poważne szkody. Dlatego model ogólnodostępny otrzymał system klasyfikatorów, które w przypadku wrażliwych zapytań przekierowują użytkownika do mniej zaawansowanego Claude Opus 4.8.

Konkretne wyniki w inżynierii oprogramowania i pracy analitycznej

Testy przeprowadzone przez partnerów Anthropic potwierdzają przewagę Fable 5 w rzeczywistych scenariuszach użycia. Na benchmarku FrontierCode firmy Cognition — który sprawdza, czy modele potrafią realizować trudne zadania kodowania zgodnie ze standardami wysokiej jakości produkcyjnych baz kodu — Fable 5 uzyskał najwyższy wynik spośród wszystkich modeli frontierowych, nawet przy średnim poziomie wysiłku.

W pracy analitycznej model wykazuje wyjątkową wydajność. Na Finance Benchmark firmy Hebbia, testującym rozumowanie na poziomie seniorskim, Fable 5 osiągnął najwyższy wynik ze wszystkich modeli, ze znaczącymi wzrostami w rozumowaniu opartym na dokumentach, interpretacji wykresów i tabel oraz rozwiązywaniu problemów. IMC zauważył, że Fable 5 niemal w całości zdał ich ewaluacje analiz handlowych, włączając wyszukiwanie faktów, rozumowanie koncepcyjne, analizę przyczyn źródłowych i analizę wartości oczekiwanej.

GitHub w swoich testach stwierdził, że model podejmuje się złożonych zadań kodowania długoterminowego z poziomem autonomii i niezawodności przekraczającym wcześniejsze benchmarki. Cursor raportuje, że Fable 5 osiągnął status state-of-the-art na CursorBench i otworzył klasę problemów długoterminowych wcześniej nieosiągalnych dla modeli AI.

Przełom w badaniach nad lekami i biologią molekularnej

Szczególnie obiecujące są zastosowania Claude Mythos 5 w naukach przyrodniczych. W projektowaniu leków wewnętrzni eksperci Anthropic od białek przyspieszyli aspekty procesu projektowania około dziesięciokrotnie. W jednym z eksperymentów Mythos 5, korzystając z narzędzi do projektowania białek i bioinformatyki — ale bez pomocy człowieka — dorównał lub pokonał wykwalifikowanych operatorów ludzkich.

Model wykonał wszystkie zadania normalnie realizowane przez naukowca: wybór miejsc wiązania, selekcję i uruchomienie narzędzi projektowania białek oraz odzyskiwanie po błędach po drodze. Dziewięć z 14 celów białkowych z tego badania przyniosło silne kandydatury do projektowania leków, które są obecnie badane.

Co więcej, Mythos 5 jest pierwszym modelem konsekwentnie produkującym nowatorskie, przekonujące hipotezy naukowe. W ślepych porównaniach głowa w głowę z modelami klasy Opus naukowcy preferowali hipotezy Mythos dotyczące biologii molekularnej w około 80% przypadków i przesunęli kilka do oceny eksperymentalnej. Tymczasem jedna hipoteza Mythos — dotycząca nowatorskiego mechanizmu dla białka E. coli — została potwierdzona w badaniu laboratorium niezależnie pracującego nad tym samym problemem.

W genomice Mythos 5 przeprowadził nowatorskie badania w ciągu ponad tygodnia w dużej mierze autonomicznej pracy. Zmontował dane jednokomórkowe dla milionów komórek obejmujących 138 gatunków zwierząt, zaprojektował i wytrenował niestandardowy model uczenia maszynowego do identyfikacji komórek pełniących tę samą rolę nawet u odległych organizmów spokrewnionych. Przy minimalnym wkładzie człowieka wytrenowany model Mythos 5 przewyższył niedawny model opublikowany w czasopiśmie Science — pomimo że był 100 razy mniejszy.

Nowa architektura zabezpieczeń dla zaawansowanych modeli

Wprowadzenie Fable 5 do powszechnego użytku wymagało opracowania nowego systemu zabezpieczeń. Anthropic przez ostatnie miesiące udoskonalał klasyfikatory, które teraz są wystarczająco wiarygodne, aby model mógł być udostępniony szerokiej publiczności.

System działa poprzez wykrywanie potencjalnie wrażliwych zapytań i przekierowywanie ich do Claude Opus 4.8. Ponieważ priorytetem była ostrożność, zabezpieczenia są celowo konserwatywnie dostrojone — czasami zatrzymują nieszkodliwe zapytania, choć uruchamiają się średnio w mniej niż 5% sesji. Anthropic pracuje nad zmniejszeniem liczby fałszywie pozytywnych wyników i uznaje, że obecny stan może być frustrujący dla części użytkowników.

Warto podkreślić, że w zautomatyzowanej ocenie alignmentu poziom niewspółmiernego zachowania Mythos 5 (włączając niewspółmierne działania podejmowane przez model, takie jak oszustwo i współpraca z nadużywaniem modelu przez użytkownika) był niski i podobny do Opus 4.8. Szczegółowa ocena bezpieczeństwa i możliwości znajduje się w system card modelu.

Podsumowanie

Claude Fable 5 i Mythos 5 reprezentują istotny krok naprzód w dostępności zaawansowanej sztucznej inteligencji. Dwutorowa strategia udostępnienia — szeroki dostęp do zabezpieczonego Fable 5 i ograniczony do pełnofunkcyjnego Mythos 5 — pozwala realizować cele bezpieczeństwa bez hamowania innowacji. Przy cenie o ponad połowę niższej niż poprzednik i możliwościach kompresowania miesięcy pracy do dni, modele te mogą realnie zmienić sposób prowadzenia pracy analitycznej, badań naukowych i rozwijania oprogramowania.

Źródło: Anthropic, 9 czerwca 2026