03 июля 2026 2 min read Новости

Claude Fable 5 вернулась: джейлбрейк, экспортный контроль и 5× дороже Sonnet

9 июня 2026 года Anthropic выкатила Claude Fable 5 — первую общедоступную модель класса Mythos, который компания раньше держала за семью замками из-за кибербезопасности. Модель порвала бенчмарки: 80.3% на SWE-bench Pro (против 69.2% у Opus 4.8), 91/100 на тесте Senior Engineer от Every (против 63 у Opus 4.8). 1 млн токенов контекста, 128K на выход, всегда включённый режим «размышлений». Ценник: $10 за миллион входных / $50 за выходные — в 5 раз дороже Sonnet 5.

А через три дня всё рухнуло.

12 июня Министерство торговли США ввело экстренный экспортный контроль на Fable 5 и её «голую» сестру Mythos 5. Директива требовала отрубить доступ для всех иностранных граждан. Поскольку проверить гражданство каждого пользователя в реальном времени невозможно, компания просто отключила обе модели для всех.

Что случилось? Исследователи Amazon нашли джейлбрейк Fable 5. Промпт заставлял модель находить уязвимости в софте и в одном случае — писать код, демонстрирующий их эксплуатацию.

Что было дальше

Две с половиной недели тишины. 23 июня Fable 5 убрали из тарифов Pro, Max и Team. 26 июня Mythos 5 вернули ~100 компаниям и федеральным агентствам США.

30 июня Минторг снял ограничения — и 1 июля Fable 5 снова в строю. До 7 июля модель включена в подписки Pro/Max/Team (до 50% недельного лимита), потом — только кредиты.

А был ли джейлбрейк?

Anthropic сыграла инцидент вниз. По их заявлению, те же уязвимости находят все протестированные модели — Opus 4.8, GPT-5.5, Kimi K2.7, Haiku 4.5, Sonnet 4.6. Компания называет это рутинным defensive security, а не суперспособностью.

Но правительство и Amazon (чей CEO Энди Джесси, по данным WSJ, лично продавливал ограничения) посчитали иначе. Бывший AI-царь Белого дома Дэвид Сакс обвинил Anthropic в том, что компания «поставила доступность потребительской модели выше безопасности». Часть экспертов сочла блокировку перегибом — группа security-лидеров подписала открытое письмо с требованием снять ограничения.

Переговоры с администрацией вёл сооснователь Том Браун, а не CEO Дарио Амодеи — который конфликтовал с Белым домом большую часть года.

Что поменялось

За две недели простоя Anthropic сделала три вещи:

Новый классификатор безопасности. Обучен ловить конкретную технику джейлбрейка. Блокирует >99% попыток. Минус — больше ложных срабатываний на обычном кодинге.
Автоперенаправление на Opus 4.8. Подозрительный запрос молча передаётся более слабой модели. Пользователя уведомляют.
Программа HackerOne. Открыта для исследователей джейлбрейков. Плюс ранний доступ правительства США к будущим frontier-моделям.

Почему это важно

Первый случай экстренной блокировки frontier-модели правительством США. Пока Fable 5 была в офлайне, китайские open-source модели набирали обороты. OpenAI параллельно показала GPT-5.6 — но только группе с правительственным допуском. Та же дилемма двойного назначения.

Anthropic предложила стандарт оценки джейлбрейков: прирост возможностей, широта, лёгкость вооружения, обнаружимость. К инициативе присоединились Amazon, Microsoft и Google.

Fable 5 против Sonnet 5

Параметр	Fable 5	Sonnet 5
SWE-bench Pro	80.3%	63.2%
Senior Engineer	91/100	—
Вход (1M)	$10	$2 / $3
Выход (1M)	$50	$10 / $15
Контекст	1M	1M
Макс. вывод	128K	128K
Thinking	Всегда	Опционально