Claude Fable 5 вернулась: джейлбрейк, экспортный контроль и 5× дороже Sonnet
9 июня 2026 года Anthropic выкатила Claude Fable 5 — первую общедоступную модель класса Mythos, который компания раньше держала за семью замками из-за кибербезопасности. Модель порвала бенчмарки: 80.3% на SWE-bench Pro (против 69.2% у Opus 4.8), 91/100 на тесте Senior Engineer от Every (против 63 у Opus 4.8). 1 млн токенов контекста, 128K на выход, всегда включённый режим «размышлений». Ценник: $10 за миллион входных / $50 за выходные — в 5 раз дороже Sonnet 5.
А через три дня всё рухнуло.
12 июня Министерство торговли США ввело экстренный экспортный контроль на Fable 5 и её «голую» сестру Mythos 5. Директива требовала отрубить доступ для всех иностранных граждан. Поскольку проверить гражданство каждого пользователя в реальном времени невозможно, компания просто отключила обе модели для всех.
Что случилось? Исследователи Amazon нашли джейлбрейк Fable 5. Промпт заставлял модель находить уязвимости в софте и в одном случае — писать код, демонстрирующий их эксплуатацию.
Что было дальше
Две с половиной недели тишины. 23 июня Fable 5 убрали из тарифов Pro, Max и Team. 26 июня Mythos 5 вернули ~100 компаниям и федеральным агентствам США.
30 июня Минторг снял ограничения — и 1 июля Fable 5 снова в строю. До 7 июля модель включена в подписки Pro/Max/Team (до 50% недельного лимита), потом — только кредиты.
А был ли джейлбрейк?
Anthropic сыграла инцидент вниз. По их заявлению, те же уязвимости находят все протестированные модели — Opus 4.8, GPT-5.5, Kimi K2.7, Haiku 4.5, Sonnet 4.6. Компания называет это рутинным defensive security, а не суперспособностью.
Но правительство и Amazon (чей CEO Энди Джесси, по данным WSJ, лично продавливал ограничения) посчитали иначе. Бывший AI-царь Белого дома Дэвид Сакс обвинил Anthropic в том, что компания «поставила доступность потребительской модели выше безопасности». Часть экспертов сочла блокировку перегибом — группа security-лидеров подписала открытое письмо с требованием снять ограничения.
Переговоры с администрацией вёл сооснователь Том Браун, а не CEO Дарио Амодеи — который конфликтовал с Белым домом большую часть года.
Что поменялось
За две недели простоя Anthropic сделала три вещи:
- Новый классификатор безопасности. Обучен ловить конкретную технику джейлбрейка. Блокирует >99% попыток. Минус — больше ложных срабатываний на обычном кодинге.
- Автоперенаправление на Opus 4.8. Подозрительный запрос молча передаётся более слабой модели. Пользователя уведомляют.
- Программа HackerOne. Открыта для исследователей джейлбрейков. Плюс ранний доступ правительства США к будущим frontier-моделям.
Почему это важно
Первый случай экстренной блокировки frontier-модели правительством США. Пока Fable 5 была в офлайне, китайские open-source модели набирали обороты. OpenAI параллельно показала GPT-5.6 — но только группе с правительственным допуском. Та же дилемма двойного назначения.
Anthropic предложила стандарт оценки джейлбрейков: прирост возможностей, широта, лёгкость вооружения, обнаружимость. К инициативе присоединились Amazon, Microsoft и Google.
Fable 5 против Sonnet 5
| Параметр | Fable 5 | Sonnet 5 |
|---|---|---|
| SWE-bench Pro | 80.3% | 63.2% |
| Senior Engineer | 91/100 | — |
| Вход (1M) | $10 | $2 / $3 |
| Выход (1M) | $50 | $10 / $15 |
| Контекст | 1M | 1M |
| Макс. вывод | 128K | 128K |
| Thinking | Всегда | Опционально |
Стоит ли платить?
Fable 5 стоит $10/$50 — в 5 раз дороже Sonnet 5. Из-за always-on thinking реальная разница ещё выше: больше выходных токенов → больше денег.
Платить стоит за автономных агентов на длинных горизонтах и сложный код с первой попытки. Всё остальное закрывает Sonnet 5 за пятую часть цены.
До 7 июля — окно потестировать в подписке. Дальше — готовьте кредиты.
Комментарии ()