19 мар. 2026 4 min read Новости

MiniMax M2.7: модель, которая переписывает саму себя — и, возможно, правила всей индустрии

Когда AI перестает быть инструментом

В индустрии, привыкшей измерять прогресс в процентах бенчмарков и долях секунды latency, релизы обычно выглядят как аккуратные шаги вперед — немного лучше код пишет, немного точнее отвечает, немного дешевле стоит. Но появление MiniMax M2.7 разрушает этот привычный ритм: перед нами не просто новая модель, а попытка изменить саму механику эволюции искусственного интеллекта.

Компания MiniMax, аккуратно продвигаясь в тени более громких игроков, вдруг делает ставку не на очередной скачок качества, а на куда более радикальную идею — передать часть процесса разработки самому ИИ. И если раньше это звучало как футуристическая метафора, то теперь это оформлено в инженерный пайплайн, где модель не только решает задачи, но и улучшает собственные способы их решения.

Самоэволюция как инженерная практика

Ключевой тезис M2.7 звучит почти вызывающе: модель «глубоко участвует в собственной эволюции». За этой формулировкой скрывается вполне конкретный механизм — циклический процесс, в котором система анализирует ошибки, планирует изменения, модифицирует собственную архитектуру (или, точнее, окружение — agent harness), тестирует результаты и принимает решение, стоит ли закреплять улучшения.

Причем речь идет не о единичных экспериментах, а о более чем сотне автономных итераций, в ходе которых модель оптимизирует параметры генерации, находит повторяющиеся баги, перестраивает workflow и даже внедряет защиту от зацикливания. Итогом становится прирост производительности примерно на 30% на внутренних задачах.

В этом месте индустрия, кажется, делает шаг от привычного «fine-tuning руками человека» к более сложной конструкции — системе, где человек задает направление, но не участвует в каждом шаге оптимизации. Исследователи MiniMax описывают это почти буднично: модель сама собирает датасеты, сама строит evaluation-пайплайны и сама же предлагает изменения, оставляя человеку роль арбитра, а не исполнителя.

Именно здесь возникает главный нерв релиза: если раньше улучшение модели было внешним процессом, то теперь оно становится внутренним свойством системы.

Инженер, который не устает

Однако философия — лишь половина истории. Вторая половина, куда более приземленная, — это производительность, и здесь M2.7 неожиданно уверенно держится рядом с лидерами рынка.

На бенчмарке SWE-Pro модель показывает 56.22%, фактически догоняя топовые решения уровня GPT-5.3-Codex и приближаясь к Opus. На задачах полного цикла разработки (VIBE-Pro) она демонстрирует 55.6%, а на Terminal Bench 2 — 57%, что говорит уже не о генерации кода, а о понимании систем целиком.

Но куда важнее не сами цифры, а их контекст: M2.7 позиционируется не как «еще один copilot», а как полноценный инженерный агент, способный довести проект от постановки задачи до деплоя. Внутренние тесты показывают, что модель может разбирать production-инциденты и находить решения за считанные минуты, а в исследовательских сценариях — самостоятельно вести эксперименты, отслеживать метрики и вносить правки в код.

В этом смысле M2.7 — это не столько конкурент IDE-помощников, сколько попытка создать автономного участника команды.

Агентные системы вместо промптов

Одновременно с самоэволюцией MiniMax делает еще один важный ход — ставка на нативные multi-agent системы. В отличие от подхода, где сложные сценарии строятся поверх одного LLM через промпт-инженерию, здесь архитектура изначально предполагает наличие «команды агентов», каждый из которых выполняет свою роль.

Это различие кажется тонким, но на практике оно определяет потолок сложности задач. MiniMax прямо указывает, что такие системы невозможно построить только за счет хитрых промптов — им нужна поддержка на уровне самой модели.

Внутри компании такие агентные связки уже используются для разработки самой модели: один агент ведет эксперименты, другой анализирует логи, третий занимается оптимизацией кода. В результате, по оценкам MiniMax, модель берет на себя до половины исследовательского workflow.

И это, пожалуй, еще один тревожный сигнал для индустрии: граница между «инструментом» и «исполнителем» становится все менее различимой.

Офис, исследования и немного театра

Любопытно, что M2.7 не ограничивается инженерией. В офисных задачах модель достигает ELO 1495 на GDPval-AA — лучшего результата среди open-source решений, демонстрируя способность к сложным многошаговым правкам документов, презентаций и таблиц.

При этом MiniMax неожиданно добавляет слой «эмоционального интеллекта» и даже визуального взаимодействия через OpenRoom — систему, где персонажи реагируют на диалог в реальном времени. Это выглядит почти как побочный эксперимент, но на самом деле подчеркивает более широкую амбицию: сделать AI не только эффективным, но и социально «присутствующим».

Так индустрия, сама того не замечая, начинает двигаться от утилитарных ассистентов к цифровым агентам с поведенческой моделью.

Между хайпом и неизбежностью

Конечно, за всей этой эйфорией скрываются и ограничения. M2.7 все еще уступает лидерам в отдельных бенчмарках и не предлагает, например, полноценной мультимодальности уровня топовых моделей. Да и сама идея «самоэволюции» пока ограничена рамками заранее заданной инфраструктуры — модель не переписывает собственные веса в прямом смысле.

Но важно другое: направление уже задано.

Если раньше гонка шла за тем, кто обучит более мощную модель, то теперь она постепенно смещается к тому, кто создаст систему, способную улучшать себя быстрее других. И в этой новой парадигме выигрывает не самый умный, а самый адаптивный.

MiniMax M2.7, при всех своих оговорках, выглядит как первый уверенный прототип такой системы — не идеальной, но достаточно убедительной, чтобы заставить конкурентов нервно пересматривать свои roadmap.

И, возможно, именно здесь начинается новая глава: когда главный вопрос звучит уже не «насколько умна модель», а «насколько быстро она может стать умнее самой себя».