Xiaomi взорвала ИИ-Мир: новая модель, которая уничтожает все бенчмарки и меняет игру навсегда!

Xiaomi взорвала ИИ-Мир: новая модель, которая уничтожает все бенчмарки и меняет игру навсегда!

Привет, друзья! Сегодня в моём блоге я хочу поделиться свежей новостью из мира искусственного интеллекта. Китайский гигант Xiaomi представил свою новую языковую модель MiMo-V2-Flash, и она уже вызывает настоящий ажиотаж. Давайте разберёмся, почему она крута и что это значит для нас, обычных пользователей.

Что Такое MiMo-V2-Flash: Обзор Новинки

MiMo-V2-Flash — это фундаментальная языковая модель от Xiaomi, выпущенная 16 декабря 2025 года. Она ориентирована на задачи, требующие сильного мышления, кодирования и агентских сценариев, но при этом отлично справляется с повседневными запросами как универсальный ассистент. Модель открыта для глобального использования, что делает её доступной для разработчиков и энтузиастов по всему миру. По сути, это шаг Xiaomi в борьбу за лидерство в ИИ, где она конкурирует с моделями вроде DeepSeek-V3.2 и K2-Thinking.

Архитектура и Технические Характеристики

В основе MiMo-V2-Flash лежит архитектура Mixture-of-Experts (MoE) с общим объемом параметров в 309 миллиардов, из которых активно используются 15 миллиардов. Это позволяет модели быть эффективной без перегрузки ресурсов. Ключевые фичи включают:

  • Гибридную архитектуру внимания: комбинация sliding-window attention (SWA) с окном в 128 токенов и полного внимания в соотношении 5:1. Это обеспечивает баланс между скоростью и точностью, особенно в длинных контекстах.
  • Ультра-длинное окно контекста в 256k токенов, идеальное для многоэтапных взаимодействий и вызовов инструментов.
  • Мульти-токен предсказание (MTP) для самоспекулятивного декодирования, что ускоряет инференс в 2–2,6 раза. Скорость генерации достигает 150 токенов в секунду.
  • Новый подход к пост-тренировке: Multi-Teacher Online Policy Distillation (MOPD), который требует в 50 раз меньше вычислительных ресурсов, чем традиционные методы SFT+RL. Это позволяет модели непрерывно самоулучшаться.

Стоимость использования тоже радует: 0,1 доллара за миллион входных токенов и 0,3 за выходные. В общем, это не просто мощь, а ещё и экономия.

Выдающиеся Результаты в Бенчмарках

MiMo-V2-Flash бьёт рекорды в нескольких ключевых областях. В агентских тестах она лидирует: на τ²-Bench набрала 80,3 балла, с топовыми показателями в телекоме (95,3%), ритейле (79,5%) и авиации (66%). В BrowseComp — 45,4 (до 58,3 с управлением контекстом), а в Terminal Bench — 30,5–38,5.

В математике и рассуждениях: 94,1% на AIME 2025 и 83,7% на GPQA-Diamond, что ставит её в топ-2 среди открытых моделей. В кодировании — лидер среди open-source на SWE-Bench Verified (73,4%) и Multilingual (71,7%), на уровне закрытых моделей. Длинные контексты: 60,6% на LongBench V2 и 45,7% на MRCR, где она обходит даже K2-Thinking.

Однако есть нюансы: в AA-Omniscience модель получила -42 балла из-за высокого уровня галлюцинаций, что важно для задач, требующих строгой фактологии. В Artificial Analysis Intelligence — 66 баллов, а в потреблении токенов она чемпион с 150 миллионами на тестовый набор.

Сравнение с Конкурентами и Преимущества

По сравнению с DeepSeek-V3.2 и K2-Thinking, MiMo-V2-Flash держится на равных в рассуждениях и кодировании, но выигрывает в длинных контекстах благодаря SWA. Она легче и быстрее, что делает её идеальной для реальных приложений. Плюс, поддержка режимов "мышления" и мгновенных ответов добавляет гибкости. А функция генерации HTML-страниц одним кликом — это вообще магия для веб-разработчиков, интегрирующаяся с инструментами вроде Claude Code или Cursor.

Доступность и Открытый Исходный Код

Модель открыта под лицензией MIT: базовые веса на Hugging Face (xiaomimimo/MiMo-V2-Flash-Base), технический отчёт на GitHub. Инференс поддерживается в SGLang с первого дня. API доступен на платформе Xiaomi с бесплатным доступом на старте, а чат-демо — на aistudio.xiaomimimo.com. Для разработчиков это шанс поэкспериментировать без барьеров.

Заключение: Что Это Значит для Будущего ИИ

MiMo-V2-Flash — яркий пример, как открытые модели эволюционируют, становясь мощнее и доступнее. Она не идеальна (галлюцинации — вечная проблема ИИ), но её фокус на агентах и эффективности может изменить, как мы используем AI в повседневной жизни. Если вы фанат технологий, обязательно попробуйте! Поделитесь в комментариях, что думаете — может, это новый стандарт? 😊

Xiaomi MiMo
xiaomi mimo
XiaomiMiMo/MiMo-V2-Flash · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Dmitriy Nyashkin

Dmitriy Nyashkin

Веб разработчик, промпт-инженер
Saint-Petersburg