Gemma 4: тихая революция Google, которая больше не выглядит тихой
Когда в Google впервые представили семейство Gemma, индустрия отреагировала почти равнодушно — как будто речь шла о ещё одной «облегчённой» ветке больших моделей, созданной скорее для галочки, чем для реального сражения. Однако с выходом Gemma 4 этот нарратив начал стремительно рассыпаться. Перед нами уже не эксперимент и не побочный продукт экосистемы Gemini, а системный игрок, который, не повышая голос, внезапно оказался в верхней лиге.
И, что важнее, теперь у нас есть не только ощущения, но и цифры, которые делают этот сдвиг почти неудобно очевидным.
Эволюция, которая притворяется скромной
Если Gemma 3 выглядела как аккуратный компромисс между доступностью и качеством, то Gemma 4 — это уже попытка переписать саму идею «открытой модели». Релиз марта 2026 года принёс не просто обновление, а почти полную реструктуризацию линейки: от мобильных E2B и E4B до плотной 31B и гибридной MoE 26B, которая, оставаясь формально крупной моделью, в момент инференса активирует лишь около 3,8 миллиарда параметров, создавая странный, но эффективный парадокс — большая модель, которая ведёт себя как маленькая .
Этот архитектурный сдвиг важен не сам по себе, а в контексте того, куда движется индустрия. Пока одни игроки наращивают параметры как символ статуса, Google, судя по всему, делает ставку на управляемость вычислений. И в этом смысле Gemma 4 оказывается ближе к инженерному инструменту, чем к демонстрации возможностей.
Контекст и мультимодальность: расширение границ восприятия
Одним из самых недооценённых, но критически важных изменений стал рост контекстного окна — до 256 тысяч токенов против 128 тысяч у Gemma 3 . На практике это означает не просто «больше текста», а возможность удерживать сложные цепочки рассуждений без деградации качества, что особенно заметно в задачах анализа кода, юридических документов и длинных диалогов.
Но ещё более показателен сдвиг в сторону полной мультимодальности. Если в Gemma 3 она была привилегией старших моделей, то Gemma 4 делает её базовым свойством всей линейки: текст, изображения, видео, а в мобильных версиях — даже аудио. Этот шаг выглядит не столько как гонка за функциональностью, сколько как попытка синхронизировать модель с реальным миром, где данные давно перестали быть исключительно текстовыми .
Бенчмарки: момент, когда цифры начинают говорить громче маркетинга
Самое интересное начинается там, где заканчиваются архитектурные описания и начинаются измерения. Потому что именно здесь Gemma 4 перестаёт быть «ещё одной моделью Google» и превращается в статистически подтверждённый скачок.
На задачах многозадачного понимания, таких как MMMLU, разрыв между поколениями выглядит почти неловко: 85,2% точности у Gemma 4 против 67,6% у Gemma 3. И это не просто улучшение — это смена класса модели .
В математике ситуация ещё драматичнее. Результаты на AIME-2026 — 89,2% против 20,8% — выглядят не как эволюция, а как смена парадигмы. Там, где предыдущая версия с трудом справлялась с олимпиадными задачами, новая демонстрирует почти уверенное владение многошаговым reasoning .
Код, традиционно слабое место многих моделей, тоже перестаёт быть проблемой. Рост с 29,1% до 80% на LiveCodeBench — это уже не косметика, а полноценный переход в категорию инструментов, пригодных для реальной разработки .
И, пожалуй, наиболее показательный момент — мультимодальные тесты. Там, где Gemma 3 едва преодолевала отметку в 50%, Gemma 4 уверенно приближается к 77%, что особенно важно в эпоху, где границы между типами данных стремительно размываются .
Производительность: компромисс, который почти исчез
Исторически любое улучшение качества сопровождалось ростом требований к железу. Gemma 4 пытается сломать этот закон — и частично ей это удаётся.
Да, старшая 31B модель требует около 58 ГБ видеопамяти и фактически привязана к серверным GPU, что делает её инструментом не для всех. Однако появление MoE-архитектуры и «эффективных» моделей E-серии создаёт неожиданный баланс: теперь можно выбирать не между «слабой и дешёвой» и «сильной и дорогой», а между разными профилями эффективности .
Именно здесь Gemma 4 начинает выглядеть особенно современно. Она не навязывает единственный сценарий использования, а предлагает спектр — от edge-устройств до дата-центров.
Реальные тесты: предсказуемость как новая метрика качества
Однако за пределами таблиц проявляется ещё одна, менее очевидная особенность. Gemma 4 — это модель, которая стала заметно «спокойнее». Она реже галлюцинирует, аккуратнее работает с неопределённостью и, что особенно важно, лучше удерживает логическую структуру ответа.
Это не та характеристика, которую легко измерить, но именно она начинает определять ценность модели в продакшене. В мире, где ошибки стоят дорого, предсказуемость оказывается важнее креативности.
И в этом смысле Gemma 4 выглядит как модель, созданная не для демонстраций, а для работы.
Между хайпом и инфраструктурой
На фоне громких релизов последних лет Gemma 4 могла бы затеряться — в ней нет революционной риторики, нет заявлений о «новой эре». Но парадокс в том, что именно такие релизы со временем оказываются наиболее значимыми.
Потому что, пока одни модели борются за внимание, другие тихо становятся стандартом.
Gemma 4 — из вторых. И, возможно, именно поэтому через несколько лет мы будем вспоминать её не как сенсацию, а как точку, в которой индустрия окончательно выбрала путь зрелости.
Комментарии ()