03 авг. 2025 3 min read Новости

Новая ИИ Gemini 2.5 Deep Think от Google обошла OpenAI и xAI

Введение

Google сделала значительный шаг в развитии искусственного интеллекта, запустив свою самую сложную модель для рассуждений — Gemini 2.5 Deep Think. Эта модель, доступная исключительно подписчикам премиального плана Google AI Ultra, представляет собой прорыв в области ИИ, способный изменить подход к решению сложных задач. Она уже показала впечатляющие результаты, обойдя конкурентов, таких как OpenAI и xAI, и открывает новые возможности для науки, бизнеса и творчества. Давайте разберем, что делает эту модель такой особенной.

Что такое Gemini 2.5 Deep Think?

Gemini 2.5 Deep Think — это передовая модель ИИ от Google, разработанная для решения задач, требующих глубокого анализа и рассуждений. В отличие от традиционных моделей ИИ, которые следуют единому пути решения, Deep Think использует технику параллельного мышления. Это позволяет модели одновременно исследовать несколько гипотез и путей решения, выбирая наиболее подходящий вариант. Такой подход особенно эффективен для задач, требующих творчества, стратегического планирования или сложных математических доказательств.

Модель построена на мультиагентной системе, где несколько автономных агентов ИИ работают параллельно, генерируя и оценивая различные гипотезы. Это требует значительных вычислительных ресурсов, но обеспечивает более точные и релевантные результаты. Например, при решении задачи "Поймай крота" на платформе Codeforces, Deep Think смогла отслеживать все потенциальные позиции движущейся цели, эффективно сужая возможности через стратегические запросы. Это демонстрирует способность модели находить сложные решения, которые могут ускользнуть от традиционных методов.

Кроме того, Deep Think использует такие стратегии, как минимакс-оптимизация, для систематического снижения неопределенности на каждом этапе рассуждений. Это делает модель особенно эффективной для задач, требующих пошагового анализа и творческого подхода.

Производительность и бенчмарки

Gemini 2.5 Deep Think демонстрирует выдающиеся результаты на различных бенчмарках, превосходя конкурентов, таких как o3 от OpenAI и Grok 4 от xAI. Вот ключевые достижения:

Humanity's Last Exam: Этот тест включает 2500 сложных вопросов по более чем 100 предметам, включая математику, естественные науки и гуманитарные дисциплины. Gemini 2.5 Deep Think набрала 34,8%, значительно опередив Grok 4 (25,4%) и o3 (20,3%).
LiveCodeBench V6: Deep Think показала превосходные результаты на этой платформе для тестирования навыков программирования, подтвердив свои возможности в решении сложных задач кодирования.
Международная математическая олимпиада (IMO) 2025: Исследовательская версия модели набрала 35 из 42 баллов, решив пять из шести задач и достигнув стандарта золотой медали. Потребительская версия, доступная подписчикам, работает быстрее, но достигает уровня бронзовой медали.

Эти результаты подчеркивают лидерство Google в создании ИИ, способного справляться с задачами, требующими глубокого понимания и сложных рассуждений.

Доступность и подписка

Gemini 2.5 Deep Think доступна исключительно для подписчиков премиального плана Google AI Ultra, стоимость которого составляет $250 в месяц (примерно 23,000 рублей). Подписчики могут активировать Deep Think через приложение Gemini, выбрав модель 2.5 Pro и включив соответствующую функцию.

Подписка Google AI Ultra включает:

Самые высокие лимиты использования среди инструментов ИИ Google.
30 ТБ облачного хранилища.
Доступ к экспериментальным функциям, включая будущие модели генерации видео, такие как Veo 3.
Скидку 50% на первые три месяца для новых подписчиков.

Высокая стоимость подписки объясняется значительными вычислительными ресурсами, необходимыми для работы Deep Think, что делает эту модель эксклюзивной для пользователей, готовых инвестировать в передовые технологии.

Планы на будущее

Google планирует расширить доступ к Gemini 2.5 Deep Think для доверенных тестировщиков через Gemini API в ближайшие недели. Это позволит разработчикам и корпоративным пользователям оценить потенциал технологии для создания приложений и решений в различных областях. Кроме того, Google продолжает совершенствовать свои модели ИИ, внедряя новые подходы к параллельному мышлению и мультиагентным системам. В будущем мы можем ожидать появления еще более мощных и доступных версий Deep Think.

Заключение

Запуск Gemini 2.5 Deep Think — это важный шаг в развитии искусственного интеллекта. Эта модель не только демонстрирует выдающиеся результаты на сложных бенчмарках, но и задает новый стандарт для ИИ, способного решать задачи, требующие глубокого анализа и творческого подхода. Хотя доступ к Deep Think пока ограничен премиальными подписчиками, это свидетельствует о серьезных инвестициях Google в передовые технологии ИИ. В будущем мы, вероятно, увидим, как эти инновации станут доступны более широкой аудитории, открывая новые возможности для науки, бизнеса и повседневной жизни.

Оставайтесь с нами, чтобы быть в курсе всех новинок в мире ИИ!

Сноски

Gemini 2.5 Deep Think — модель ИИ от Google, разработанная для решения сложных задач с использованием параллельного мышления.
Параллельное мышление — техника, при которой ИИ одновременно рассматривает несколько путей решения проблемы.
Мультиагентная система — система, в которой несколько автономных агентов взаимодействуют для достижения общей цели.
Минимакс-оптимизация — стратегия, используемая для минимизации максимальных потерь путем выбора оптимального решения из множества вариантов.
Бенчмарк — стандартизированный тест для оценки производительности системы.
Humanity's Last Exam — набор из 2500 сложных вопросов, охватывающих более 100 предметов, включая математику, естественные науки и гуманитарные дисциплины.
Международная математическая олимпиада (IMO) — престижный международный конкурс по математике для школьников.