Китайский ИИ-бум: Qwen 2.5-Max против DeepSeek и западных конкурентов
В последнее время сфера искусственного интеллекта в Китае переживает настоящий бум. Компании наперегонки выпускают новые модели, стремясь обойти не только местных конкурентов, но и западных гигантов, таких как OpenAI и Meta. Одним из главных событий последних дней стал релиз Qwen 2.5-Max от Alibaba, который, по заявлениям разработчиков, превосходит DeepSeek V3 и другие ведущие модели. Давайте разберёмся, что это за модель, какие у неё возможности и как она вписывается в общую картину ИИ-гонки.
Что такое Qwen 2.5-Max?
Qwen 2.5-Max — это крупномасштабная языковая модель, построенная на архитектуре Mixture of Experts (MoE). Это означает, что модель состоит из множества специализированных "экспертов", каждый из которых отвечает за определённый тип задач. Такой подход позволяет эффективно обрабатывать запросы, активируя только те части нейросети, которые действительно нужны для решения конкретной задачи.
Модель была обучена на 20 триллионах токенов и прошла этапы Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF), что делает её более точной и адаптированной к запросам пользователей. Однако, в отличие от предыдущих версий Qwen, данные по Qwen 2.5-Max не были выложены в открытый доступ на GitHub или HuggingFace. Это может говорить о том, что релиз был сделан в спешке, чтобы успеть закрепиться на рынке.
Возможности Qwen 2.5-Max
Qwen 2.5-Max — это не просто чат-бот. Модель обладает широким спектром возможностей:
- Генерация кода: Модель может не только писать код, но и выполнять его с помощью встроенной среды Artifacts.
- Веб-поиск: Qwen 2.5-Max умеет искать информацию в интернете, предоставляя актуальные данные.
- Генерация изображений: Модель способна создавать изображения по запросу.
- Анализ документов: Пользователи могут загружать документы для анализа, что делает модель полезной для работы с большими объёмами текста.
Все эти функции доступны бесплатно — достаточно зарегистрироваться по email. Также есть возможность использовать модель через API, но для этого потребуется аккаунт в Alibaba Cloud.
Бенчмарки: как Qwen 2.5-Max справляется с конкурентами
Qwen 2.5-Max показала впечатляющие результаты в нескольких популярных бенчмарках, включая Arena-Hard, LiveBench, LiveCodeBench и GPQA-Diamond. По заявлениям разработчиков, модель превосходит DeepSeek V3 и близка к результатам GPT-4o от OpenAI. Однако стоит отметить, что данные пока не были независимо проверены, и к ним стоит относиться с некоторой долей скепсиса.
Интересно, что Qwen 2.5-Max сравнивали именно с GPT-4o, а не с более мощной моделью o1 от OpenAI. Это может говорить о том, что основная цель Alibaba — укрепить свои позиции на китайском рынке, а не напрямую конкурировать с западными гигантами.
Конкуренция в Китае: Qwen против DeepSeek
Успех DeepSeek, который недавно выпустил модель R1, встряхнул не только Кремниевую долину, но и китайский рынок. После релиза DeepSeek-R1 многие местные компании, включая Alibaba, начали активно совершенствовать свои модели. Qwen 2.5-Max стала ответом Alibaba на вызовы со стороны DeepSeek.
DeepSeek, в свою очередь, продолжает развиваться. После успеха своей модели R1 компания выпустила новую ИИ-модель Janus-Pro-7B, что привело к падению акций технологических компаний в США и даже повлияло на курс криптовалют. Однако успех DeepSeek также привёл к кибератакам на их сервисы, что временно ограничило регистрации пользователей.
Цензура и конфиденциальность: скрытые проблемы китайских моделей
Несмотря на впечатляющие технические характеристики, китайские модели ИИ, включая Qwen 2.5-Max и DeepSeek, сталкиваются с критикой из-за вопросов конфиденциальности и цензуры. Все пользовательские данные хранятся на серверах в Китае или Сингапуре, что вызывает опасения у западных пользователей.
Кроме того, как и другие китайские модели, Qwen 2.5-Max избегает обсуждения "неудобных" тем, таких как события на площади Тяньаньмэнь или политический статус Тайваня. Это ограничивает её универсальность и вызывает вопросы о свободе использования.
Заключение: кто выигрывает в гонке ИИ?
Релиз Qwen 2.5-Max — это ещё один шаг вперёд в гонке искусственного интеллекта. Модель демонстрирует впечатляющие результаты и предлагает широкий спектр возможностей, что делает её серьёзным конкурентом как для китайских, так и для западных разработчиков.
Однако стоит помнить, что успех в бенчмарках — это ещё не всё. Вопросы конфиденциальности, цензуры и доступности данных остаются важными аспектами, которые могут повлиять на популярность модели за пределами Китая.
Пока что китайские компании, такие как Alibaba и DeepSeek, продолжают удивлять мир своими инновациями. Но гонка ИИ только начинается, и впереди нас ждёт ещё много интересных событий.
Вы можете попробовать нейросеть прямо сейчас по ссылке.
* Meta признана экстремистской в РФ и запрещена.
Comments ()