Xiaomi MiMo V2.5:
Модель 310B, которая просто догнал Клод Опус о эффективности токенов.
Xiaomi MiMo V2.5 Это наиболее значимый релиз с открытым исходным кодом во втором квартале 2026 года — разреженная модель Mixture-of-Experts объемом 310 байт с собственным многомодальным пониманием, контекстным окном в 1 миллион токенов и показателями производительности, которые ставят ее на один уровень с Claude Opus и Gemini 3 Pro, при этом она значительно превосходит их по производительности. На 40–60% меньше токеновВот полный обзор: архитектура, тесты производительности, задачи из реальной жизни, цены и сравнение с решениями на рынке закрытого программного обеспечения.

Что такое Xiaomi MiMo V2.5?
MiMo V2.5 — это новейшая модель в семействе от MiMo. Команда MiMo компании Xiaomiвыпущенный в конце апреля 2026 года и сразу же перенесенный на Обнимающее лицо в качестве открытых весов. На самом деле в линейке представлены две флагманские модели, а также набор TTS и модель ASR — и это различие важно, потому что большая часть шумихи в интернете смешивает их.
Линия разветвляется вот так:
- MiMo-V2.5 — Специалист широкого профиля в области мультимодальных технологий («омни»).
310B всего параметров,15B активныйРазреженная архитектура MoE, обученная на 48 токенах. Нативное распознавание изображений и звука. Универсальная система. - MiMo-V2.5-Pro — Специалист по "агентам".
1.02T всего параметров,42B активныйТа же гибридная архитектура внимания, но тщательно настроенная для долгосрочного программирования и обработки тысяч обращений к инструментам. - MiMo-V2.5-TTS — Трехрежимный набор инструментов для генерации речи (TTS, VoiceDesign, VoiceClone) с возможностью управления скоростью, эмоциональным состоянием и тоном с помощью инструкций по стилю.
- MiMo-V2.5-ASR — Сквозное распознавание речи, поддерживающее китайские диалекты (уский, кантонский, хоккиенский, сычуаньский), речь с переключением кодов, тексты песен и шумную акустическую среду.
Обе флагманские модели имеют собственную разработку. гибридное внимание скользящего окна Архитектура унаследована от MiMo-V2-Flash, с выделенными визуальными и аудиокодерами, соединенными через легкие проекторы. Обе модели поставляются с собственными компонентами. 1 048 576-токеновое контекстное окноНи один из них не взимает множитель за длину контекста — Xiaomi убрала его в день запуска.
MiMo V2.5 против Claude Opus, Gemini 3 Pro, GPT-5.4
Главный эталонный показатель — и тот, с которого Xiaomi начала запуск — это ClawEvalЭто многоэтапный набор агентных задач, в котором модель должна планировать, вызывать инструменты и итерировать в течение длительного периода времени. тот Этот тест, соответствующий реальным производственным нагрузкам агентов, показывает, что MiMo V2.5 демонстрирует свои лучшие качества.
| Модель | Проход ClawEval³ | Токены / Траектория | Рейтинг с поправкой на стоимость |
|---|---|---|---|
| MiMo V2.5-Pro | 63,8 – 64,0% | ~70 тыс. | #1 (Граница Парето) |
| MiMo V2.5 (базовая версия) | 62,3% | ~75 тыс. | Связанная граница |
| Клод Опус 4.6 | ~65,4% | ~120–175 тыс. | Более высокая стоимость |
| Gemini 3.1 Pro | ~63% | ~115 тыс. | Более высокая стоимость |
| ГПТ-5.4 | ~62% | ~110 тыс. | Более высокая стоимость |
Главный вывод: Claude Opus 4.6 по-прежнему немного превосходит конкурентов по своим основным характеристикам.Однако MiMo V2.5-Pro достигает примерно тех же результатов, затрачивая при этом примерно на 40–60% меньше токенов. В пересчете на одну траекторию это составляет... нет ошибка округления. Издание VentureBeat отметилоВ мире, где GitHub Copilot и большинство платформ для агентов переходят на оплату по факту использования, эффективность использования токенов напрямую конвертируется в реальные деньги для любой команды, использующей агентов в больших масштабах.
По другим показателям, картина выглядит как специализация на программировании:
- SWE-bench Pro:
57,2%— с разницей всего в полбалла от показателей Claude Opus 4.6 и GPT-5.4. - Terminal-Bench 2.0: Лидирует в общем зачете с Opus 4.6 и Gemini 3.1 Pro.
- Видео-ММЕ:
87.7— По качеству изображения на уровне Gemini 3 Pro. - GDPVal-AA (Elo):
1581— превосходит Kimi K2.6 и GLM 5.1. - Запоминание в длинном контексте (1М):
0,37 BFS / 0,62 Родители— где большинство конкурентов после достижения отметки в 512 тысяч падают почти до нуля.
В чём его недостатки: HLE (Последний экзамен человечества) и GDPVal-AA — общие рассуждения — Обе модели отдают предпочтение широким кругозорам, а не узким знаниям в области программирования. Если вам нужен репетитор или эрудит, эта модель вам не подойдет. Но если вам нужен агент, который создает код, то это именно она.

На что способен MiMo V2.5-Pro?
Бенчмарки — это одно. Xiaomi пошла дальше и опубликовала четыре таких теста. многочасовые автономные выполнения задач — это работа, где агента нельзя держать в руках. К таким демонстрациям стоит отнестись серьезно, потому что они включают в себя полную трассировку вызовов инструментов.
Запуск компилятора Rust — это то, что нужно усвоить. Это не игрушка. Это настоящий учебный проект по PKU с реальным скрытым набором тестов, и даже в условиях ограниченного бюджета закрытой модели было бы сложно выполнить его за один раз. Вот как на самом деле выглядит фраза «долгосрочная согласованность» в производственной среде.
Цена MiMo V2.5 — и почему это действительно так.
Вот здесь позиционирование открытого исходного кода становится интересным. MiMo V2.5 поставляется под… открытые веса на Hugging Face Для самостоятельного размещения Xiaomi также предлагает размещенный API с агрессивной ценовой политикой и моделью подписки «План токенов», аналогичной предложениям Claude Code и OpenAI с фиксированной ценой.
Следует обратить внимание на два момента: попадания в кэш приводят к снижению стоимости ввода до минимального значения. 0,20–0,40 долл. за миллион токенов, а Xiaomi организовала запись в кэш. бесплатно В течение ограниченного периода запуска. Множитель контекста в 1 миллион также исчез. Если вы используете агентов с долгосрочным горизонтом, реальная разница в стоимости по сравнению с моделями с закрытым исходным кодом ближе к 10× чем 5×.
Для команд, предпочитающих фиксированную ставку, предлагается четырехступенчатая система оплаты. План токенов идет от 63,36 долл./год (Облегченная версия, 720 млн кредитов) 1056 долларов в год (Максимум 19,2 млрд кредитов) — и совместим с Claude Code, OpenCode и Kilo в качестве готовых модулей.
Стоит ли использовать MiMo V2.5? Плюсы, минусы и для кого это предназначено.
Сильные стороны
- Лучшая в своем классе эффективность использования токенов при выполнении агентских задач (на 40–60% меньше токенов, чем в Claude Opus 4.6).
- Реальный полезный контекст с 1 миллионом токенов — не обваливается ниже 512 тысяч, как большинство конкурентов.
- Встроенная мультимодальная обработка в рамках одной модели (изображение, видео, аудио, текст).
- Доступны свободные веса на Hugging Face — можно разместить на собственном сервере и точно настроить параметры.
- «Осведомленность о состоянии страховочного пояса» — активно управляет собственным контекстом в тысячах вызовов инструментов.
- Совместимость с Claude Code, OpenCode и Kilo.
Слабости
- Тестирование на основе широких критериев оценки логического мышления (HLE, GDPVal-AA) — подход, ориентированный на программирование.
- Данные об эффективности токенов, полученные на основе самоотчетов, нуждаются в независимом подтверждении.
- Развернутая инфраструктура за пределами Китая все еще находится на стадии становления — задержка может варьироваться.
- Экосистема вызовов инструментов и интеграции с ними менее проверены в реальных условиях, чем у Claude или GPT.
- Документация и поддержка со стороны местного сообщества все еще отстают от западных поставщиков медицинских услуг.
Кому следует использовать MiMo V2.5?
Если вы строите агентные рабочие процессы кодирования — Долгосрочная перспектива, многофункциональный инструмент, масштабируемость репозитория — и если экономика вашей единицы продукции зависит от стоимости токенов, MiMo V2.5-Pro теперь в списке кандидатов. То же самое относится к любой команде, использующей мультимодальных агентов с глубоким пониманием видео или документов.
Кому лучше остаться с Клодом или с GPT?
Если ваша основная рабочая нагрузка Обсуждение общих идей, обобщение результатов исследований или работа с общими знаниями.Claude Opus 4.7 и GPT-5.5 по-прежнему сохраняют свои преимущества. Западные модели также обладают более зрелой экосистемой инструментов, более длительным опытом стабильной работы под производственной нагрузкой и более надежными гарантиями обработки корпоративных данных.
Часто задаваемые вопросы
Действительно ли MiMo V2.5 является проектом с открытым исходным кодом?
MiMo V2.5 лучше, чем Claude Opus 4.7?
Сколько стоит MiMo V2.5 через API?
Можно ли использовать MiMo V2.5 с Claude Code или OpenCode?
Какое оборудование мне понадобится для самостоятельного размещения MiMo V2.5?
Что такое "осведомленность о безопасности при использовании страховочных систем" и почему это важно?
В сфере открытого программного обеспечения произошел новый прорыв.
MiMo V2.5 не является заменой шедевру для всех рабочих нагрузок, но для масштабируемого агентного программирования это новый лидер по соотношению цены и качества, и разрыв с закрытым исходным кодом официально стал близок к завершению. Мы будем отслеживать реальные примеры использования, сторонние тесты и развитие экосистемы по мере ее появления.


Авторизоваться














