Рекомендуемый блог

Xiaomi MiMo V2.5: модель 310B, которая превзошла Claude Opus по эффективности использования токенов.

2026-05-06
ai.cc — model_review.md
~/posts/2026/ ЗАПИСЬ 0427
Искусственный интеллект с открытым исходным кодом · Заявка подана в апреле 2026 г.

Xiaomi MiMo V2.5:
Модель 310B, которая просто догнал Клод Опус о эффективности токенов.

Xiaomi MiMo V2.5 Это наиболее значимый релиз с открытым исходным кодом во втором квартале 2026 года — разреженная модель Mixture-of-Experts объемом 310 байт с собственным многомодальным пониманием, контекстным окном в 1 миллион токенов и показателями производительности, которые ставят ее на один уровень с Claude Opus и Gemini 3 Pro, при этом она значительно превосходит их по производительности. На 40–60% меньше токеновВот полный обзор: архитектура, тесты производительности, задачи из реальной жизни, цены и сравнение с решениями на рынке закрытого программного обеспечения.

Модель
MiMo-V2.5 / V2.5-Pro
Параметры
310B / 1.02T
Контекст
1 048 576 токенов
Лицензия
Открытый вес · MIT
Официальный баннер выпуска модели Xiaomi MiMo V2.5
Рис. 01 MiMo V2.5 — флагманский смартфон Xiaomi с открытым корпусом, релиз в апреле 2026 года.

Что такое Xiaomi MiMo V2.5?

MiMo V2.5 — это новейшая модель в семействе от MiMo. Команда MiMo компании Xiaomiвыпущенный в конце апреля 2026 года и сразу же перенесенный на Обнимающее лицо в качестве открытых весов. На самом деле в линейке представлены две флагманские модели, а также набор TTS и модель ASR — и это различие важно, потому что большая часть шумихи в интернете смешивает их.

Линия разветвляется вот так:

  • MiMo-V2.5 — Специалист широкого профиля в области мультимодальных технологий («омни»). 310B всего параметров, 15B активныйРазреженная архитектура MoE, обученная на 48 токенах. Нативное распознавание изображений и звука. Универсальная система.
  • MiMo-V2.5-Pro — Специалист по "агентам". 1.02T всего параметров, 42B активныйТа же гибридная архитектура внимания, но тщательно настроенная для долгосрочного программирования и обработки тысяч обращений к инструментам.
  • MiMo-V2.5-TTS — Трехрежимный набор инструментов для генерации речи (TTS, VoiceDesign, VoiceClone) с возможностью управления скоростью, эмоциональным состоянием и тоном с помощью инструкций по стилю.
  • MiMo-V2.5-ASR — Сквозное распознавание речи, поддерживающее китайские диалекты (уский, кантонский, хоккиенский, сычуаньский), речь с переключением кодов, тексты песен и шумную акустическую среду.

Обе флагманские модели имеют собственную разработку. гибридное внимание скользящего окна Архитектура унаследована от MiMo-V2-Flash, с выделенными визуальными и аудиокодерами, соединенными через легкие проекторы. Обе модели поставляются с собственными компонентами. 1 048 576-токеновое контекстное окноНи один из них не взимает множитель за длину контекста — Xiaomi убрала его в день запуска.

Компания Xiaomi не выпустила модель Frontier, которая бы соответствовала уровню интеллекта Claude. Они выпустили модель Frontier, которая бы соответствовала уровню интеллекта Claude, но... примерно половина стоимости токена — это единственная цифра, которая имеет значение, как только вы перестанете говорить и начнете отгружать.

MiMo V2.5 против Claude Opus, Gemini 3 Pro, GPT-5.4

Главный эталонный показатель — и тот, с которого Xiaomi начала запуск — это ClawEvalЭто многоэтапный набор агентных задач, в котором модель должна планировать, вызывать инструменты и итерировать в течение длительного периода времени. тот Этот тест, соответствующий реальным производственным нагрузкам агентов, показывает, что MiMo V2.5 демонстрирует свои лучшие качества.

Модель Проход ClawEval³ Токены / Траектория Рейтинг с поправкой на стоимость
MiMo V2.5-Pro 63,8 – 64,0% ~70 тыс. #1 (Граница Парето)
MiMo V2.5 (базовая версия) 62,3% ~75 тыс. Связанная граница
Клод Опус 4.6 ~65,4% ~120–175 тыс. Более высокая стоимость
Gemini 3.1 Pro ~63% ~115 тыс. Более высокая стоимость
ГПТ-5.4 ~62% ~110 тыс. Более высокая стоимость

Главный вывод: Claude Opus 4.6 по-прежнему немного превосходит конкурентов по своим основным характеристикам.Однако MiMo V2.5-Pro ​​достигает примерно тех же результатов, затрачивая при этом примерно на 40–60% меньше токенов. В пересчете на одну траекторию это составляет... нет ошибка округления. Издание VentureBeat отметилоВ мире, где GitHub Copilot и большинство платформ для агентов переходят на оплату по факту использования, эффективность использования токенов напрямую конвертируется в реальные деньги для любой команды, использующей агентов в больших масштабах.

По другим показателям, картина выглядит как специализация на программировании:

  • SWE-bench Pro: 57,2% — с разницей всего в полбалла от показателей Claude Opus 4.6 и GPT-5.4.
  • Terminal-Bench 2.0: Лидирует в общем зачете с Opus 4.6 и Gemini 3.1 Pro.
  • Видео-ММЕ: 87.7 — По качеству изображения на уровне Gemini 3 Pro.
  • GDPVal-AA (Elo): 1581 — превосходит Kimi K2.6 и GLM 5.1.
  • Запоминание в длинном контексте (1М): 0,37 BFS / 0,62 Родители — где большинство конкурентов после достижения отметки в 512 тысяч падают почти до нуля.

В чём его недостатки: HLE (Последний экзамен человечества) и GDPVal-AA — общие рассуждения — Обе модели отдают предпочтение широким кругозорам, а не узким знаниям в области программирования. Если вам нужен репетитор или эрудит, эта модель вам не подойдет. Но если вам нужен агент, который создает код, то это именно она.

Архитектура MiMo V2.5 и визуализация результатов бенчмарков
Рис. 02 Гибридная разреженная архитектура MoE — структурное преимущество версии 2.5 по стоимости.

На что способен MiMo V2.5-Pro?

Бенчмарки — это одно. Xiaomi пошла дальше и опубликовала четыре таких теста. многочасовые автономные выполнения задач — это работа, где агента нельзя держать в руках. К таким демонстрациям стоит отнестись серьезно, потому что они включают в себя полную трассировку вызовов инструментов.

ЗАДАНИЕ / 01ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ НА АНГЛИЙСКОМ ЯЗЫКЕ
Компилятор SysY на Rust
233 / 233
Разработал с нуля полноценный компилятор — лексер, парсер, AST, генерацию кода Koopa IR, бэкенд для RISC-V. 4,3 часа, 672 вызова инструмента. Идеальный результат в скрытом тестовом наборе Пекинского университета (проект, на выполнение которого студенту, изучающему информатику, требуется несколько недель).
ЗАДАНИЕ / 02ПРИЛОЖЕНИЕ
Видеоредактор для рабочего стола
8192 МЕСТА
На основе нескольких подсказок: многодорожечная временная шкала, обрезка клипов, плавные переходы, микширование звука, конвейер экспорта. 11,5 часов, 1868 вызовов инструментов. Голосовое сопровождение с использованием искусственного интеллекта, управляемое MiMo-V2-TTS.
ЗАДАНИЕ / 03АППАРАТНОЕ ОБОРУДОВАНИЕ EDA
Аналоговая схема FVF-LDO
~1 час
Разработан и оптимизирован стабилизатор напряжения с низким падением напряжения в 180-нм КМОП-технологии TSMC с использованием ngspice в замкнутом контуре. Шесть показателей одновременно соответствовали техническим требованиям; четыре из них улучшились на порядок по сравнению с первой попыткой модели.
ЗАДАНИЕ / 04ОСВЕДОМЛЕННОСТЬ О РЕМНЯХ БЕЗОПАСНОСТИ
Контекст самоуправления
1 млн токенов
Во всех четырех запусках V2.5-Pro ​​продемонстрировал "осознание работы системы" — активно управляя собственной памятью, формируя собственное контекстное окно и направляясь к конечным целям на протяжении тысяч последовательных вызовов инструментов.

Запуск компилятора Rust — это то, что нужно усвоить. Это не игрушка. Это настоящий учебный проект по PKU с реальным скрытым набором тестов, и даже в условиях ограниченного бюджета закрытой модели было бы сложно выполнить его за один раз. Вот как на самом деле выглядит фраза «долгосрочная согласованность» в производственной среде.

Цена MiMo V2.5 — и почему это действительно так.

Вот здесь позиционирование открытого исходного кода становится интересным. MiMo V2.5 поставляется под… открытые веса на Hugging Face Для самостоятельного размещения Xiaomi также предлагает размещенный API с агрессивной ценовой политикой и моделью подписки «План токенов», аналогичной предложениям Claude Code и OpenAI с фиксированной ценой.

Ценообразование API — за 1 млн токенов (за рубежом) ОБНОВЛЕНО 04.2026
Модель
Вход
Выход
vs Opus 4.7
MiMo V2.5 (базовая версия)
0,40 доллара
2,00 доллара
примерно в 13 раз дешевле
MiMo V2.5-Pro
1,00 долл.
3,00 доллара
примерно в 5–8 раз дешевле
Клод Опус 4.7
5,00 долларов
25,00 долларов
исходный уровень
ГПТ-5.5
5,00 долларов
30,00 долларов
исходный уровень

Следует обратить внимание на два момента: попадания в кэш приводят к снижению стоимости ввода до минимального значения. 0,20–0,40 долл. за миллион токенов, а Xiaomi организовала запись в кэш. бесплатно В течение ограниченного периода запуска. Множитель контекста в 1 миллион также исчез. Если вы используете агентов с долгосрочным горизонтом, реальная разница в стоимости по сравнению с моделями с закрытым исходным кодом ближе к 10× чем .

Для команд, предпочитающих фиксированную ставку, предлагается четырехступенчатая система оплаты. План токенов идет от 63,36 долл./год (Облегченная версия, 720 млн кредитов) 1056 долларов в год (Максимум 19,2 млрд кредитов) — и совместим с Claude Code, OpenCode и Kilo в качестве готовых модулей.

Стоит ли использовать MiMo V2.5? Плюсы, минусы и для кого это предназначено.

Сильные стороны

  • Лучшая в своем классе эффективность использования токенов при выполнении агентских задач (на 40–60% меньше токенов, чем в Claude Opus 4.6).
  • Реальный полезный контекст с 1 миллионом токенов — не обваливается ниже 512 тысяч, как большинство конкурентов.
  • Встроенная мультимодальная обработка в рамках одной модели (изображение, видео, аудио, текст).
  • Доступны свободные веса на Hugging Face — можно разместить на собственном сервере и точно настроить параметры.
  • «Осведомленность о состоянии страховочного пояса» — активно управляет собственным контекстом в тысячах вызовов инструментов.
  • Совместимость с Claude Code, OpenCode и Kilo.

Слабости

  • Тестирование на основе широких критериев оценки логического мышления (HLE, GDPVal-AA) — подход, ориентированный на программирование.
  • Данные об эффективности токенов, полученные на основе самоотчетов, нуждаются в независимом подтверждении.
  • Развернутая инфраструктура за пределами Китая все еще находится на стадии становления — задержка может варьироваться.
  • Экосистема вызовов инструментов и интеграции с ними менее проверены в реальных условиях, чем у Claude или GPT.
  • Документация и поддержка со стороны местного сообщества все еще отстают от западных поставщиков медицинских услуг.

Кому следует использовать MiMo V2.5?

Если вы строите агентные рабочие процессы кодирования — Долгосрочная перспектива, многофункциональный инструмент, масштабируемость репозитория — и если экономика вашей единицы продукции зависит от стоимости токенов, MiMo V2.5-Pro ​​теперь в списке кандидатов. То же самое относится к любой команде, использующей мультимодальных агентов с глубоким пониманием видео или документов.

Кому лучше остаться с Клодом или с GPT?

Если ваша основная рабочая нагрузка Обсуждение общих идей, обобщение результатов исследований или работа с общими знаниями.Claude Opus 4.7 и GPT-5.5 по-прежнему сохраняют свои преимущества. Западные модели также обладают более зрелой экосистемой инструментов, более длительным опытом стабильной работы под производственной нагрузкой и более надежными гарантиями обработки корпоративных данных.

Часто задаваемые вопросы

Действительно ли MiMo V2.5 является проектом с открытым исходным кодом?
Да. Полная серия V2.5 — включая V2.5, V2.5-Pro, пакет TTS и модель ASR — опубликована на Hugging Face в разделе open weights. Базовая версия V2.5 включает веса, токенизатор и полную карточку модели. Самостоятельное размещение поддерживается через vLLM с официальным руководством по развертыванию от Xiaomi.
MiMo V2.5 лучше, чем Claude Opus 4.7?
Все зависит от задачи. В тестах производительности агентного программирования, таких как ClawEval и Terminal-Bench, V2.5-Pro ​​показывает конкурентоспособные результаты или немного опережает конкурентов, используя при этом на 40–60% меньше токенов. В показателях широкого логического мышления (HLE) и общего интеллекта Claude Opus 4.7 сохраняет явное лидерство. Для рабочих нагрузок агентов в производственной среде V2.5-Pro ​​часто является лучшим выбором с учетом стоимости.
Сколько стоит MiMo V2.5 через API?
MiMo V2.5 (базовая версия) стоит 0,40 доллара за миллион входных токенов и 2,00 доллара за миллион выходных токенов. MiMo V2.5-Pro ​​стоит 1,00 доллар за вход / 3,00 доллара за выход. Попадания в кэш могут снизить стоимость входа до 0,20–0,40 доллара. Множитель за использование полного контекстного окна в 1 миллион токенов больше не используется. Для сравнения, Claude Opus 4.7 стоит 5/25 долларов, а GPT-5.5 — 5/30 долларов.
Можно ли использовать MiMo V2.5 с Claude Code или OpenCode?
Да. Xiaomi явно поддерживает полную совместимость с Claude Code, OpenCode, OpenClaw и Kilo в качестве агентских платформ. Вы можете заменить конечную точку модели и продолжать использовать ту же самую платформу. Это один из наиболее прагматичных путей внедрения для существующих пользователей Claude Code.
Какое оборудование мне понадобится для самостоятельного размещения MiMo V2.5?
Базовая модель V2.5 имеет 310 байт общего объема / 15 байт активных параметров, поэтому объем видеопамяти для инференции масштабируется в зависимости от активного набора параметров плюс экспертная маршрутизация. Разумная конфигурация для самостоятельного размещения использует 8 графических процессоров H100 или H200 с vLLM и тензорным параллелизмом. V2.5-Pro ​​более ресурсоемкая (1,02 байта / 42 байта активных параметров) и обычно требует многоузловой инференции. Большинство производственных команд начинают с размещенного API и выборочно переходят на него.
Что такое "осведомленность о безопасности при использовании страховочных систем" и почему это важно?
«Осведомленность о среде выполнения» — так Xiaomi описывает способность модели активно анализировать собственную среду выполнения, управляя бюджетом памяти, формируя контекстное окно и направляя последовательность вызовов инструментов к достижению конечных целей. В задачах с длительным горизонтом (тысячи вызовов инструментов) это разница между моделью, которая «дребезжит», и моделью, которая «выпускается». Это самая недооцененная возможность в версии V2.5-Pro.

В сфере открытого программного обеспечения произошел новый прорыв.

MiMo V2.5 не является заменой шедевру для всех рабочих нагрузок, но для масштабируемого агентного программирования это новый лидер по соотношению цены и качества, и разрыв с закрытым исходным кодом официально стал близок к завершению. Мы будем отслеживать реальные примеры использования, сторонние тесты и развитие экосистемы по мере ее появления.

// КОНЕЦ ФАЙЛА ai.cc · model_review · v2.5 · 2026

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах