ai.cc — model_review.md

~/posts/2026/ ЗАПИСЬ 0427

Искусственный интеллект с открытым исходным кодом · Заявка подана в апреле 2026 г.

Xiaomi MiMo V2.5:
Модель 310B, которая просто догнал Клод Опус о эффективности токенов.

Xiaomi MiMo V2.5 Это наиболее значимый релиз с открытым исходным кодом во втором квартале 2026 года — разреженная модель Mixture-of-Experts объемом 310 байт с собственным многомодальным пониманием, контекстным окном в 1 миллион токенов и показателями производительности, которые ставят ее на один уровень с Claude Opus и Gemini 3 Pro, при этом она значительно превосходит их по производительности. На 40–60% меньше токеновВот полный обзор: архитектура, тесты производительности, задачи из реальной жизни, цены и сравнение с решениями на рынке закрытого программного обеспечения.

Модель

MiMo-V2.5 / V2.5-Pro

Параметры

310B / 1.02T

Контекст

1 048 576 токенов

Лицензия

Открытый вес · MIT

Официальный баннер выпуска модели Xiaomi MiMo V2.5 — Рис. 01 MiMo V2.5 — флагманский смартфон Xiaomi с открытым корпусом, релиз в апреле 2026 года.

Что такое Xiaomi MiMo V2.5?

MiMo V2.5 — это новейшая модель в семействе от MiMo. Команда MiMo компании Xiaomiвыпущенный в конце апреля 2026 года и сразу же перенесенный на Обнимающее лицо в качестве открытых весов. На самом деле в линейке представлены две флагманские модели, а также набор TTS и модель ASR — и это различие важно, потому что большая часть шумихи в интернете смешивает их.

Линия разветвляется вот так:

MiMo-V2.5 — Специалист широкого профиля в области мультимодальных технологий («омни»). 310B всего параметров, 15B активныйРазреженная архитектура MoE, обученная на 48 токенах. Нативное распознавание изображений и звука. Универсальная система.
MiMo-V2.5-Pro — Специалист по "агентам". 1.02T всего параметров, 42B активныйТа же гибридная архитектура внимания, но тщательно настроенная для долгосрочного программирования и обработки тысяч обращений к инструментам.
MiMo-V2.5-TTS — Трехрежимный набор голосовых программ (TTS, VoiceDesign, VoiceClone) для генерации речи в процессе производства, с возможностью управления скоростью, эмоциональным состоянием и тоном с помощью инструкций по стилю.
MiMo-V2.5-ASR — Сквозное распознавание речи, поддерживающее китайские диалекты (уский, кантонский, хоккиенский, сычуаньский), речь с переключением кодов, тексты песен и шумную акустическую среду.

Обе флагманские модели имеют собственную разработку. гибридное внимание скользящего окна Архитектура унаследована от MiMo-V2-Flash, с выделенными визуальными и аудиокодерами, соединенными через легкие проекторы. Обе модели поставляются с собственным модулем. 1 048 576-токеновое контекстное окноНи один из них не взимает множитель за длину контекста — Xiaomi убрала его в день запуска.

Компания Xiaomi не выпустила модель Frontier, которая бы соответствовала уровню интеллекта Claude. Они выпустили модель Frontier, которая бы соответствовала уровню интеллекта Claude, но... примерно половина стоимости токена — это единственная цифра, которая имеет значение, как только вы перестанете говорить и начнете отгружать товар.

MiMo V2.5 против Claude Opus, Gemini 3 Pro, GPT-5.4

Главный эталонный показатель — и тот, с которого Xiaomi начала запуск — это ClawEvalЭто многоэтапный набор задач для агентной модели, в котором ей необходимо планировать, вызывать инструменты и итерировать действия в течение длительного периода времени. тот Этот тест, соответствующий реальным производственным нагрузкам агентов, показывает, что MiMo V2.5 демонстрирует свои лучшие качества.

Модель	Проход ClawEval³	Токены / Траектория	Рейтинг с поправкой на стоимость
MiMo V2.5-Pro	63,8 – 64,0%	~70 тыс.	#1 (Граница Парето)
MiMo V2.5 (базовая версия)	62,3%	~75 тыс.	Связанная граница
Клод Опус 4.6	~65,4%	~120–175 тыс.	Более высокая стоимость
Gemini 3.1 Pro	~63%	~115 тыс.	Более высокая стоимость
ГПТ-5.4	~62%	~110 тыс.	Более высокая стоимость

Главный вывод: Claude Opus 4.6 по-прежнему немного превосходит конкурентов по своим основным характеристикам.Однако MiMo V2.5-Pro достигает примерно того же уровня, затрачивая при этом примерно на 40–60% меньше токенов. В пересчете на одну траекторию это составляет... нет ошибка округления. Издание VentureBeat отметилоВ мире, где GitHub Copilot и большинство платформ для агентов переходят на оплату по факту использования, эффективность использования токенов напрямую конвертируется в реальные деньги для любой команды, использующей агентов в больших масштабах.

По другим показателям, картина выглядит как специализация на программировании:

SWE-bench Pro: 57,2% — с разницей всего в полбалла от показателей Claude Opus 4.6 и GPT-5.4.
Terminal-Bench 2.0: Лидирует в общем зачете с Opus 4.6 и Gemini 3.1 Pro.
Видео-ММЕ: 87.7 — По качеству изображения на уровне Gemini 3 Pro.
GDPVal-AA (Elo): 1581 — превосходит Kimi K2.6 и GLM 5.1.
Запоминание в длинном контексте (1М): 0,37 BFS / 0,62 Родители — где большинство конкурентов после достижения отметки в 512 тысяч падают почти до нуля.

В чём его недостатки: HLE (Последний экзамен человечества) и GDPVal-AA — общие рассуждения — Обе модели отдают предпочтение широким кругозорам, а не узким знаниям в области программирования. Если вам нужен репетитор или эрудит, эта модель вам не подойдет. Но если вам нужен агент, который создает код, то это именно она.

Архитектура MiMo V2.5 и визуализация результатов бенчмарков — Рис. 02 Гибридная разреженная архитектура MoE — структурное преимущество версии 2.5 по стоимости.

На что способен MiMo V2.5-Pro?

Бенчмарки — это одно. Xiaomi пошла дальше и опубликовала четыре таких теста. многочасовые автономные выполнения задач — это работа, где агента нельзя держать в руках. К таким демонстрациям стоит отнестись серьезно, потому что они включают в себя полную трассировку вызовов инструментов.

ЗАДАНИЕ / 01ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ НА АНГЛИЙСКОМ ЯЗЫКЕ

Компилятор SysY на Rust

233 / 233

Разработал с нуля полноценный компилятор — лексер, парсер, AST, генерацию кода Koopa IR, бэкенд для RISC-V. 4,3 часа, 672 вызова инструмента. Идеальный результат в скрытом тестовом наборе Пекинского университета (проект, на выполнение которого студенту, изучающему информатику, требуется несколько недель).

ЗАДАНИЕ / 02ПРИЛОЖЕНИЕ

Видеоредактор для рабочего стола

8192 МЕСТА

На основе нескольких подсказок: многодорожечная временная шкала, обрезка клипов, плавные переходы, микширование звука, конвейер экспорта. 11,5 часов, 1868 вызовов инструментов. Голосовое сопровождение с использованием искусственного интеллекта, управляемое MiMo-V2-TTS.

ЗАДАНИЕ / 03АППАРАТНОЕ ОБОРУДОВАНИЕ EDA

Аналоговая схема FVF-LDO

~1 час

Разработан и оптимизирован стабилизатор напряжения с низким падением напряжения в 180-нм КМОП-технологии TSMC с использованием ngspice в замкнутом контуре. Шесть показателей одновременно соответствовали заданным параметрам; четыре из них улучшились на порядок по сравнению с первой попыткой модели.

ЗАДАНИЕ / 04ОСВЕДОМЛЕННОСТЬ О РЕМНЯХ БЕЗОПАСНОСТИ

Контекст самоуправления

1 млн токенов

Во всех четырех запусках V2.5-Pro продемонстрировал "осознание работы системы" — активно управляя собственной памятью, формируя собственное контекстное окно и направляясь к конечным целям на протяжении тысяч последовательных вызовов инструментов.

Запуск компилятора Rust — это то, что нужно усвоить. Это не игрушка. Это настоящий учебный проект по PKU с реальным скрытым набором тестов, и даже в условиях ограниченного бюджета закрытой модели было бы сложно выполнить его за один раз. Вот как на самом деле выглядит фраза «долгосрочная согласованность» в производственной среде.

Цена MiMo V2.5 — и почему это действительно так.

Вот здесь позиционирование открытого исходного кода становится интересным. MiMo V2.5 поставляется под… открытые веса на Hugging Face Для самостоятельного размещения Xiaomi также предлагает размещенный API с агрессивной ценовой политикой и моделью подписки «План токенов», аналогичной предложениям Claude Code и OpenAI с фиксированной ценой.

Ценообразование API — за 1 млн токенов (за рубежом) ОБНОВЛЕНО 04.2026

Модель

Вход

Выход

vs Opus 4.7

MiMo V2.5 (базовая версия)

0,40 доллара

2,00 доллара

примерно в 13 раз дешевле

MiMo V2.5-Pro

1,00 долл.

3,00 доллара

примерно в 5–8 раз дешевле

Клод Опус 4.7

5,00 долларов

25,00 долларов

исходный уровень

ГПТ-5.5

5,00 долларов

30,00 долларов

исходный уровень

Следует обратить внимание на два момента: попадания в кэш приводят к снижению стоимости ввода до минимального значения. 0,20–0,40 долл. за миллион токенов, а Xiaomi организовала запись в кэш. бесплатно В течение ограниченного периода запуска. Множитель контекста в 1 миллион также исчез. Если вы используете агентов с долгосрочным горизонтом, реальная разница в стоимости по сравнению с моделями с закрытым исходным кодом ближе к 10× чем 5×.

Для команд, предпочитающих фиксированную ставку, предлагается четырехступенчатая система оплаты. План токенов идет от 63,36 долл./год (Облегченная версия, 720 млн кредитов) 1056 долларов в год (Максимум 19,2 млрд кредитов) — и совместим с Claude Code, OpenCode и Kilo в качестве готовых модулей.

Стоит ли использовать MiMo V2.5? Плюсы, минусы и для кого это предназначено.

Сильные стороны

Лучшая в своем классе эффективность использования токенов при выполнении агентских задач (на 40–60% меньше токенов, чем в Claude Opus 4.6).
Реальный полезный контекст с 1 миллионом токенов — не обваливается ниже 512 тысяч, как большинство конкурентов.
Встроенная мультимодальная обработка в рамках одной модели (изображение, видео, аудио, текст).
Доступны свободные веса на Hugging Face — можно разместить на собственном сервере и точно настроить параметры.
«Осведомленность о состоянии страховочного пояса» — активно управляет собственным контекстом в тысячах вызовов инструментов.
Совместимость с Claude Code, OpenCode и Kilo.

Слабости

Тестирование на основе широких критериев оценки логического мышления (HLE, GDPVal-AA) — подход, ориентированный на программирование.
Данные об эффективности токенов, полученные на основе самоотчетов, нуждаются в независимом подтверждении.
Развернутая инфраструктура за пределами Китая все еще находится на стадии становления — задержка может варьироваться.
Экосистема вызовов инструментов и интеграции с ними менее проверены в реальных условиях, чем у Claude или GPT.
Документация и поддержка со стороны местного сообщества все еще отстают от западных поставщиков медицинских услуг.

Кому следует использовать MiMo V2.5?

Если вы строите агентные рабочие процессы кодирования — Долгосрочная перспектива, многофункциональный инструмент, масштабируемость репозитория — и если экономика вашей единицы продукции зависит от стоимости токенов, MiMo V2.5-Pro теперь в списке кандидатов. То же самое относится к любой команде, использующей мультимодальных агентов с глубоким пониманием видео или документов.

Кому лучше остаться с Клодом или с GPT?

Если ваша основная рабочая нагрузка Обсуждение общих идей, обобщение результатов исследований или работа с общими знаниями.Claude Opus 4.7 и GPT-5.5 по-прежнему сохраняют свои преимущества. Западные модели также обладают более зрелой экосистемой инструментов, более длительным опытом стабильной работы под производственной нагрузкой и более надежными гарантиями обработки корпоративных данных.

Часто задаваемые вопросы

Действительно ли MiMo V2.5 является проектом с открытым исходным кодом?

Да. Полная серия V2.5 — включая V2.5, V2.5-Pro, пакет TTS и модель ASR — опубликована на Hugging Face в разделе open weights. Базовая версия V2.5 включает веса, токенизатор и полную карточку модели. Самостоятельное размещение поддерживается через vLLM с официальным руководством по развертыванию от Xiaomi.

MiMo V2.5 лучше, чем Claude Opus 4.7?

Все зависит от задачи. В тестах производительности агентного программирования, таких как ClawEval и Terminal-Bench, V2.5-Pro показывает конкурентоспособные результаты или немного опережает конкурентов, используя при этом на 40–60% меньше токенов. В показателях широкого логического мышления (HLE) и общего интеллекта Claude Opus 4.7 сохраняет явное лидерство. Для рабочих нагрузок агентов в производственной среде V2.5-Pro часто является лучшим выбором с учетом стоимости.

Сколько стоит MiMo V2.5 через API?

MiMo V2.5 (базовая версия) стоит 0,40 доллара за миллион входных токенов и 2,00 доллара за миллион выходных токенов. MiMo V2.5-Pro стоит 1,00 доллар за вход / 3,00 доллара за выход. Попадания в кэш могут снизить стоимость входа до 0,20–0,40 доллара. Множитель за использование полного контекстного окна в 1 миллион токенов больше не используется. Для сравнения, Claude Opus 4.7 стоит 5/25 долларов, а GPT-5.5 — 5/30 долларов.

Можно ли использовать MiMo V2.5 с Claude Code или OpenCode?

Да. Xiaomi явно поддерживает полную совместимость с Claude Code, OpenCode, OpenClaw и Kilo в качестве агентских платформ. Вы можете заменить конечную точку модели и продолжать использовать ту же самую платформу. Это один из наиболее прагматичных путей внедрения для существующих пользователей Claude Code.

Какое оборудование мне понадобится для самостоятельного размещения MiMo V2.5?

Базовая модель V2.5 имеет 310 байт общего объема / 15 байт активных параметров, поэтому объем видеопамяти для инференции масштабируется в зависимости от активного набора параметров плюс экспертная маршрутизация. Разумная конфигурация для самостоятельного размещения использует 8 графических процессоров H100 или H200 с vLLM и тензорным параллелизмом. V2.5-Pro более ресурсоемкая (1,02 байта / 42 байта активных параметров) и обычно требует многоузловой инференции. Большинство производственных команд начинают с размещенного API и выборочно переходят на него.

Что такое "осведомленность о безопасности при использовании страховочных систем" и почему это важно?

«Осведомленность о среде выполнения» — так Xiaomi описывает способность модели активно анализировать собственную среду выполнения, управляя бюджетом памяти, формируя контекстное окно и направляя последовательность вызовов инструментов к достижению конечных целей. В задачах с длительным горизонтом (тысячи вызовов инструментов) это разница между моделью, которая «дребезжит», и моделью, которая «выпускается». Это самая недооцененная возможность в версии V2.5-Pro.

В сфере открытого программного обеспечения произошел новый прорыв.

MiMo V2.5 не является заменой шедевру для всех рабочих нагрузок, но для масштабируемого агентного программирования это новый лидер по соотношению цены и качества, и разрыв с закрытым исходным кодом официально стал близок к завершению. Мы будем отслеживать реальные примеры использования, сторонние тесты и развитие экосистемы по мере ее появления.

→ Читайте больше обзоров моделей на ai.cc → MiMo на обнимающем лице → Официальная страница MiMo V2.5-Pro

// КОНЕЦ ФАЙЛА ai.cc · model_review · v2.5 · 2026

Клод Мифос: Самый мощный ИИ, созданный Anthropics, слишком опасен для публичного выпуска – вот почему он меняет кибербезопасность в 2026 году.

Обзор Claude Opus 4.8: Новейшая мощная платформа искусственного интеллекта от Anthropic для программирования, агентов и задач с длительным горизонтом планирования.

Мировые модели в 2026 году: почему Google, NVIDIA, ЛеКун и Фэй-Фэй Ли вкладывают миллиарды в искусственный интеллект, способный понимать физический мир.

Qwen3.7 Max: новый агентный ИИ-монстр от Alibaba – 35-часовая автономность, 1 миллион контекстов и почему это важно в 2026 году.

Что такое Google AI Studio? Полное руководство на 2026 год: функции и цены.

Обновление дизайна поиска Google 2026: режим ИИ и информационные агенты: объяснение.

Что такое Gemini Omni? Модель искусственного интеллекта Google «Создай что угодно из любого входного значения» — подробное объяснение.

Google I/O 2026: Все анонсы — Gemini 3.5, Spark, Omni, Universal Cart и интеллектуальные очки.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

Отчет AI.cc: Руководство для предприятий по унифицированным платформам API для ИИ в 2026 году

Как использовать LangSmith в 2026 году: полное руководство от начинающего до продвинутого пользователя.

Как безопасно использовать агентный ИИ в 2026 году: Полное пошаговое руководство по безопасности.

Как настроить и запустить свою первую рекламную кампанию ChatGPT в OpenAI Ads Manager: полное руководство на 2026 год

ChatGPT Trusted Contact: новая функция безопасности от OpenAI, которая может спасти жизни (и как её настроить)

AICC против OpenRouter: какая платформа API для искусственного интеллекта лучше всего подходит именно вам?

Обзор основных моментов ServiceNow Knowledge 2026: Как предприятия используют ИИ для «автономной работы» в эпоху агентских технологий.

Xiaomi MiMo V2.5: модель 310B, которая превзошла Claude Opus по эффективности использования токенов.

Xiaomi MiMo V2.5:
Модель 310B, которая просто догнал Клод Опус о эффективности токенов.

Что такое Xiaomi MiMo V2.5?

MiMo V2.5 против Claude Opus, Gemini 3 Pro, GPT-5.4

На что способен MiMo V2.5-Pro?

Цена MiMo V2.5 — и почему это действительно так.

Стоит ли использовать MiMo V2.5? Плюсы, минусы и для кого это предназначено.

Сильные стороны

Слабости

Кому следует использовать MiMo V2.5?

Кому лучше остаться с Клодом или с GPT?

Часто задаваемые вопросы

В сфере открытого программного обеспечения произошел новый прорыв.

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Клод Мифос: Самый мощный ИИ, созданный Anthropics, слишком опасен для публичного выпуска – вот почему он меняет кибербезопасность в 2026 году.

Обзор Claude Opus 4.8: Новейшая мощная платформа искусственного интеллекта от Anthropic для программирования, агентов и задач с длительным горизонтом планирования.

Мировые модели в 2026 году: почему Google, NVIDIA, ЛеКун и Фэй-Фэй Ли вкладывают миллиарды в искусственный интеллект, способный понимать физический мир.

Qwen3.7 Max: новый агентный ИИ-монстр от Alibaba – 35-часовая автономность, 1 миллион контекстов и почему это важно в 2026 году.

Что такое Google AI Studio? Полное руководство на 2026 год: функции и цены.

Обновление дизайна поиска Google 2026: режим ИИ и информационные агенты: объяснение.

Что такое Gemini Omni? Модель искусственного интеллекта Google «Создай что угодно из любого входного значения» — подробное объяснение.

Google I/O 2026: Все анонсы — Gemini 3.5, Spark, Omni, Universal Cart и интеллектуальные очки.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

Отчет AI.cc: Руководство для предприятий по унифицированным платформам API для ИИ в 2026 году

Как использовать LangSmith в 2026 году: полное руководство от начинающего до продвинутого пользователя.

Как безопасно использовать агентный ИИ в 2026 году: Полное пошаговое руководство по безопасности.

Как настроить и запустить свою первую рекламную кампанию ChatGPT в OpenAI Ads Manager: полное руководство на 2026 год

ChatGPT Trusted Contact: новая функция безопасности от OpenAI, которая может спасти жизни (и как её настроить)

AICC против OpenRouter: какая платформа API для искусственного интеллекта лучше всего подходит именно вам?

Обзор основных моментов ServiceNow Knowledge 2026: Как предприятия используют ИИ для «автономной работы» в эпоху агентских технологий.

Xiaomi MiMo V2.5: модель 310B, которая превзошла Claude Opus по эффективности использования токенов.

Xiaomi MiMo V2.5:Модель 310B, которая просто догнал Клод Опус о эффективности токенов.

Что такое Xiaomi MiMo V2.5?

MiMo V2.5 против Claude Opus, Gemini 3 Pro, GPT-5.4

На что способен MiMo V2.5-Pro?

Цена MiMo V2.5 — и почему это действительно так.

Стоит ли использовать MiMo V2.5? Плюсы, минусы и для кого это предназначено.

Сильные стороны

Слабости

Кому следует использовать MiMo V2.5?

Кому лучше остаться с Клодом или с GPT?

Часто задаваемые вопросы

В сфере открытого программного обеспечения произошел новый прорыв.

Более 300 моделей ИИ для OpenClaw и агенты искусственного интеллекта

Xiaomi MiMo V2.5:
Модель 310B, которая просто догнал Клод Опус о эффективности токенов.

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта