ai.cc — model_review.md

~/posts/2026/ ENTRADA 0427

IA de código abierto · Presentado en abril de 2026

Xiaomi MiMo V2.5:
El modelo 310B que simplemente alcanzado Claude Opus habló sobre la eficiencia de los tokens.

MiMo V2.5 de Xiaomi es el lanzamiento de peso abierto más trascendental del segundo trimestre de 2026: un modelo Mixture-of-Experts disperso de 310 mil millones con comprensión multimodal nativa, una ventana de contexto de 1 millón de tokens y cifras de referencia que lo colocan codo a codo con Claude Opus y Gemini 3 Pro mientras que quema Entre un 40% y un 60% menos de fichasAquí tienes el desglose completo: arquitectura, pruebas de rendimiento, tareas del mundo real, precios y cómo se compara con la vanguardia del software de código cerrado.

Modelo

MiMo-V2.5 / V2.5-Pro

Parámetros

310B / 1.02T

Contexto

1.048.576 tokens

Licencia

Pesos abiertos · MIT

Banner de lanzamiento oficial del modelo Xiaomi MiMo V2.5 — FIG.01 MiMo V2.5 — El lanzamiento del teléfono insignia de Xiaomi con peso abierto, abril de 2026

¿Qué es Xiaomi MiMo V2.5?

MiMo V2.5 es la última familia de modelos de El equipo MiMo de Xiaomi, lanzado a finales de abril de 2026 y lanzado directamente a Cara de abrazo como pesos abiertos. En realidad, hay dos modelos insignia en el lanzamiento, además de un conjunto TTS y un modelo ASR, y esa distinción importa porque la mayor parte de la publicidad en línea los confunde.

La línea se divide así:

MiMo-V2.5 — El generalista multimodal "omni". 310B parámetros totales, 15 mil millones activosArquitectura MoE dispersa, entrenada con tokens 48T. Comprensión nativa de visión y audio. Todo en uno.
MiMo-V2.5-Pro — El especialista en "Agentes". 1,02T parámetros totales, 42B activo. La misma estructura de atención híbrida, pero ajustada específicamente para la codificación a largo plazo y trayectorias con miles de llamadas a herramientas.
MiMo-V2.5-TTS — Un conjunto de tres modelos de voz (TTS, VoiceDesign, VoiceClone) para la generación de voz en producción, con control de estilo mediante instrucciones sobre velocidad, emoción y tono.
MiMo-V2.5-ASR — Reconocimiento de voz de extremo a extremo que admite dialectos chinos (Wu, cantonés, hokkien, sichuanés), habla con alternancia de códigos, letras de canciones y entornos acústicos ruidosos.

Ambos modelos insignia comparten una tecnología propia. atención híbrida de ventana deslizante Arquitectura heredada de MiMo-V2-Flash, con codificadores visuales y de audio dedicados conectados a través de proyectores ligeros. Ambos se envían con un nativo Ventana de contexto de 1.048.576 tokensNinguno de los dos cobra un multiplicador de longitud de contexto; Xiaomi lo eliminó el día del lanzamiento.

Xiaomi no lanzó un modelo frontier que iguale a Claude en inteligencia. Lanzaron un modelo frontier que iguala a Claude en inteligencia en aproximadamente la mitad del costo de la ficha — que es el único número que importa una vez que dejas de hablar y empiezas a enviar.

MiMo V2.5 vs Claude Opus, Gemini 3 Pro, GPT-5.4

El principal referente —y con el que Xiaomi lideró el lanzamiento— es Evaluación de garras, un conjunto de tareas agenciales de múltiples turnos donde el modelo tiene que planificar, llamar a herramientas e iterar en horizontes largos. Esto es el Se trata de un punto de referencia que se corresponde con las cargas de trabajo reales de los agentes en producción, y es ahí donde MiMo V2.5 parece mostrar su mayor potencial.

Modelo	Pase ClawEval³	Tokens / Trayectoria	Clasificación ajustada al costo
MiMo V2.5-Pro	63,8 – 64,0%	~70 mil	#1 (Frontera de Pareto)
MiMo V2.5 (base)	62,3%	~75 mil	frontera atada
Claude Opus 4.6	~65,4%	~120–175 mil	Mayor costo
Gemini 3.1 Pro	~63%	~115 mil	Mayor costo
GPT-5.4	~62%	~110 mil	Mayor costo

La conclusión: Claude Opus 4.6 aún tiene una ligera ventaja en cuanto a capacidad bruta., pero MiMo V2.5-Pro llega al mismo vecindario gastando aproximadamente entre un 40 y un 60 % menos de tokens para llegar allí. En términos de precios por trayectoria, esto es no un error de redondeo. Como VentureBeat señalóEn un mundo donde GitHub Copilot y la mayoría de las plataformas de agentes están adoptando la facturación basada en el uso, esta eficiencia del token se traduce directamente en dinero real para cualquier equipo que gestione agentes a gran escala.

En otros aspectos, la imagen muestra a un especialista en codificación como prioridad:

SWE-bench Pro: 57,2% — a medio punto de Claude Opus 4.6 y GPT-5.4.
Terminal-Bench 2.0: Supera con creces a Opus 4.6 y Gemini 3.1 Pro.
Vídeo-MME: 87.7 — a la par con Gemini 3 Pro en comprensión de vídeo.
GDPVal-AA (Elo): 1581 — supera a Kimi K2.6 y GLM 5.1.
Recuerdo de contexto extenso (1M): 0,37 BFS / 0,62 Padres — donde la mayoría de los competidores se desploman hasta casi cero después de los 512.000.

En qué falla: HLE (El último examen de la humanidad) y Razonamiento amplio de GDPVal-AA Ambos modelos priorizan la amplitud de conocimientos generales sobre la profundidad de los especialistas en programación. Si necesitas un tutor o un experto en diversas áreas, este no es el modelo adecuado. Si necesitas un agente que implemente código, sin duda lo es.

Arquitectura MiMo V2.5 y visualización de pruebas de rendimiento — FIG.02 Arquitectura híbrida dispersa de MoE: la ventaja de costo estructural de V2.5.

¿Qué puede hacer realmente el MiMo V2.5-Pro?

Los benchmarks son una cosa. Xiaomi fue más allá y publicó cuatro ejecuciones de tareas autónomas de varias horas — el tipo de trabajo en el que no se puede guiar al agente paso a paso. Estas son las demostraciones que merecen ser tomadas en serio, porque incluyen el registro completo de las llamadas a la herramienta.

TAREA / 01SOFTWARE EN INGLÉS

Compilador SysY en Rust

233 / 233

He creado un compilador completo desde cero: analizador léxico, analizador sintáctico, árbol de sintaxis abstracta (AST), generador de código Koopa IR y backend RISC-V. 4,3 horas, 672 llamadas a herramientas. Puntuación perfecta en el conjunto de pruebas ocultas de la Universidad de Pekín (un proyecto que a un estudiante de informática le lleva varias semanas).

TAREA / 02SOLICITUD

Editor de vídeo de escritorio

8.192 PLAZAS

A partir de algunas indicaciones: línea de tiempo multipista, recorte de clips, fundidos cruzados, mezcla de audio, flujo de exportación. 11,5 horas, 1.868 llamadas a herramientas. Locución con inteligencia artificial impulsada por MiMo-V2-TTS.

TAREA / 03EDA de hardware

Circuito analógico FVF-LDO

~1 hora

Diseñé y optimicé un regulador de baja caída de tensión en tecnología CMOS de 180 nm de TSMC utilizando ngspice en un lazo cerrado. Seis parámetros cumplieron simultáneamente con las especificaciones; cuatro de ellos mejoraron en un orden de magnitud con respecto al primer intento del modelo.

TAREA / 04CONCIENCIA SOBRE EL USO DEL ARNÉS

Contexto autogestionado

1 millón de tokens

En las cuatro ejecuciones, V2.5-Pro demostró "conciencia de manejo": gestionaba activamente su propia memoria, daba forma a su propia ventana de contexto y se dirigía hacia los objetivos finales a través de miles de llamadas secuenciales a herramientas.

La ejecución del compilador de Rust es la que hay que comprender a fondo. No es un juguete. Es un proyecto real de un curso de la PKU con un conjunto de pruebas oculto y real, y un modelo de código cerrado de vanguardia habría tenido dificultades para hacerlo de una sola vez con ese presupuesto mínimo. Así es como se ve en la práctica la frase "coherencia a largo plazo".

Precios de MiMo V2.5 y por qué es la verdadera historia

Aquí es donde el posicionamiento de código abierto se vuelve interesante. MiMo V2.5 se distribuye bajo Pesas abiertas en Hugging Face Xiaomi ofrece soluciones de autoalojamiento, pero también gestiona una API alojada con precios competitivos y un modelo de suscripción "Token Plan" que imita las ofertas de tarifa plana de Claude Code y OpenAI.

Precios de la API: por cada millón de tokens (en el extranjero) ACTUALIZADO 2026-04

Modelo

Aporte

Producción

vs Opus 4.7

MiMo V2.5 (base)

$0.40

$2.00

Aproximadamente 13 veces más barato

MiMo V2.5-Pro

$1.00

$3.00

Entre 5 y 8 veces más barato

Claude Opus 4.7

$5.00

$25.00

base

GPT-5.5

$5.00

$30.00

base

Dos cosas a tener en cuenta: los aciertos de caché reducen el costo de entrada a un nivel tan bajo como $0,20–0,40 por millón de tokens, y Xiaomi hizo escritura en caché gratis para una ventana de lanzamiento limitada. El multiplicador de 1M contexto también ha desaparecido. Si está ejecutando agentes de largo horizonte, la brecha de costos real en comparación con los modelos de frontera de código cerrado es más cercana a 10× que 5×.

Para los equipos que prefieren una tarifa plana, el sistema de cuatro niveles Plan de tokens va desde $63.36/año (Lite, 720M créditos) a $1.056/año (Máximo, 19.200 millones de créditos) — y es compatible con Claude Code, OpenCode y Kilo como estructuras predefinidas.

¿Deberías usar MiMo V2.5? Ventajas, desventajas y a quién va dirigido.

Fortalezas

La mejor eficiencia de tokens de su clase en tareas con agentes (entre un 40 % y un 60 % menos de tokens que Claude Opus 4.6).
Contexto utilizable genuino de 1 millón de tokens: no se desploma más allá de 512.000 como la mayoría de sus competidores.
Multimodal nativo en un solo modelo (imagen, vídeo, audio, texto).
Pesos abiertos en Hugging Face: autoalojados y ajustables.
"Aprovechar la conciencia situacional": gestiona activamente su propio contexto a través de miles de llamadas a herramientas.
Compatible directamente con Claude Code, OpenCode y Kilo.

Debilidades

Pruebas basadas en criterios de razonamiento amplio (HLE, GDPVal-AA): diseño que prioriza la codificación.
Las cifras autodeclaradas sobre la eficiencia de los tokens necesitan ser replicadas de forma independiente.
La infraestructura alojada fuera de China aún está en desarrollo; la latencia varía.
El ecosistema de llamadas a herramientas y las integraciones de arneses están menos probados en combate que Claude o GPT.
La documentación y el apoyo de la comunidad aún están por debajo de los de los proveedores occidentales.

¿Quién debería usar MiMo V2.5?

Si estás construyendo flujos de trabajo de codificación agencial — Si su economía unitaria depende del costo del token, MiMo V2.5-Pro está ahora en la lista de opciones. Lo mismo ocurre con cualquier equipo que utilice agentes multimodales con un alto nivel de comprensión de vídeo o documentos.

¿Quién debería quedarse con Claude o con GPT?

Si su carga de trabajo principal es Conversación de razonamiento amplio, síntesis de investigación o trabajo de conocimiento generalClaude Opus 4.7 y GPT-5.5 siguen siendo superiores. Los modelos occidentales también cuentan con ecosistemas de herramientas más maduros, un historial más extenso de estabilidad bajo cargas de producción y mayores garantías en el manejo de datos empresariales.

Preguntas frecuentes

¿Es MiMo V2.5 realmente de código abierto?

Sí. La serie completa V2.5 —que incluye V2.5, V2.5-Pro, el paquete TTS y el modelo ASR— está publicada en Hugging Face con pesos abiertos. La versión base V2.5 incluye pesos, tokenizador y una tarjeta de modelo completa. Se admite el autoalojamiento mediante vLLM, con una guía de implementación oficial de Xiaomi.

¿Es MiMo V2.5 mejor que Claude Opus 4.7?

Depende de la tarea. En pruebas de rendimiento de codificación de agentes como ClawEval y Terminal-Bench, V2.5-Pro es competitivo o ligeramente superior, utilizando entre un 40 % y un 60 % menos de tokens. En razonamiento amplio (HLE) e índices de inteligencia general, Claude Opus 4.7 mantiene una clara ventaja. Para cargas de trabajo de agentes en producción, V2.5-Pro suele ser la mejor opción en términos de relación coste-beneficio.

¿Cuánto cuesta MiMo V2.5 a través de API?

MiMo V2.5 (versión básica) cuesta 0,40 $ por millón de tokens de entrada y 2,00 $ por millón de tokens de salida. MiMo V2.5-Pro cuesta 1,00 $ por entrada y 3,00 $ por salida. Los aciertos de caché pueden reducir el coste de entrada a entre 0,20 $ y 0,40 $. Ya no existe un multiplicador por usar la ventana de contexto completa de 1 millón. A modo de comparación, Claude Opus 4.7 cuesta 5 $/25 $ y GPT-5.5 cuesta 5 $/30 $.

¿Puedo usar MiMo V2.5 con Claude Code u OpenCode?

Sí. Xiaomi ofrece compatibilidad directa con Claude Code, OpenCode, OpenClaw y Kilo como plataformas de agentes. Puedes cambiar el punto final del modelo y seguir utilizando el mismo arnés. Esta es una de las opciones de adopción más prácticas para los usuarios actuales de Claude Code.

¿Qué hardware necesito para alojar MiMo V2.5 en mi propio servidor?

El modelo base V2.5 tiene 310 B en total / 15 B de parámetros activos, por lo que la VRAM de inferencia se escala con el conjunto activo más el enrutamiento experto. Una configuración de autoalojamiento razonable utiliza 8 GPU H100 o H200 con vLLM y paralelismo tensorial. V2.5-Pro es más pesado (1,02 T / 42 B activos) y normalmente requiere inferencia en varios nodos. La mayoría de los equipos de producción comenzarán con la API alojada y migrarán selectivamente.

¿Qué es "aprovechar la conciencia" y por qué es importante?

Xiaomi denomina "conciencia de gestión" a la capacidad del modelo para razonar activamente sobre su propio entorno de ejecución: gestionar su presupuesto de memoria, configurar su ventana de contexto y orientar sus secuencias de llamadas a herramientas hacia los objetivos finales. En tareas de largo plazo (miles de llamadas a herramientas), esta es la diferencia entre un modelo que se desvía y uno que se lanza al mercado. Es, sin duda, la capacidad más infravalorada de la versión V2.5-Pro.

La frontera del código abierto acaba de cambiar.

MiMo V2.5 no reemplaza a Claude Opus para todas las cargas de trabajo, pero para la codificación automatizada a gran escala, es el nuevo líder en relación calidad-precio, y la brecha con la frontera del software de código cerrado está oficialmente al alcance de la mano. Haremos un seguimiento de la replicación en entornos reales, las comparativas de terceros y la adopción por parte del ecosistema a medida que evolucione.

→ Lea más reseñas de modelos en ai.cc → MiMo en Hugging Face → Página oficial de MiMo V2.5-Pro

// FIN DEL ARCHIVO ai.cc · revisión del modelo · v2.5 · 2026

Contacto de confianza de ChatGPT: La nueva función de seguridad de OpenAI que podría salvar vidas (y cómo configurarla)

AICC vs OpenRouter: ¿Qué plataforma API de IA se adapta mejor a tus necesidades?

Análisis de los aspectos más destacados de ServiceNow Knowledge 2026: Cómo las empresas utilizan la IA para “trabajar de forma autónoma” en la era de la inteligencia artificial.

Xiaomi MiMo V2.5: El modelo 310B que acaba de superar a Claude Opus en eficiencia de tokens.

Apple iOS 27: El cambio en la plataforma de IA que lo cambia todo para los usuarios de iPhone.

Cómo usar GPT Image 2.0: la guía completa + paquete completo de herramientas creativas de IA

Análisis de DeepSeek V4: El modelo de código abierto que cuesta una séptima parte de GPT-5.5.

El fin de la dependencia de un único modelo: por qué las empresas están migrando a plataformas API de IA unificadas en 2026.

GPT-5.5 ya está aquí: todo lo que necesitas saber sobre el modelo más potente de OpenAI hasta la fecha.

GPT IMAGE 2.0 VS. MIDJOURNEY V7: ¿QUÉ IA GANARÁ LA GUERRA VISUAL DE 2026?

LA REVOLUCIÓN MULTIAGENTE: MOONSHOT AI PRESENTA KIMI K2.6

Claude Design de Anthropic: Cómo esta nueva herramienta de IA está cambiando la creación visual en 2026

Claude Opus 4.7 lanzado: la mejor IA de programación de Anthropic hasta la fecha en 2026.

Cómo usar Codex: la actualización de OpenAI "Codex para (casi) todo".

El explosivo podcast de Jensen Huang, CEO de Nvidia, en Dwarkesh: la ventaja competitiva de la cadena de suministro, la competencia en TPU, las ventas de chips en China y por qué el diálogo sobre IA entre EE. UU. y China es ahora innegociable.

Rediseño del escritorio de Anthropic Claude Code 2026

Xiaomi MiMo V2.5: El modelo 310B que acaba de superar a Claude Opus en eficiencia de tokens.

Xiaomi MiMo V2.5:
El modelo 310B que simplemente alcanzado Claude Opus habló sobre la eficiencia de los tokens.

¿Qué es Xiaomi MiMo V2.5?

MiMo V2.5 vs Claude Opus, Gemini 3 Pro, GPT-5.4

¿Qué puede hacer realmente el MiMo V2.5-Pro?

Precios de MiMo V2.5 y por qué es la verdadera historia

¿Deberías usar MiMo V2.5? Ventajas, desventajas y a quién va dirigido.

Fortalezas

Debilidades

¿Quién debería usar MiMo V2.5?

¿Quién debería quedarse con Claude o con GPT?

Preguntas frecuentes

La frontera del código abierto acaba de cambiar.

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Contacto de confianza de ChatGPT: La nueva función de seguridad de OpenAI que podría salvar vidas (y cómo configurarla)

AICC vs OpenRouter: ¿Qué plataforma API de IA se adapta mejor a tus necesidades?

Análisis de los aspectos más destacados de ServiceNow Knowledge 2026: Cómo las empresas utilizan la IA para “trabajar de forma autónoma” en la era de la inteligencia artificial.

Xiaomi MiMo V2.5: El modelo 310B que acaba de superar a Claude Opus en eficiencia de tokens.

Apple iOS 27: El cambio en la plataforma de IA que lo cambia todo para los usuarios de iPhone.

Cómo usar GPT Image 2.0: la guía completa + paquete completo de herramientas creativas de IA

Análisis de DeepSeek V4: El modelo de código abierto que cuesta una séptima parte de GPT-5.5.

El fin de la dependencia de un único modelo: por qué las empresas están migrando a plataformas API de IA unificadas en 2026.

GPT-5.5 ya está aquí: todo lo que necesitas saber sobre el modelo más potente de OpenAI hasta la fecha.

GPT IMAGE 2.0 VS. MIDJOURNEY V7: ¿QUÉ IA GANARÁ LA GUERRA VISUAL DE 2026?

LA REVOLUCIÓN MULTIAGENTE: MOONSHOT AI PRESENTA KIMI K2.6

Claude Design de Anthropic: Cómo esta nueva herramienta de IA está cambiando la creación visual en 2026

Claude Opus 4.7 lanzado: la mejor IA de programación de Anthropic hasta la fecha en 2026.

Cómo usar Codex: la actualización de OpenAI "Codex para (casi) todo".

El explosivo podcast de Jensen Huang, CEO de Nvidia, en Dwarkesh: la ventaja competitiva de la cadena de suministro, la competencia en TPU, las ventas de chips en China y por qué el diálogo sobre IA entre EE. UU. y China es ahora innegociable.

Rediseño del escritorio de Anthropic Claude Code 2026

Xiaomi MiMo V2.5: El modelo 310B que acaba de superar a Claude Opus en eficiencia de tokens.

Xiaomi MiMo V2.5:El modelo 310B que simplemente alcanzado Claude Opus habló sobre la eficiencia de los tokens.

¿Qué es Xiaomi MiMo V2.5?

MiMo V2.5 vs Claude Opus, Gemini 3 Pro, GPT-5.4

¿Qué puede hacer realmente el MiMo V2.5-Pro?

Precios de MiMo V2.5 y por qué es la verdadera historia

¿Deberías usar MiMo V2.5? Ventajas, desventajas y a quién va dirigido.

Fortalezas

Debilidades

¿Quién debería usar MiMo V2.5?

¿Quién debería quedarse con Claude o con GPT?

Preguntas frecuentes

La frontera del código abierto acaba de cambiar.

Más de 300 modelos de IA para OpenClaw y agentes de IA

Xiaomi MiMo V2.5:
El modelo 310B que simplemente alcanzado Claude Opus habló sobre la eficiencia de los tokens.

Más de 300 modelos de IA para
OpenClaw y agentes de IA