¿Cuánto Cuesta Usar Xiaomi MiMo V2.5 en 2026?

Ashley Innocent

Ashley Innocent

27 May 2026

¿Cuánto Cuesta Usar Xiaomi MiMo V2.5 en 2026?

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

El precio de la API Xiaomi MiMo V2.5 se redujo a una tarifa fija de $1 por millón de tokens de entrada y $3 por millón de tokens de salida el 27 de mayo de 2026, y el equipo hizo permanente la nueva tarifa. El antiguo nivel de contexto largo, donde los prompts de más de 256K tokens conllevaban un multiplicador elevado sobre la tarifa base, ha desaparecido. Ahora hay un único precio, independientemente de la longitud del contexto. Para la mayoría de las cargas de trabajo, el titular es una sola frase: MiMo V2.5 es uno de los tres modelos de 1M de contexto más baratos en producción, y así se mantiene.

En resumen

Lo que cambió el 27 de mayo de 2026

El aviso oficial de actualización de precios de Xiaomi detalla tres cambios. Los tres entraron en vigor a las 00:00 hora de Beijing del 27 de mayo, que es las 16:00 UTC del 26 de mayo.

1. Precios planos en todas las ventanas de contexto. El antiguo esquema de MiMo V2.5 utilizaba tarifas escalonadas: un precio base para prompts de hasta 32K tokens de entrada, un multiplicador para la banda de 32K a 256K, y una tarifa aún más pronunciada por encima de 256K. El nuevo esquema tiene un número por tipo de token. Las aplicaciones de contexto largo dejan de pagar un impuesto por contexto largo.

2. Permanente, no promocional. El aviso utiliza la frase "Reducción de Precios Permanente" dos veces y "renovar permanentemente todo el sistema de precios del modelo" una vez. Sin fecha de caducidad. Sin cláusula de reversión. Trátelo como el nuevo precio de lista.

3. Restablecimiento de recompensas de planes de tokens. Si usted tiene un Plan de Tokens (el sistema de cuota prepago de Xiaomi), su saldo de crédito se aumentó de 5 a 8 veces y cada crédito que ya había consumido dentro de su período de validez fue reembolsado. El período de validez en sí no se extendió, por lo que los planes existentes obtuvieron un inesperado aumento de presupuesto pero no más tiempo.

La afirmación principal de "hasta 99% de descuento" se aplica específicamente a la banda de contexto largo. El precio anterior para más de 256K tokens de entrada era lo suficientemente alto como para que su reducción a $1/M produzca una disminución de más del 90%. Para las cargas de trabajo que se mantenían en el nivel base, la reducción es menor pero sigue siendo significativa.

La nueva hoja de precios permanente

Precios por 1 millón de tokens, en USD, efectivos de inmediato y permanentes:

Modelo Entrada Salida Caché Contexto
MiMo V2.5 Pro $1.00 $3.00 $0.20 1M tokens
MiMo V2 Flash ~$0.10 ~$0.40 $0.02 256K tokens

Algunos detalles que la tabla no hace obvios:

Para la fijación de precios de la versión V2-Pro como punto de referencia, consulte nuestra guía de precios de MiMo V2-Pro y Omni.

Lo que MiMo V2.5 aporta más allá de los precios más baratos

El anuncio del 27 de mayo es un evento de precios, pero el V2.5 en sí mismo es también una mejora significativa respecto al V2-Pro lanzado en abril. Tres cambios que vale la pena destacar:

Ninguno de estos son puntos de referencia principales, pero son los cambios que aparecen en las implementaciones de producción reales. Combine el precio más barato con la ventana de contexto fiable más larga y tendrá una opción que no existía para trabajos serios con documentos largos antes del 27 de mayo.

Cómo se compara MiMo V2.5 con el resto del campo

La comparación interesante no es el antiguo MiMo V2.5. Es contra las otras opciones de API de nivel "frontier" disponibles en mayo de 2026:

Modelo Entrada ($/MTok) Salida ($/MTok) Contexto
Xiaomi MiMo V2.5 Pro $1.00 $3.00 1M
DeepSeek V4-Pro $0.435 $0.87 128K
GPT-5.5 $5.00 $30.00 200K
Claude Opus 4.7 $3.00 $15.00 200K
Gemini 3.5 Flash ~$1.50 ~$9.00 1M

Tres conclusiones:

Para el lado DeepSeek de esta comparación, vea La reducción del 75% del precio de DeepSeek V4-Pro ahora es permanente. Los dos artículos son lecturas complementarias. Ambos cubren las reducciones permanentes de nivel "frontier" de esta semana por parte de laboratorios chinos.

Tres cargas de trabajo, tres nuevas facturas

Tres casos concretos utilizando las nuevas tarifas permanentes:

1. RAG de documentos largos sobre PDFs empresariales. 50,000 consultas/día, 800K tokens de contexto por consulta, 1K tokens de respuesta. Antiguo nivel de contexto largo de MiMo V2.5 (tarifa efectiva estimada de $50/M): aproximadamente $60,000/mes. Nueva tarifa plana: aproximadamente $1,225/mes. Ahorros: $58,775/mes.

2. Agente de revisión de código. 5,000 solicitudes de extracción/día, 30K tokens de contexto de repositorio, 2K tokens de salida de comentarios. Factura mensual antigua de GPT-5.5: aproximadamente $5,250. Nuevo MiMo V2.5: aproximadamente $510. Ahorros: $4,740/mes.

3. Chatbot de atención al cliente. 200,000 interacciones/día, 4K tokens de prompt del sistema, 300 tokens de respuesta. Factura mensual antigua de Claude Opus 4.7: aproximadamente $11,250. Nuevo MiMo V2.5: aproximadamente $805. Ahorros: $10,445/mes.

La carga de trabajo #1 es donde MiMo V2.5 se diferencia del resto. Los trabajos de contexto largo eran prohibitivamente caros en cualquier API "frontier" antes de esta reducción. Ya no lo son. Los mismos documentos que solían enviarse a resumidores y pipelines de fragmentación ahora pueden ir completos al modelo, sin trucos de presupuesto de tokens.

Una breve nota sobre los aciertos de caché

La tarifa de entrada en caché de $0.20/M es 5 veces más barata que la tarifa de $1.00 por fallo de caché. Eso es un descuento de caché menor que la proporción de 120:1 de DeepSeek, pero sigue siendo significativo para cualquier agente que reutilice un prompt de sistema estable.

Un ejemplo práctico. Suponga que su asistente utiliza un prompt de sistema de 6,000 tokens y maneja 80,000 interacciones de chat por día, con un mensaje de usuario promedio de 250 tokens de entrada y una respuesta promedio de 600 tokens de salida:

Eso no es el 88% que ofrece el almacenamiento en caché de DeepSeek, pero en una carga de trabajo que asciende a $500/día en entrada, la mitad de descuento es dinero real. Fije el prompt del sistema, ordene el contexto recuperado de manera estable y no inyecte marcas de tiempo por solicitud en el prefijo. Las mismas reglas que obtienen aciertos de caché en cualquier otro lugar también se aplican aquí.

Cuándo MiMo V2.5 es la elección correcta y cuándo no

El nuevo precio convierte a MiMo V2.5 en la opción predeterminada para dos clases de carga de trabajo y en una mala elección para una.

Elección correcta:

Mala elección:

Advertencias:

Para el contexto de lanzamiento de V2-Pro que prepara el V2.5, vea Xiaomi acaba de lanzar su propio modelo de IA, y es gratuito en OpenRouter. Para el acceso gratuito, el programa de 100T tokens gratis de Xiaomi MiMo Orbit cubre la elegibilidad y el registro.

Probando MiMo V2.5 con Apidog

La compatibilidad de la plataforma con OpenAI es buena, no perfecta. Verifique su integración antes de lanzar el tráfico de producción.

Apidog le permite dirigir una solicitud de Chat Completions a https://platform.xiaomimimo.com/v1 con su clave API de MiMo, y luego:

Descargue Apidog, importe el esquema de OpenAI Chat Completion, cambie la URL base y tendrá un entorno de prueba V2.5 funcional en menos de diez minutos. El mismo flujo de trabajo que recomendamos en Cómo usar la API de DeepSeek V4.

Cómo se perfila la guerra de precios de LLM de 2026

MiMo V2.5 es el segundo recorte permanente en el nivel "frontier" de un laboratorio chino en una sola semana. DeepSeek hizo permanente el V4-Pro a 1/4 del precio de lista el 22 de mayo. Kimi K2 hizo un recorte a principios del primer trimestre. OpenAI O3 bajó un 80% en febrero. El patrón es claro:

Para el resto de esta imagen:

Cómo esto afecta su desarrollo

La reducción de MiMo V2.5 no es un truco de marketing. Es una reevaluación estructural del nivel de contexto de 1M, y la reducción es permanente. Si ha estado posponiendo el RAG de documentos largos, los agentes de código a nivel de repositorio o cualquier carga de trabajo que necesite un contexto de más de 200K tokens por razones de costo, el presupuesto que calculó el trimestre pasado probablemente sobrestima la necesidad de este trimestre en un orden de magnitud.

Tres pasos concretos a seguir:

El precio mínimo se movió de nuevo. Construya en consecuencia.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs