Guerra de Precios LLM Chinos 2026: Comparativa Costos API Fronteriza Top 5

Ashley Innocent

Ashley Innocent

27 May 2026

Guerra de Precios LLM Chinos 2026: Comparativa Costos API Fronteriza Top 5

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Los laboratorios chinos redujeron los precios de las API de LLM seis veces en la primera mitad de 2026, y tres de esos recortes fueron declarados permanentes. DeepSeek V4-Pro ahora cuesta $0.87 por millón de tokens de salida. Xiaomi MiMo V2.5 acaba de aplanar su nivel de contexto largo a $3 por salida. Qwen3 Max de Alibaba se lanza a $3.90. Kimi K2.6 de Moonshot mantiene el precio mínimo de aciertos de caché en $0.07. GLM-5 de Zhipu se sitúa en $3.20 por salida. A continuación se presenta el desglose completo de precios de las cinco principales API frontera de China en mayo de 2026, con notas de capacidad y una matriz para el comprador al final para que pueda elegir la adecuada para su carga de trabajo.

botón

En resumen

Cómo se desarrolló la guerra de precios de LLM chinos en 2026

El patrón comenzó en el cuarto trimestre de 2025 y se aceleró en el segundo trimestre de 2026. Una cronología aproximada:

Los recortes no son aleatorios. Cada laboratorio apunta a una brecha competitiva específica. DeepSeek busca el costo por token más bajo. MiMo busca cargas de trabajo de contexto largo que otros modelos encarecen demasiado. Qwen y GLM mantienen precios de nivel medio y compiten en capacidad. Kimi compite en flujos de trabajo de agentes y codificación a través del precio mínimo de aciertos de caché.

Un vistazo rápido: las 5 principales API de LLM chinos en mayo de 2026

Modelo Entrada ($/MTok) Salida ($/MTok) Acierto de caché Contexto Ideal para
DeepSeek V4-Pro $0.435 $0.87 $0.003625 128K Más barato por token, codificación
Xiaomi MiMo V2.5 Pro $1.00 $3.00 $0.20 1M RAG de documentos largos, agentes de repositorio
Alibaba Qwen3 Max $0.78 $3.90 $0.156 262K Equilibrio para producción
Moonshot Kimi K2.6 $0.16–$2.00 (por niveles) ~$2.50 $0.07 128K Prompts de sistema largos, agentes de codificación
Zhipu GLM-5 $1.00 $3.20 (definido por el proveedor) 200K Razonamiento estructurado

Algunos detalles para interpretar la tabla:

A continuación: cada modelo tiene una sección con precios, capacidad y la carga de trabajo en la que sobresale.

DeepSeek: el más barato por token

Modelos: V4-Pro ($0.435 entrada / $0.87 salida / $0.003625 acierto de caché, 128K contexto), V4-Flash ($0.14 / $0.28).

V4-Pro de DeepSeek es el precio mínimo de la gama de modelos frontera chinos. El recorte permanente del 22 de mayo situó los tokens de salida en $0.87/MTok, aproximadamente 34 veces por debajo de GPT-5.5 y 17 veces por debajo de Claude Opus 4.7. El acierto de caché a $0.003625/MTok es la tarifa propia más baja de cualquier laboratorio importante. Confirmado en la página oficial de precios de DeepSeek.

Ventajas de V4-Pro:

Casos en los que no es adecuado:

Para una cobertura más profunda: Recorte permanente de precios de DeepSeek V4-Pro, Qué es DeepSeek V4, Cómo usar la API de DeepSeek V4.

Xiaomi MiMo: la opción más barata con 1M de contexto

Modelos: MiMo V2.5 Pro ($1.00 entrada / $3.00 salida / $0.20 caché, 1M contexto), MiMo V2 Flash (~$0.10 / ~$0.40, 256K contexto).

El recorte permanente del 27 de mayo de Xiaomi aplanó los precios de MiMo V2.5 en todas las ventanas de contexto. Los antiguos niveles de contexto largo, que aplicaban multiplicadores elevados por encima de 256K tokens de entrada, han desaparecido. La nueva política de precios aplica la misma tarifa de $1/$3, ya sea que envíe 5K o 950K tokens. El aviso oficial de actualización de precios etiqueta el recorte como “permanente”.

Ventajas de V2.5 Pro:

Casos en los que no es adecuado:

La ventana de contexto de 1M más una tarifa de caché competitiva le da a MiMo un lugar estructuralmente único en el mercado. Hasta que DeepSeek extienda el contexto más allá de 128K o Alibaba aplane los precios de Qwen, MiMo domina el cuadrante de bajo costo y contexto largo.

Para una cobertura más profunda: Cuánto cuesta usar Xiaomi MiMo V2.5 en 2026, Precios de MiMo V2-Pro y Omni, Programa de 100T tokens gratis de Xiaomi MiMo Orbit.

Alibaba Qwen: el caballo de batalla de la producción

Modelos: Qwen3 Max ($0.78 entrada / $3.90 salida / $0.156 caché, 262K contexto). El más reciente Qwen 3.7 Max, con entrada de $2.50/MTok y 1M de contexto, está en fase de lanzamiento inicial. Tarifas verificadas contra la hoja de Qwen3 Max de pricepertoken.

Qwen3 Max es el modelo insignia de Alibaba y el modelo chino más desplegado en producción internacional. Se sitúa en un punto de precio competitivo pero no al nivel más bajo: 1.8 veces DeepSeek V4-Pro en entrada, 4.5 veces en salida. La prima paga el ecosistema de herramientas más amplio (compatible con el protocolo Anthropic, compatible con OpenAI, alojamiento empresarial en Alibaba Cloud) y una ventana de contexto de 262K que maneja la mayoría de las cargas de trabajo de documentos empresariales.

Ventajas de Qwen3 Max:

Casos en los que no es adecuado:

Para una cobertura más profunda: Qwen 3 vs OpenAI y DeepSeek: comparación técnica en profundidad para desarrolladores de API.

Moonshot Kimi: el especialista en codificación

Modelos: Kimi K2.6 con precios de entrada por niveles de contexto ($0.16 a $2.00/MTok en las bandas de 8K, 32K, 64K y 128K), precio mínimo de acierto de caché de $0.07/MTok, tasas de salida alrededor de $2.50/MTok en la banda media.

Kimi K2.6 es el campeón de aciertos de caché. La tarifa de $0.07/MTok por acierto es la cifra propia más baja de cualquier laboratorio importante. Combinado con el fuerte soporte de Kimi para llamadas a herramientas y agentes de larga duración, K2.6 es el modelo que gana en flujos de trabajo donde se reutiliza un prompt de sistema extenso en muchas interacciones: agentes de codificación, chatbots de soporte al cliente con prompts de persona estables, pipelines de recuperación con bloques de contexto estables.

Ventajas de K2.6:

Casos en los que no es adecuado:

Para una cobertura más profunda: ¿Vale realmente la pena el bombo del precio de la API de Kimi K2 para los desarrolladores en 2026?

Zhipu GLM: el contendiente del razonamiento

Modelos: GLM-5 ($1.00 entrada / $3.20 salida, 200K contexto), GLM-5.1 ($0.98 / $3.08, 200K contexto). Tarifas verificadas contra la descripción general de precios oficial de Z.AI.

GLM-5 de Zhipu se lanzó con un aumento del 30% en el precio sobre GLM-4.7 (un movimiento contracultural en un mercado que compite por los precios más bajos), luego lanzó GLM-5.1 con un descuento marginal. Los precios reflejan el posicionamiento de Zhipu: no es el más barato, pero es el más fuerte en razonamiento estructurado y tareas de cadena de pensamiento.

Ventajas de GLM-5:

Casos en los que no es adecuado:

Para una cobertura más profunda: GLM-5 vs DeepSeek V3 vs GPT-5: velocidad, costo y comparación práctica para desarrolladores, GLM-5.1 vs Claude, GPT, Gemini, DeepSeek.

El más barato por carga de trabajo: una matriz para el comprador

Para cinco cargas de trabajo de producción comunes, aquí está el modelo que gana:

Carga de trabajo Ganador Por qué
Generación de código (con mucha salida) DeepSeek V4-Pro $0.87/MTok de salida es imbatible
RAG de documentos largos (>300K contexto) Xiaomi MiMo V2.5 Pro Única opción con 1M de contexto a precio fijo
Agente de codificación con prompt de sistema estable Kimi K2.6 Precio mínimo de acierto de caché de $0.07/MTok
Soporte al cliente multilingüe Alibaba Qwen3 Max El mejor rendimiento no inglés
Matemáticas, razonamiento formal, análisis estructurado Zhipu GLM-5 La mejor calidad de razonamiento paso a paso

Tres patrones combinados que vale la pena señalar:

Notas de calidad y benchmarks

Una nota sobre la calidad, ya que el precio no significa nada si el modelo no puede hacer el trabajo.

Según Artificial Analysis, los cinco modelos en esta comparación se agrupan dentro de 5 a 10 puntos porcentuales entre sí en la mayoría de los benchmarks públicos. Las interesantes diferencias finales:

Realice su propia evaluación de 100 muestras antes de comprometerse. Los benchmarks públicos son útiles como guía, pero la brecha que importa es la de su propio tráfico.

Probando los cinco con Apidog

Un despliegue de producción multimodo necesita un arnés de prueba multimodo. Apidog maneja las cinco API chinas desde un solo espacio de trabajo porque las cinco aceptan cuerpos de solicitud de OpenAI Chat Completions, con pequeñas peculiaridades de compatibilidad. El flujo de trabajo:

  1. Cree un entorno por proveedor en Apidog: api.deepseek.com, platform.xiaomimimo.com, Alibaba Cloud Model Studio, api.moonshot.cn de Moonshot, y open.bigmodel.cn de Zhipu.
  2. Importe el esquema de OpenAI Chat Completion una vez. Cambie la URL base por entorno.
  3. Ejecute el mismo escenario de prueba en los cinco con un solo clic. Compare las respuestas, puntuaciones y latencias.
  4. Configure la validación de esquemas JSON contra las formas de tool_calls para detectar las peculiaridades del formato de streaming únicas de cada proveedor.

Descargue Apidog, importe sus casos de prueba y tendrá una comparación funcional de cinco vías en menos de quince minutos. El mismo flujo de trabajo que recomendamos en los análisis profundos por modelo: Recorte permanente de DeepSeek V4-Pro, Costo de MiMo V2.5, Precios de Kimi K2.

Hacia dónde se dirige la guerra de precios

El precio mínimo se movió dos veces en mayo. Es probable que haya dos movimientos más antes de que finalice el tercer trimestre.

Construya en consecuencia. Tres próximos pasos:

El precio mínimo no ha terminado de caer. Prepare su pila para lo que viene.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs