Baidu lanzó ERNIE 5.1 el 9 de mayo de 2026, y la cifra principal es difícil de ignorar: un modelo Mixture-of-Experts con aproximadamente un tercio de los parámetros totales de ERNIE 5.0 que se posicionó en el 4º lugar global en la clasificación de Arena Search y 1º entre los modelos chinos con una puntuación de 1.223.
Es la primera versión de la familia ERNIE donde Baidu compite abiertamente en el uso de herramientas agenciales, la escritura creativa de formato largo y el razonamiento contra Gemini 3.1 Pro y DeepSeek-V4-Pro, ya no solo en tareas en chino. Si trabajas con Apidog y has estado esperando un modelo chino de vanguardia que puedas integrar en una pila de agentes sin una huella de 70 mil millones de parámetros, este lanzamiento merece una revisión cuidadosa.
Esta guía explica qué es ERNIE 5.1, qué cambió internamente, cómo se comparan los benchmarks con DeepSeek-V4-Pro y Gemini 3.1 Pro, y dónde encaja el modelo si ya utilizas DeepSeek V4 o Kimi K2.6 en producción.
TL;DR: ERNIE 5.1 en un párrafo
ERNIE 5.1 es un modelo MoE solo de texto entrenado con aproximadamente el 6% del costo de preentrenamiento de modelos de vanguardia comparables. Los parámetros totales son alrededor de un tercio de los de ERNIE 5.0, y los parámetros activos por pasada de avance son aproximadamente la mitad. Obtiene una puntuación de 1.223 en la clasificación de Arena Search (4º global, 1º en China), supera a DeepSeek-V4-Pro en los benchmarks de agentes τ³-bench y SpreadsheetBench-Verified, y alcanza 99.6 en AIME26 con el uso de herramientas. El acceso está disponible a través de la interfaz de chat de ERNIE, el ERNIE 5.1 Playground de Baidu AI Studio y la API de Qianfan.

Por qué este lanzamiento es importante
Tres cosas destacan, y ninguna de ellas es "Baidu lanzó otro modelo".
1. La relación coste-calidad. Una ejecución de preentrenamiento a aproximadamente el 6% del coste de modelos comparables es una cifra que redefine las expectativas de precios en toda la industria. Si Baidu puede ofrecer esto a través de Qianfan a una fracción de lo que cobran los modelos cerrados de vanguardia, los precios de la API seguirán.
2. El diseño MoE es elástico en tres ejes. La mayoría de los modelos MoE enrutan a través del ancho (qué expertos se activan) y, a veces, de la profundidad (salto de capas). Baidu afirma que ERNIE 5.1 enruta simultáneamente a través de la profundidad, el ancho y la dispersión, que es como redujeron el modelo sin perder las puntuaciones de uso de herramientas agenciales. Esto está más cerca de la filosofía de diseño en DeepSeek-V3.x que de un MoE estilo GShard estándar.
3. La capacidad agencial es el titular, no una nota al pie. ERNIE 5.0 se posicionó como un modelo de conocimiento y escritura creativa. ERNIE 5.1 comercializa explícitamente "capacidades agenciales a la par de los mejores modelos del mundo" y se lanza con un entorno de pruebas Baidu AI Studio ajustado para demostraciones de llamadas a herramientas. Ese es un cambio estratégico.

Los benchmarks, uno al lado del otro
Aquí está lo que Baidu publicó, mapeado contra los puntos de comparación públicos más cercanos.
| Benchmark | ERNIE 5.1 | Qué evalúa | Competidor más cercano |
|---|---|---|---|
| Clasificación de Arena Search | 1.223 (4º global, 1º CN) | QA consciente de búsqueda calificado por humanos | Gemini 3.1 Pro, GPT-5.x |
| τ³-bench | Supera a DeepSeek-V4-Pro | Uso de herramientas agenciales, múltiples turnos | DeepSeek-V4-Pro |
| SpreadsheetBench-Verified | Supera a DeepSeek-V4-Pro | Tareas de hoja de cálculo del mundo real | DeepSeek-V4-Pro |
| AIME26 (con herramientas) | 99.6 | Matemáticas de competición con intérprete de código | GPT-5.x, Gemini 3.1 Pro |
| GPQA | "Se acerca a los modelos de código cerrado líderes" | QA de ciencia a nivel de posgrado | Claude Sonnet 4.6 |
| MMLU-Pro | "Se acerca a los modelos de código cerrado líderes" | Conocimiento amplio | Todos los modelos de vanguardia |
Algunas advertencias honestas. Las puntuaciones de Arena dependen de la mezcla de prompts y del grupo de votantes, y los prompts con sesgo chino probablemente ayuden aquí. La puntuación de AIME26 con herramientas también está aumentada por herramientas; no se reveló un número de AIME de razonamiento puro. La escritura creativa se describe como "acercándose a Gemini 3.1 Pro" en lugar de igualarla.
Dicho esto, los resultados de τ³-bench y SpreadsheetBench son los que merecen atención. Ambos son agenciales, ambos son mantenidos externamente y ambos históricamente han sido difíciles de manipular.
Lo que sabemos sobre la arquitectura
Baidu divulgó menos que DeepSeek para sus documentos de la serie V3, pero esto es lo que confirman la publicación de lanzamiento y las publicaciones adyacentes:
- Parámetros totales: aproximadamente un tercio de ERNIE 5.0
- Parámetros activos por token: aproximadamente la mitad de ERNIE 5.0
- Enrutamiento: elástico en profundidad, ancho y dispersión (un MoE de tres ejes)
- Costo de preentrenamiento: ~6% de "modelos comparables"
- Modalidad: solo texto en el lanzamiento (sin visión, sin audio)
- Idiomas: versiones en chino e inglés disponibles
La longitud del contexto, el recuento exacto de parámetros y el presupuesto de tokens de entrenamiento no fueron revelados. Si ya has desarrollado con modelos MoE chinos como GLM 5.1, espera un área de superficie de desarrollador similar.

Lo que no puedes hacer con ERNIE 5.1 (todavía)
Vale la pena mencionarlo para que no lo incorpores a tu diseño y te arrepientas más tarde.
- Sin entrada de imagen. ERNIE 5.1 es solo texto. Para flujos de trabajo multimodales de Baidu, todavía necesitas ERNIE-VL o un modelo de visión externo.
- Sin entrada o salida de audio. Sin voz nativa, sin voz en tiempo real.
- Ventana de contexto no publicada. Hasta que Baidu confirme la cifra, trata los casos de uso de documentos largos con precaución.
- Sin pesos en HuggingFace. Este es un modelo solo alojado. Si la instalación local es importante, estás buscando DeepSeek V4 localmente o un LLM local en su lugar.
Cómo se compara ERNIE 5.1 con la vanguardia china
Si ya eliges entre DeepSeek, Kimi, GLM y Qwen, aquí tienes el modelo mental rápido.
Elige ERNIE 5.1 cuando necesites un fuerte uso de herramientas agenciales más respuestas aumentadas por búsqueda en chino o inglés, y quieras la curva de precios más barata en el lado de la nube china.
Elige DeepSeek V4 cuando necesites pesos abiertos, despliegue local o la puntuación de razonamiento puro más fuerte en matemáticas difíciles sin herramientas.
Elige Kimi K2.6 cuando necesites ventanas de contexto largas para flujos de trabajo intensivos en documentos.
Elige GLM 5.1 cuando necesites un generalista equilibrado y ya tengas Z.ai o Zhipu en tu pila.
Esta no es una clasificación estricta; se trata de qué compromiso se adapta mejor a tu carga de trabajo. Realiza tus propias evaluaciones en un segmento de 50 prompts antes de comprometerte.
Dónde probar ERNIE 5.1 hoy
Tres caminos, en orden de fricción:
- ernie.baidu.com: la interfaz de usuario de chat para consumidores. Gratuita, sin clave API, región de China. Ideal para probar la escritura creativa y el razonamiento.
- Baidu AI Studio ERNIE 5.1 Playground: un entorno de pruebas alojado con demostraciones de llamadas a herramientas preconfiguradas. Bueno para experimentos agenciales antes de comprometerse con el trabajo de API.
- API de Qianfan: el endpoint para desarrolladores. Formato de solicitud compatible con OpenAI, autenticación con token de portador. Una guía práctica completa se encuentra en nuestra publicación complementaria Cómo usar la API de ERNIE 5.1.
Si estás evaluando múltiples proveedores de modelos chinos en paralelo, Apidog es la forma más limpia de gestionar las claves, guardar los cuerpos de las solicitudes por proveedor y comparar las respuestas lado a lado sin escribir scripts de un solo uso.
Precios y lanzamiento
Baidu anunció que ERNIE 5.1 se implementará en más de 10 plataformas de producción creativa en las semanas posteriores al lanzamiento. El precio público por token en Qianfan no se incluyó en la publicación de lanzamiento; basándose en la afirmación del ~6% del costo de preentrenamiento y la hoja de tarifas histórica de Qianfan de Baidu, espera un precio de entrada en el mismo rango que ERNIE 4.5 Turbo o inferior. Siempre verifica la consola de Qianfan en vivo antes de citar cifras internamente.
Cómo los desarrolladores deberían considerar ERNIE 5.1
Tres recomendaciones concretas si estás decidiendo si integrarlo en tu pila.
1. Ejecútalo contra tu propia evaluación agencial, no contra el benchmark público. τ³-bench es una buena señal, pero no es tu carga de trabajo. Crea una evaluación de 20 a 50 casos que refleje tus patrones reales de uso de herramientas, luego compara ERNIE 5.1 con tu modelo actual. Prueba LLMs como APIs muestra una forma de hacer esto con Apidog.
2. Considera el modelo como una apuesta en la nube china. Qianfan está alojado en China. Si tus reglas de residencia de datos dicen "no a la infraestructura de la RPC", esto es un punto de partida inviable, independientemente de los benchmarks.
3. Presta atención al anuncio de precios. La afirmación del ~6% del costo de preentrenamiento es el número más interesante del lanzamiento. Si Baidu traslada esto a la API, todo el piso de precios de los modelos chinos bajará, lo que obligará a DeepSeek, Zhipu y Moonshot a responder.
Preguntas frecuentes
¿Es ERNIE 5.1 de código abierto? No. ERNIE 5.1 es un modelo solo alojado accesible a través de la interfaz de chat de Baidu, Baidu AI Studio y la API de Qianfan. No hay pesos públicos en HuggingFace en el momento de escribir esto.
¿ERNIE 5.1 admite entrada de imagen o visión? No. ERNIE 5.1 es solo texto en su lanzamiento. La familia ERNIE-VL de Baidu maneja tareas de visión. Si necesitas un único modelo multimodal chino, considera Qwen 3.5 Omni en su lugar.
¿Cuál es la longitud del contexto? Baidu no publicó un número específico de ventana de contexto en la publicación de lanzamiento. Hasta que lo confirmen, diseña flujos de trabajo de documentos largos de forma defensiva y divide las entradas en fragmentos.
¿Puedo usar ERNIE 5.1 fuera de China? La interfaz de chat y la API de Qianfan son accesibles desde la mayoría de las regiones, pero la latencia y la verificación de la cuenta difieren. Algunas características empresariales todavía requieren un número de teléfono o una licencia comercial de China continental. La guía complementaria Cómo usar la API de ERNIE 5.1 cubre el flujo de acceso en detalle.
¿Es ERNIE 5.1 mejor que DeepSeek-V4-Pro? En τ³-bench y SpreadsheetBench-Verified, Baidu dice que sí. En el acceso de pesos abiertos, no. En los benchmarks de matemáticas de razonamiento puro sin uso de herramientas, los números públicos no dan una respuesta clara. La posición honesta: apuntan a modelos de despliegue ligeramente diferentes.
¿Listo para empezar a construir? Descarga Apidog e importa la especificación OpenAPI de Qianfan para probar ERNIE 5.1 junto a tu modelo actual en un solo espacio de trabajo.
