¿Qué es ERNIE 5.1? El Nuevo Modelo MoE de Baidu

Ashley Innocent

Ashley Innocent

14 May 2026

¿Qué es ERNIE 5.1? El Nuevo Modelo MoE de Baidu

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Baidu lanzó ERNIE 5.1 el 9 de mayo de 2026, y la cifra principal es difícil de ignorar: un modelo Mixture-of-Experts con aproximadamente un tercio de los parámetros totales de ERNIE 5.0 que se posicionó en el 4º lugar global en la clasificación de Arena Search y 1º entre los modelos chinos con una puntuación de 1.223.

Es la primera versión de la familia ERNIE donde Baidu compite abiertamente en el uso de herramientas agenciales, la escritura creativa de formato largo y el razonamiento contra Gemini 3.1 Pro y DeepSeek-V4-Pro, ya no solo en tareas en chino. Si trabajas con Apidog y has estado esperando un modelo chino de vanguardia que puedas integrar en una pila de agentes sin una huella de 70 mil millones de parámetros, este lanzamiento merece una revisión cuidadosa.

botón

Esta guía explica qué es ERNIE 5.1, qué cambió internamente, cómo se comparan los benchmarks con DeepSeek-V4-Pro y Gemini 3.1 Pro, y dónde encaja el modelo si ya utilizas DeepSeek V4 o Kimi K2.6 en producción.

TL;DR: ERNIE 5.1 en un párrafo

ERNIE 5.1 es un modelo MoE solo de texto entrenado con aproximadamente el 6% del costo de preentrenamiento de modelos de vanguardia comparables. Los parámetros totales son alrededor de un tercio de los de ERNIE 5.0, y los parámetros activos por pasada de avance son aproximadamente la mitad. Obtiene una puntuación de 1.223 en la clasificación de Arena Search (4º global, 1º en China), supera a DeepSeek-V4-Pro en los benchmarks de agentes τ³-bench y SpreadsheetBench-Verified, y alcanza 99.6 en AIME26 con el uso de herramientas. El acceso está disponible a través de la interfaz de chat de ERNIE, el ERNIE 5.1 Playground de Baidu AI Studio y la API de Qianfan.

Por qué este lanzamiento es importante

Tres cosas destacan, y ninguna de ellas es "Baidu lanzó otro modelo".

1. La relación coste-calidad. Una ejecución de preentrenamiento a aproximadamente el 6% del coste de modelos comparables es una cifra que redefine las expectativas de precios en toda la industria. Si Baidu puede ofrecer esto a través de Qianfan a una fracción de lo que cobran los modelos cerrados de vanguardia, los precios de la API seguirán.

2. El diseño MoE es elástico en tres ejes. La mayoría de los modelos MoE enrutan a través del ancho (qué expertos se activan) y, a veces, de la profundidad (salto de capas). Baidu afirma que ERNIE 5.1 enruta simultáneamente a través de la profundidad, el ancho y la dispersión, que es como redujeron el modelo sin perder las puntuaciones de uso de herramientas agenciales. Esto está más cerca de la filosofía de diseño en DeepSeek-V3.x que de un MoE estilo GShard estándar.

3. La capacidad agencial es el titular, no una nota al pie. ERNIE 5.0 se posicionó como un modelo de conocimiento y escritura creativa. ERNIE 5.1 comercializa explícitamente "capacidades agenciales a la par de los mejores modelos del mundo" y se lanza con un entorno de pruebas Baidu AI Studio ajustado para demostraciones de llamadas a herramientas. Ese es un cambio estratégico.

Los benchmarks, uno al lado del otro

Aquí está lo que Baidu publicó, mapeado contra los puntos de comparación públicos más cercanos.

Benchmark ERNIE 5.1 Qué evalúa Competidor más cercano
Clasificación de Arena Search 1.223 (4º global, 1º CN) QA consciente de búsqueda calificado por humanos Gemini 3.1 Pro, GPT-5.x
τ³-bench Supera a DeepSeek-V4-Pro Uso de herramientas agenciales, múltiples turnos DeepSeek-V4-Pro
SpreadsheetBench-Verified Supera a DeepSeek-V4-Pro Tareas de hoja de cálculo del mundo real DeepSeek-V4-Pro
AIME26 (con herramientas) 99.6 Matemáticas de competición con intérprete de código GPT-5.x, Gemini 3.1 Pro
GPQA "Se acerca a los modelos de código cerrado líderes" QA de ciencia a nivel de posgrado Claude Sonnet 4.6
MMLU-Pro "Se acerca a los modelos de código cerrado líderes" Conocimiento amplio Todos los modelos de vanguardia

Algunas advertencias honestas. Las puntuaciones de Arena dependen de la mezcla de prompts y del grupo de votantes, y los prompts con sesgo chino probablemente ayuden aquí. La puntuación de AIME26 con herramientas también está aumentada por herramientas; no se reveló un número de AIME de razonamiento puro. La escritura creativa se describe como "acercándose a Gemini 3.1 Pro" en lugar de igualarla.

Dicho esto, los resultados de τ³-bench y SpreadsheetBench son los que merecen atención. Ambos son agenciales, ambos son mantenidos externamente y ambos históricamente han sido difíciles de manipular.

Lo que sabemos sobre la arquitectura

Baidu divulgó menos que DeepSeek para sus documentos de la serie V3, pero esto es lo que confirman la publicación de lanzamiento y las publicaciones adyacentes:

La longitud del contexto, el recuento exacto de parámetros y el presupuesto de tokens de entrenamiento no fueron revelados. Si ya has desarrollado con modelos MoE chinos como GLM 5.1, espera un área de superficie de desarrollador similar.

Lo que no puedes hacer con ERNIE 5.1 (todavía)

Vale la pena mencionarlo para que no lo incorpores a tu diseño y te arrepientas más tarde.

Cómo se compara ERNIE 5.1 con la vanguardia china

Si ya eliges entre DeepSeek, Kimi, GLM y Qwen, aquí tienes el modelo mental rápido.

Elige ERNIE 5.1 cuando necesites un fuerte uso de herramientas agenciales más respuestas aumentadas por búsqueda en chino o inglés, y quieras la curva de precios más barata en el lado de la nube china.

Elige DeepSeek V4 cuando necesites pesos abiertos, despliegue local o la puntuación de razonamiento puro más fuerte en matemáticas difíciles sin herramientas.

Elige Kimi K2.6 cuando necesites ventanas de contexto largas para flujos de trabajo intensivos en documentos.

Elige GLM 5.1 cuando necesites un generalista equilibrado y ya tengas Z.ai o Zhipu en tu pila.

Esta no es una clasificación estricta; se trata de qué compromiso se adapta mejor a tu carga de trabajo. Realiza tus propias evaluaciones en un segmento de 50 prompts antes de comprometerte.

Dónde probar ERNIE 5.1 hoy

Tres caminos, en orden de fricción:

  1. ernie.baidu.com: la interfaz de usuario de chat para consumidores. Gratuita, sin clave API, región de China. Ideal para probar la escritura creativa y el razonamiento.
  2. Baidu AI Studio ERNIE 5.1 Playground: un entorno de pruebas alojado con demostraciones de llamadas a herramientas preconfiguradas. Bueno para experimentos agenciales antes de comprometerse con el trabajo de API.
  3. API de Qianfan: el endpoint para desarrolladores. Formato de solicitud compatible con OpenAI, autenticación con token de portador. Una guía práctica completa se encuentra en nuestra publicación complementaria Cómo usar la API de ERNIE 5.1.

Si estás evaluando múltiples proveedores de modelos chinos en paralelo, Apidog es la forma más limpia de gestionar las claves, guardar los cuerpos de las solicitudes por proveedor y comparar las respuestas lado a lado sin escribir scripts de un solo uso.

Precios y lanzamiento

Baidu anunció que ERNIE 5.1 se implementará en más de 10 plataformas de producción creativa en las semanas posteriores al lanzamiento. El precio público por token en Qianfan no se incluyó en la publicación de lanzamiento; basándose en la afirmación del ~6% del costo de preentrenamiento y la hoja de tarifas histórica de Qianfan de Baidu, espera un precio de entrada en el mismo rango que ERNIE 4.5 Turbo o inferior. Siempre verifica la consola de Qianfan en vivo antes de citar cifras internamente.

Cómo los desarrolladores deberían considerar ERNIE 5.1

Tres recomendaciones concretas si estás decidiendo si integrarlo en tu pila.

1. Ejecútalo contra tu propia evaluación agencial, no contra el benchmark público. τ³-bench es una buena señal, pero no es tu carga de trabajo. Crea una evaluación de 20 a 50 casos que refleje tus patrones reales de uso de herramientas, luego compara ERNIE 5.1 con tu modelo actual. Prueba LLMs como APIs muestra una forma de hacer esto con Apidog.

2. Considera el modelo como una apuesta en la nube china. Qianfan está alojado en China. Si tus reglas de residencia de datos dicen "no a la infraestructura de la RPC", esto es un punto de partida inviable, independientemente de los benchmarks.

3. Presta atención al anuncio de precios. La afirmación del ~6% del costo de preentrenamiento es el número más interesante del lanzamiento. Si Baidu traslada esto a la API, todo el piso de precios de los modelos chinos bajará, lo que obligará a DeepSeek, Zhipu y Moonshot a responder.

Preguntas frecuentes

¿Es ERNIE 5.1 de código abierto? No. ERNIE 5.1 es un modelo solo alojado accesible a través de la interfaz de chat de Baidu, Baidu AI Studio y la API de Qianfan. No hay pesos públicos en HuggingFace en el momento de escribir esto.

¿ERNIE 5.1 admite entrada de imagen o visión? No. ERNIE 5.1 es solo texto en su lanzamiento. La familia ERNIE-VL de Baidu maneja tareas de visión. Si necesitas un único modelo multimodal chino, considera Qwen 3.5 Omni en su lugar.

¿Cuál es la longitud del contexto? Baidu no publicó un número específico de ventana de contexto en la publicación de lanzamiento. Hasta que lo confirmen, diseña flujos de trabajo de documentos largos de forma defensiva y divide las entradas en fragmentos.

¿Puedo usar ERNIE 5.1 fuera de China? La interfaz de chat y la API de Qianfan son accesibles desde la mayoría de las regiones, pero la latencia y la verificación de la cuenta difieren. Algunas características empresariales todavía requieren un número de teléfono o una licencia comercial de China continental. La guía complementaria Cómo usar la API de ERNIE 5.1 cubre el flujo de acceso en detalle.

¿Es ERNIE 5.1 mejor que DeepSeek-V4-Pro? En τ³-bench y SpreadsheetBench-Verified, Baidu dice que sí. En el acceso de pesos abiertos, no. En los benchmarks de matemáticas de razonamiento puro sin uso de herramientas, los números públicos no dan una respuesta clara. La posición honesta: apuntan a modelos de despliegue ligeramente diferentes.

¿Listo para empezar a construir? Descarga Apidog e importa la especificación OpenAPI de Qianfan para probar ERNIE 5.1 junto a tu modelo actual en un solo espacio de trabajo.

botón

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs

¿Qué es ERNIE 5.1? El Nuevo Modelo MoE de Baidu