Qu'est-ce que ERNIE 5.1 ? Le Nouveau Modèle MoE de Baidu

Ashley Innocent

Ashley Innocent

14 May 2026

Qu'est-ce que ERNIE 5.1 ? Le Nouveau Modèle MoE de Baidu

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Baidu a lancé ERNIE 5.1 le 9 mai 2026, et le chiffre principal est difficile à ignorer : un modèle de Mixture d'Experts avec environ un tiers des paramètres totaux d'ERNIE 5.0, qui s'est classé à la 4ème place mondiale du classement Arena Search et 1er parmi les modèles chinois avec un score de 1 223.

C'est la première version de la famille ERNIE où Baidu est ouvertement en concurrence sur l'utilisation d'outils agentiques, l'écriture créative longue et le raisonnement contre Gemini 3.1 Pro et DeepSeek-V4-Pro, ne se limitant plus aux seules tâches en langue chinoise. Si vous développez avec Apidog et que vous attendiez un modèle chinois de pointe que vous pouvez intégrer dans une pile d'agents sans une empreinte de 70 milliards de paramètres, cette version mérite une attention particulière.

button

Ce guide explique ce qu'est ERNIE 5.1, ce qui a changé en interne, comment les benchmarks se comparent à DeepSeek-V4-Pro et Gemini 3.1 Pro, et où le modèle s'intègre si vous utilisez déjà DeepSeek V4 ou Kimi K2.6 en production.

TL;DR : ERNIE 5.1 en un paragraphe

ERNIE 5.1 est un modèle MoE uniquement textuel entraîné à environ 6 % du coût de pré-entraînement des modèles de pointe comparables. Le nombre total de paramètres représente environ un tiers de ceux d'ERNIE 5.0, et les paramètres actifs par passe avant représentent environ la moitié. Il obtient un score de 1 223 au classement Arena Search (4ème mondial, 1er en Chine), bat DeepSeek-V4-Pro sur les benchmarks agentiques τ³-bench et SpreadsheetBench-Verified, et atteint 99,6 sur AIME26 avec l'utilisation d'outils. L'accès est disponible via l'interface de chat ERNIE, l'ERNIE 5.1 Playground de Baidu AI Studio et l'API Qianfan.

Pourquoi cette version est importante

Trois points se distinguent, et aucun d'entre eux n'est « Baidu a livré un autre modèle ».

1. Le rapport coût-qualité. Un entraînement préalable à environ 6 % du coût des modèles comparables est un chiffre qui redéfinit les attentes en matière de prix dans l'industrie. Si Baidu peut le proposer via Qianfan à une fraction de ce que facturent les modèles fermés de pointe, la tarification de l'API en aval suivra.

2. La conception MoE est élastique sur trois axes. La plupart des modèles MoE se routent en largeur (quels experts s'activent) et parfois en profondeur (saut de couche). Baidu affirme qu'ERNIE 5.1 se route simultanément sur la profondeur, la largeur et la rareté, ce qui leur a permis de réduire le modèle sans perdre les scores d'utilisation d'outils agentiques. Ceci est plus proche de la philosophie de conception de DeepSeek-V3.x que d'un MoE de style GShard classique.

3. La capacité agentique est le titre principal, pas une note de bas de page. ERNIE 5.0 était positionné comme un modèle de connaissance et d'écriture créative. ERNIE 5.1 commercialise explicitement des « capacités agentiques à la hauteur des meilleurs modèles mondiaux » et est livré avec un terrain de jeu Baidu AI Studio optimisé pour des démonstrations d'appel d'outils. C'est un changement stratégique.

Les benchmarks, côte à côte

Voici ce que Baidu a publié, comparé aux points de comparaison publics les plus proches.

Benchmark ERNIE 5.1 Ce qu'il teste Concurrent le plus proche
Classement Arena Search 1,223 (4ème mondial, 1er CN) QA axée sur la recherche et évaluée par des humains Gemini 3.1 Pro, GPT-5.x
τ³-bench Batte DeepSeek-V4-Pro Utilisation d'outils agentiques, multi-tours DeepSeek-V4-Pro
SpreadsheetBench-Verified Batte DeepSeek-V4-Pro Tâches de tableur réelles DeepSeek-V4-Pro
AIME26 (avec outils) 99.6 Mathématiques de compétition avec interpréteur de code GPT-5.x, Gemini 3.1 Pro
GPQA « Se rapproche des leaders propriétaires » QA scientifique de niveau universitaire Claude Sonnet 4.6
MMLU-Pro « Se rapproche des leaders propriétaires » Vaste connaissance Tous les modèles de pointe

Quelques mises en garde honnêtes. Les scores Arena dépendent du mélange de prompts et du bassin de votants, et les prompts à tendance chinoise sont probablement utiles ici. Le score AIME26 avec outils est également augmenté par des outils ; un chiffre AIME de raisonnement pur n'a pas été divulgué. L'écriture créative est décrite comme « approchant Gemini 3.1 Pro » plutôt que de l'égaler.

Cela dit, les résultats du τ³-bench et du SpreadsheetBench sont ceux auxquels il faut prêter attention. Tous deux sont agentiques, tous deux sont maintenus en externe, et tous deux ont toujours été difficiles à manipuler.

Ce que nous savons de l'architecture

Baidu a divulgué moins d'informations que DeepSeek pour ses articles de la série V3, mais voici ce que le communiqué de presse et les articles connexes confirment :

La longueur du contexte, les décomptes exacts des paramètres et le budget de jetons d'entraînement n'ont pas été divulgués. Si vous avez déjà développé avec des modèles MoE chinois comme GLM 5.1, attendez-vous à une surface de développement similaire.

Ce que vous ne pouvez pas encore faire avec ERNIE 5.1

Il est important de le signaler pour que vous ne conceviez pas de solutions basées dessus et que vous ne le regrettiez pas plus tard.

Comment ERNIE 5.1 se compare à la frontière chinoise

Si vous choisissez déjà entre DeepSeek, Kimi, GLM et Qwen, voici le modèle mental rapide.

Ce n'est pas un classement strict ; il s'agit de savoir quel compromis correspond à votre charge de travail. Effectuez vos propres évaluations sur un échantillon de 50 prompts avant de vous engager.

Où essayer ERNIE 5.1 aujourd'hui

Trois voies, par ordre de difficulté :

  1. ernie.baidu.com : l'interface de chat grand public. Gratuite, sans clé API, région Chine. Idéale pour tester l'écriture créative et le raisonnement.
  2. Baidu AI Studio ERNIE 5.1 Playground : un terrain de jeu hébergé avec des démos d'appel d'outils pré-câblées. Bon pour les expériences agentiques avant de vous engager dans le travail d'API.
  3. API Qianfan : le point de terminaison pour les développeurs. Forme de requête compatible OpenAI, authentification par jeton Bearer. Une présentation complète et pratique est disponible dans notre article complémentaire Comment utiliser l'API ERNIE 5.1.

Si vous évaluez plusieurs fournisseurs de modèles chinois en parallèle, Apidog est le moyen le plus propre de gérer les clés, de sauvegarder les corps de requêtes par fournisseur et de comparer les réponses côte à côte sans écrire de scripts jetables.

Tarification et déploiement

Baidu a annoncé qu'ERNIE 5.1 sera déployé sur plus de 10 plateformes de production créative dans les semaines suivant le lancement. La tarification publique par jeton sur Qianfan n'était pas mentionnée dans le communiqué de presse ; basée sur l'affirmation d'un coût de pré-entraînement d'environ 6 % et sur la grille tarifaire historique de Qianfan de Baidu, attendez-vous à des prix d'entrée dans la même fourchette qu'ERNIE 4.5 Turbo ou inférieurs. Vérifiez toujours la console Qianfan en direct avant de citer des chiffres en interne.

Comment les développeurs devraient considérer ERNIE 5.1

Trois recommandations concrètes si vous décidez de l'intégrer à votre pile technologique.

  1. 1. Exécutez-le par rapport à votre propre évaluation agentique, pas aux benchmarks publics. τ³-bench est un bon indicateur, mais ce n'est pas votre charge de travail. Créez une évaluation de 20 à 50 cas qui reflète vos réels modèles d'utilisation d'outils, puis comparez ERNIE 5.1 à votre modèle actuel. Tester les LLM en tant qu'APIs décrit une méthode pour le faire avec Apidog.
  2. 2. Considérez le modèle comme un pari sur le cloud chinois. Qianfan est hébergé en Chine. Si vos règles de résidence des données stipulent « pas d'infrastructure en RPC », c'est une impasse, quels que soient les benchmarks.
  3. 3. Surveillez l'annonce des prix. L'affirmation d'un coût de pré-entraînement d'environ 6 % est le chiffre le plus intéressant du communiqué. Si Baidu le répercute sur l'API, l'ensemble du plancher des prix des modèles chinois baissera, ce qui obligera DeepSeek, Zhipu et Moonshot à réagir.

Foire aux questions

Prêt à commencer à développer ? Téléchargez Apidog et importez la spécification OpenAPI de Qianfan pour tester ERNIE 5.1 en parallèle de votre modèle actuel dans un seul espace de travail.

button

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API