Baidu a lancé ERNIE 5.1 le 9 mai 2026, et le chiffre principal est difficile à ignorer : un modèle de Mixture d'Experts avec environ un tiers des paramètres totaux d'ERNIE 5.0, qui s'est classé à la 4ème place mondiale du classement Arena Search et 1er parmi les modèles chinois avec un score de 1 223.
C'est la première version de la famille ERNIE où Baidu est ouvertement en concurrence sur l'utilisation d'outils agentiques, l'écriture créative longue et le raisonnement contre Gemini 3.1 Pro et DeepSeek-V4-Pro, ne se limitant plus aux seules tâches en langue chinoise. Si vous développez avec Apidog et que vous attendiez un modèle chinois de pointe que vous pouvez intégrer dans une pile d'agents sans une empreinte de 70 milliards de paramètres, cette version mérite une attention particulière.
Ce guide explique ce qu'est ERNIE 5.1, ce qui a changé en interne, comment les benchmarks se comparent à DeepSeek-V4-Pro et Gemini 3.1 Pro, et où le modèle s'intègre si vous utilisez déjà DeepSeek V4 ou Kimi K2.6 en production.
TL;DR : ERNIE 5.1 en un paragraphe
ERNIE 5.1 est un modèle MoE uniquement textuel entraîné à environ 6 % du coût de pré-entraînement des modèles de pointe comparables. Le nombre total de paramètres représente environ un tiers de ceux d'ERNIE 5.0, et les paramètres actifs par passe avant représentent environ la moitié. Il obtient un score de 1 223 au classement Arena Search (4ème mondial, 1er en Chine), bat DeepSeek-V4-Pro sur les benchmarks agentiques τ³-bench et SpreadsheetBench-Verified, et atteint 99,6 sur AIME26 avec l'utilisation d'outils. L'accès est disponible via l'interface de chat ERNIE, l'ERNIE 5.1 Playground de Baidu AI Studio et l'API Qianfan.

Pourquoi cette version est importante
Trois points se distinguent, et aucun d'entre eux n'est « Baidu a livré un autre modèle ».
1. Le rapport coût-qualité. Un entraînement préalable à environ 6 % du coût des modèles comparables est un chiffre qui redéfinit les attentes en matière de prix dans l'industrie. Si Baidu peut le proposer via Qianfan à une fraction de ce que facturent les modèles fermés de pointe, la tarification de l'API en aval suivra.
2. La conception MoE est élastique sur trois axes. La plupart des modèles MoE se routent en largeur (quels experts s'activent) et parfois en profondeur (saut de couche). Baidu affirme qu'ERNIE 5.1 se route simultanément sur la profondeur, la largeur et la rareté, ce qui leur a permis de réduire le modèle sans perdre les scores d'utilisation d'outils agentiques. Ceci est plus proche de la philosophie de conception de DeepSeek-V3.x que d'un MoE de style GShard classique.
3. La capacité agentique est le titre principal, pas une note de bas de page. ERNIE 5.0 était positionné comme un modèle de connaissance et d'écriture créative. ERNIE 5.1 commercialise explicitement des « capacités agentiques à la hauteur des meilleurs modèles mondiaux » et est livré avec un terrain de jeu Baidu AI Studio optimisé pour des démonstrations d'appel d'outils. C'est un changement stratégique.

Les benchmarks, côte à côte
Voici ce que Baidu a publié, comparé aux points de comparaison publics les plus proches.
| Benchmark | ERNIE 5.1 | Ce qu'il teste | Concurrent le plus proche |
|---|---|---|---|
| Classement Arena Search | 1,223 (4ème mondial, 1er CN) | QA axée sur la recherche et évaluée par des humains | Gemini 3.1 Pro, GPT-5.x |
| τ³-bench | Batte DeepSeek-V4-Pro | Utilisation d'outils agentiques, multi-tours | DeepSeek-V4-Pro |
| SpreadsheetBench-Verified | Batte DeepSeek-V4-Pro | Tâches de tableur réelles | DeepSeek-V4-Pro |
| AIME26 (avec outils) | 99.6 | Mathématiques de compétition avec interpréteur de code | GPT-5.x, Gemini 3.1 Pro |
| GPQA | « Se rapproche des leaders propriétaires » | QA scientifique de niveau universitaire | Claude Sonnet 4.6 |
| MMLU-Pro | « Se rapproche des leaders propriétaires » | Vaste connaissance | Tous les modèles de pointe |
Quelques mises en garde honnêtes. Les scores Arena dépendent du mélange de prompts et du bassin de votants, et les prompts à tendance chinoise sont probablement utiles ici. Le score AIME26 avec outils est également augmenté par des outils ; un chiffre AIME de raisonnement pur n'a pas été divulgué. L'écriture créative est décrite comme « approchant Gemini 3.1 Pro » plutôt que de l'égaler.
Cela dit, les résultats du τ³-bench et du SpreadsheetBench sont ceux auxquels il faut prêter attention. Tous deux sont agentiques, tous deux sont maintenus en externe, et tous deux ont toujours été difficiles à manipuler.
Ce que nous savons de l'architecture
Baidu a divulgué moins d'informations que DeepSeek pour ses articles de la série V3, mais voici ce que le communiqué de presse et les articles connexes confirment :
- Paramètres totaux : environ un tiers d'ERNIE 5.0
- Paramètres actifs par jeton : environ la moitié d'ERNIE 5.0
- Routage : élastique sur la profondeur, la largeur et la rareté (un MoE à trois axes)
- Coût de pré-entraînement : ~6 % des « modèles comparables »
- Modalité : uniquement du texte au lancement (pas de vision, pas d'audio)
- Langues : versions chinoise et anglaise disponibles
La longueur du contexte, les décomptes exacts des paramètres et le budget de jetons d'entraînement n'ont pas été divulgués. Si vous avez déjà développé avec des modèles MoE chinois comme GLM 5.1, attendez-vous à une surface de développement similaire.

Ce que vous ne pouvez pas encore faire avec ERNIE 5.1
Il est important de le signaler pour que vous ne conceviez pas de solutions basées dessus et que vous ne le regrettiez pas plus tard.
- Pas d'entrée d'image. ERNIE 5.1 est uniquement textuel. Pour les flux de travail multimodaux Baidu, vous avez toujours besoin d'ERNIE-VL ou d'un modèle de vision externe.
- Pas d'entrée ou de sortie audio. Pas de synthèse vocale native, pas de voix en temps réel.
- Pas de fenêtre de contexte publiée. Tant que Baidu ne confirme pas le chiffre, traitez les cas d'utilisation de documents longs avec prudence.
- Pas de poids HuggingFace. C'est un modèle uniquement hébergé. Si le déploiement sur site est important, vous devrez plutôt vous tourner vers DeepSeek V4 en local ou un LLM local.
Comment ERNIE 5.1 se compare à la frontière chinoise
Si vous choisissez déjà entre DeepSeek, Kimi, GLM et Qwen, voici le modèle mental rapide.
- Choisissez ERNIE 5.1 lorsque vous avez besoin d'une forte utilisation d'outils agentiques et de réponses augmentées par la recherche en chinois ou en anglais, et que vous souhaitez la courbe de prix la plus avantageuse du côté du cloud chinois.
- Choisissez DeepSeek V4 lorsque vous avez besoin de poids ouverts, d'un déploiement sur site, ou du meilleur score de raisonnement pur sur des problèmes mathématiques complexes sans outils.
- Choisissez Kimi K2.6 lorsque vous avez besoin de longues fenêtres de contexte pour les flux de travail axés sur les documents.
- Choisissez GLM 5.1 lorsque vous avez besoin d'un généraliste équilibré et que vous avez déjà Z.ai ou Zhipu dans votre pile technologique.
Ce n'est pas un classement strict ; il s'agit de savoir quel compromis correspond à votre charge de travail. Effectuez vos propres évaluations sur un échantillon de 50 prompts avant de vous engager.
Où essayer ERNIE 5.1 aujourd'hui
Trois voies, par ordre de difficulté :
- ernie.baidu.com : l'interface de chat grand public. Gratuite, sans clé API, région Chine. Idéale pour tester l'écriture créative et le raisonnement.
- Baidu AI Studio ERNIE 5.1 Playground : un terrain de jeu hébergé avec des démos d'appel d'outils pré-câblées. Bon pour les expériences agentiques avant de vous engager dans le travail d'API.
- API Qianfan : le point de terminaison pour les développeurs. Forme de requête compatible OpenAI, authentification par jeton Bearer. Une présentation complète et pratique est disponible dans notre article complémentaire Comment utiliser l'API ERNIE 5.1.
Si vous évaluez plusieurs fournisseurs de modèles chinois en parallèle, Apidog est le moyen le plus propre de gérer les clés, de sauvegarder les corps de requêtes par fournisseur et de comparer les réponses côte à côte sans écrire de scripts jetables.
Tarification et déploiement
Baidu a annoncé qu'ERNIE 5.1 sera déployé sur plus de 10 plateformes de production créative dans les semaines suivant le lancement. La tarification publique par jeton sur Qianfan n'était pas mentionnée dans le communiqué de presse ; basée sur l'affirmation d'un coût de pré-entraînement d'environ 6 % et sur la grille tarifaire historique de Qianfan de Baidu, attendez-vous à des prix d'entrée dans la même fourchette qu'ERNIE 4.5 Turbo ou inférieurs. Vérifiez toujours la console Qianfan en direct avant de citer des chiffres en interne.
Comment les développeurs devraient considérer ERNIE 5.1
Trois recommandations concrètes si vous décidez de l'intégrer à votre pile technologique.
- 1. Exécutez-le par rapport à votre propre évaluation agentique, pas aux benchmarks publics. τ³-bench est un bon indicateur, mais ce n'est pas votre charge de travail. Créez une évaluation de 20 à 50 cas qui reflète vos réels modèles d'utilisation d'outils, puis comparez ERNIE 5.1 à votre modèle actuel. Tester les LLM en tant qu'APIs décrit une méthode pour le faire avec Apidog.
- 2. Considérez le modèle comme un pari sur le cloud chinois. Qianfan est hébergé en Chine. Si vos règles de résidence des données stipulent « pas d'infrastructure en RPC », c'est une impasse, quels que soient les benchmarks.
- 3. Surveillez l'annonce des prix. L'affirmation d'un coût de pré-entraînement d'environ 6 % est le chiffre le plus intéressant du communiqué. Si Baidu le répercute sur l'API, l'ensemble du plancher des prix des modèles chinois baissera, ce qui obligera DeepSeek, Zhipu et Moonshot à réagir.
Foire aux questions
- ERNIE 5.1 est-il open-source ? Non. ERNIE 5.1 est un modèle uniquement hébergé, accessible via l'interface de chat de Baidu, Baidu AI Studio et l'API Qianfan. Il n'y a pas de poids publics sur HuggingFace au moment de la rédaction.
- ERNIE 5.1 prend-il en charge l'entrée d'images ou de vision ? Non. ERNIE 5.1 est uniquement textuel au lancement. La famille ERNIE-VL de Baidu gère les tâches de vision. Si vous avez besoin d'un seul modèle chinois multimodal, regardez plutôt Qwen 3.5 Omni.
- Quelle est la longueur du contexte ? Baidu n'a pas publié de nombre spécifique pour la fenêtre de contexte dans le communiqué de presse. Tant qu'ils ne le confirment pas, concevez les flux de travail avec de longs documents de manière défensive et segmentez les entrées.
- Puis-je utiliser ERNIE 5.1 en dehors de la Chine ? L'interface de chat et l'API Qianfan sont accessibles depuis la plupart des régions, mais la latence et la vérification de compte diffèrent. Certaines fonctionnalités d'entreprise nécessitent toujours un numéro de téléphone continental ou une licence commerciale. Le guide complémentaire Comment utiliser l'API ERNIE 5.1 couvre le processus d'accès en détail.
- ERNIE 5.1 est-il meilleur que DeepSeek-V4-Pro ? Sur τ³-bench et SpreadsheetBench-Verified, Baidu dit oui. En ce qui concerne l'accès aux poids ouverts, non. Sur les benchmarks mathématiques de raisonnement pur sans utilisation d'outils, les chiffres publics ne donnent pas de réponse claire. La position honnête : ils ciblent des modèles de déploiement légèrement différents.
Prêt à commencer à développer ? Téléchargez Apidog et importez la spécification OpenAPI de Qianfan pour tester ERNIE 5.1 en parallèle de votre modèle actuel dans un seul espace de travail.
