ERNIE 5.1: Baidus neues MoE Modell erklärt

Ashley Innocent

Ashley Innocent

14 May 2026

ERNIE 5.1: Baidus neues MoE Modell erklärt

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Baidu veröffentlichte ERNIE 5.1 am 9. Mai 2026, und die Schlagzeile ist kaum zu ignorieren: ein Mixture-of-Experts-Modell mit etwa einem Drittel der Gesamtparameter von ERNIE 5.0, das auf dem 4. Platz weltweit in der Arena Search-Bestenliste landete und mit einem Score von 1.223 den 1. Platz unter den chinesischen Modellen belegte.

Es ist die erste Version der ERNIE-Familie, bei der Baidu offen in Bezug auf die Verwendung von Agent-Tools, Langform-Kreatives Schreiben und Argumentation gegen Gemini 3.1 Pro und DeepSeek-V4-Pro antritt, nicht mehr nur bei chinesischsprachigen Aufgaben. Wenn Sie mit Apidog entwickeln und auf ein chinesisches Spitzenmodell gewartet haben, das Sie in einen Agent-Stack einfügen können, ohne einen 70B-Parameter-Fußabdruck zu hinterlassen, ist diese Veröffentlichung einen genaueren Blick wert.

Schaltfläche

Dieser Leitfaden erklärt, was ERNIE 5.1 ist, was sich unter der Haube geändert hat, wie sich die Benchmarks im Vergleich zu DeepSeek-V4-Pro und Gemini 3.1 Pro schlagen und wo das Modell passt, wenn Sie bereits DeepSeek V4 oder Kimi K2.6 in der Produktion verwenden.

TL;DR: ERNIE 5.1 in einem Absatz

ERNIE 5.1 ist ein reines Text-MoE-Modell, das mit etwa 6 % der Pre-Training-Kosten vergleichbarer Spitzenmodelle trainiert wurde. Die Gesamtparameterzahl beträgt etwa ein Drittel von ERNIE 5.0, und die aktiven Parameter pro Forward-Pass etwa die Hälfte. Es erreicht 1.223 Punkte in der Arena Search-Bestenliste (4. weltweit, 1. in China), schlägt DeepSeek-V4-Pro bei den Agent-Benchmarks τ³-bench und SpreadsheetBench-Verified und erreicht 99,6 bei AIME26 mit Tool-Nutzung. Der Zugang ist über die ERNIE Chat-Oberfläche, den ERNIE 5.1 Playground von Baidu AI Studio und die Qianfan API verfügbar.

Warum diese Veröffentlichung wichtig ist

Drei Dinge stechen hervor, und keines davon ist „Baidu hat ein weiteres Modell veröffentlicht“.

1. Das Kosten-Leistungs-Verhältnis. Ein Pre-Training-Durchlauf zu ~6 % der Kosten vergleichbarer Modelle ist eine Zahl, die die Preiserwartungen in der gesamten Branche neu kalibriert. Wenn Baidu dies über Qianfan zu einem Bruchteil dessen anbieten kann, was geschlossene Spitzenmodelle verlangen, werden die API-Preise entsprechend folgen.

2. Das MoE-Design ist entlang dreier Achsen elastisch. Die meisten MoE-Modelle routen über die Breite (welche Experten feuern) und manchmal über die Tiefe (Schichtüberspringen). Baidu behauptet, ERNIE 5.1 routet gleichzeitig über Tiefe, Breite und Sparsity, wodurch sie das Modell verkleinern konnten, ohne die Bewertungen für die Agent-Tool-Nutzung zu verlieren. Dies liegt näher an der Designphilosophie von DeepSeek-V3.x als an einem herkömmlichen MoE im GShard-Stil.

3. Agentenfähigkeit ist die Schlagzeile, nicht eine Fußnote. ERNIE 5.0 wurde als Wissens- und Kreativschreibmodell positioniert. ERNIE 5.1 bewirbt explizit „Agentenfähigkeiten auf dem Niveau der weltweit besten Modelle“ und wird mit einem Baidu AI Studio Playground ausgeliefert, der für Demos zur Tool-Nutzung optimiert ist. Das ist eine strategische Verschiebung.

Die Benchmarks, im Vergleich

Hier ist, was Baidu veröffentlicht hat, abgebildet gegen die engsten öffentlichen Vergleichspunkte.

Benchmark ERNIE 5.1 Was es testet Nächster Konkurrent
Arena Search-Bestenliste 1.223 (4. global, 1. CN) Menschlich bewertete suchbewusste QA Gemini 3.1 Pro, GPT-5.x
τ³-bench Schlägt DeepSeek-V4-Pro Agenten-Tool-Nutzung, Multi-Turn DeepSeek-V4-Pro
SpreadsheetBench-Verified Schlägt DeepSeek-V4-Pro Praktische Tabellenkalkulationsaufgaben DeepSeek-V4-Pro
AIME26 (mit Tools) 99.6 Wettbewerbsmathematik mit Code-Interpreter GPT-5.x, Gemini 3.1 Pro
GPQA „Nähert sich führenden Closed-Source-Modellen an“ Wissenschaftliche QA auf Graduiertenniveau Claude Sonnet 4.6
MMLU-Pro „Nähert sich führenden Closed-Source-Modellen an“ Breites Wissen Alle Spitzenmodelle

Einige ehrliche Vorbehalte. Arena-Scores hängen von der Mischung der Prompts und dem Wählerpool ab, und chinesisch geprägte Prompts helfen hier wahrscheinlich. Der AIME26-Score mit Tools ist ebenfalls Tool-erweitert; eine reine Argumentations-AIME-Zahl wurde nicht bekannt gegeben. Kreatives Schreiben wird als „sich Gemini 3.1 Pro nähernd“ beschrieben, anstatt es zu erreichen.

Dennoch sind die Ergebnisse von τ³-bench und SpreadsheetBench diejenigen, auf die man achten sollte. Beide sind agentenbasiert, beide werden extern gepflegt und beide waren historisch schwer zu manipulieren.

Was wir über die Architektur wissen

Baidu gab weniger preis als DeepSeek für seine V3-Serien-Papiere, aber hier ist, was der Release-Beitrag und angrenzende Beiträge bestätigen:

Kontextlänge, genaue Parameterzahlen und das Trainings-Token-Budget wurden nicht bekannt gegeben. Wenn Sie zuvor mit chinesischen MoE-Modellen wie GLM 5.1 gearbeitet haben, erwarten Sie einen ähnlichen Entwicklerbereich.

Was Sie mit ERNIE 5.1 (noch) nicht tun können

Es ist erwähnenswert, damit Sie nicht darum herum entwerfen und später enttäuscht werden.

Wie ERNIE 5.1 im Vergleich zur chinesischen Spitze abschneidet

Wenn Sie bereits zwischen DeepSeek, Kimi, GLM und Qwen wählen, hier ist das schnelle Gedankenmodell.

Wählen Sie ERNIE 5.1, wenn Sie eine starke Agenten-Tool-Nutzung plus suchbasierte Antworten auf Chinesisch oder Englisch benötigen und die günstigste Preiskurve auf der chinesischen Cloud-Seite wünschen.

Wählen Sie DeepSeek V4, wenn Sie offene Gewichte, On-Premise-Bereitstellung oder die höchste reine Argumentationsleistung bei komplexen mathematischen Aufgaben ohne Tools benötigen.

Wählen Sie Kimi K2.6, wenn Sie lange Kontextfenster für dokumentenintensive Workflows benötigen.

Wählen Sie GLM 5.1, wenn Sie einen ausgewogenen Generalisten benötigen und Z.ai oder Zhipu bereits in Ihrem Stack haben.

Dies ist keine strenge Rangliste; es geht darum, welcher Kompromiss zu Ihrer Arbeitslast passt. Führen Sie Ihre eigenen Bewertungen mit einem 50-Prompt-Slice durch, bevor Sie sich festlegen.

Wo Sie ERNIE 5.1 heute ausprobieren können

Drei Wege, nach dem Grad des Aufwands:

  1. ernie.baidu.com: die Consumer-Chat-Oberfläche. Kostenlos, kein API-Schlüssel, China-Region. Am besten geeignet, um kreatives Schreiben und Argumentation auszuprobieren.
  2. Baidu AI Studio ERNIE 5.1 Playground: ein gehosteter Playground mit vorverdrahteten Tool-Calling-Demos. Gut für Agenten-Experimente, bevor Sie sich der API-Arbeit widmen.
  3. Qianfan API: der Entwickler-Endpunkt. OpenAI-kompatible Anforderungsform, Bearer-Token-Authentifizierung. Eine vollständige praktische Anleitung finden Sie in unserem begleitenden Beitrag So verwenden Sie die ERNIE 5.1 API.

Wenn Sie mehrere chinesische Modell-Anbieter parallel evaluieren, ist Apidog der sauberste Weg, die Schlüssel zu verwalten, Anforderungs-Bodies pro Anbieter zu speichern und Antworten nebeneinander zu vergleichen, ohne Wegwerf-Skripte schreiben zu müssen.

Preise und Einführung

Baidu gab bekannt, dass ERNIE 5.1 in den Wochen nach dem Start auf über 10 kreativen Produktionsplattformen ausgerollt wird. Öffentliche Pro-Token-Preise auf Qianfan wurden im Release-Beitrag nicht genannt; basierend auf der Behauptung der ~6 % Pre-Training-Kosten und Baidus historischer Qianfan-Preisliste, erwarten Sie Eingabepreise im gleichen Bereich wie ERNIE 4.5 Turbo oder niedriger. Überprüfen Sie immer die Live-Qianfan-Konsole, bevor Sie intern Zahlen nennen.

Wie Entwickler über ERNIE 5.1 denken sollten

Drei konkrete Empfehlungen, wenn Sie entscheiden, ob Sie es in Ihren Stack integrieren sollten.

1. Führen Sie es gegen Ihre eigene Agenten-Evaluierung aus, nicht gegen den öffentlichen Benchmark. τ³-bench ist ein gutes Signal, aber es ist nicht Ihre Arbeitslast. Erstellen Sie eine Evaluierung mit 20–50 Fällen, die Ihre realen Tool-Nutzungsmuster widerspiegelt, und vergleichen Sie dann ERNIE 5.1 mit Ihrem aktuellen Modell. LLMs als APIs testen zeigt einen Weg, dies mit Apidog zu tun.

2. Betrachten Sie das Modell als eine Wette auf die chinesische Cloud. Qianfan wird in China gehostet. Wenn Ihre Datenresidenzregeln sagen „keine PRC-Infrastruktur“, ist dies ungeachtet der Benchmarks ein No-Go.

3. Achten Sie auf die Preisankündigung. Die Behauptung der ~6 % Pre-Training-Kosten ist die interessanteste Zahl in der Veröffentlichung. Wenn Baidu dies an die API weitergibt, sinkt der gesamte Preisuntergrenze für chinesische Modelle, was DeepSeek, Zhipu und Moonshot dazu zwingt, zu reagieren.

Häufig gestellte Fragen

Ist ERNIE 5.1 Open-Source? Nein. ERNIE 5.1 ist ein reines Cloud-Modell, das über Baidus Chat-Oberfläche, Baidu AI Studio und die Qianfan API zugänglich ist. Zum Zeitpunkt des Schreibens gibt es keine öffentlichen Gewichte auf HuggingFace.

Unterstützt ERNIE 5.1 Bild- oder Vision-Eingabe? Nein. ERNIE 5.1 ist zum Start nur textbasiert. Baidus ERNIE-VL-Familie übernimmt Vision-Aufgaben. Wenn Sie ein einzelnes multimodales chinesisches Modell benötigen, schauen Sie sich stattdessen Qwen 3.5 Omni an.

Was ist die Kontextlänge? Baidu hat im Release-Beitrag keine spezifische Kontextfenster-Zahl veröffentlicht. Bis dies bestätigt wird, gestalten Sie Workflows mit langen Dokumenten defensiv und teilen Sie Eingaben in Chunks auf.

Kann ich ERNIE 5.1 außerhalb Chinas verwenden? Die Chat-Oberfläche und die Qianfan API sind von den meisten Regionen aus zugänglich, aber Latenz und Kontoverifizierung unterscheiden sich. Einige Unternehmensfunktionen erfordern weiterhin eine Festland-Telefonnummer oder Geschäftslizenz. Der begleitende Leitfaden So verwenden Sie die ERNIE 5.1 API behandelt den Zugriffsprozess im Detail.

Ist ERNIE 5.1 besser als DeepSeek-V4-Pro? Bei τ³-bench und SpreadsheetBench-Verified sagt Baidu ja. Beim Zugang zu offenen Gewichten, nein. Bei reinen mathematischen Argumentations-Benchmarks ohne Tool-Nutzung geben die öffentlichen Zahlen keine klare Antwort. Die ehrliche Position: Sie zielen auf leicht unterschiedliche Bereitstellungsmodelle ab.

Bereit, mit der Entwicklung zu beginnen? Laden Sie Apidog herunter und importieren Sie die Qianfan OpenAPI-Spezifikation, um ERNIE 5.1 zusammen mit Ihrem aktuellen Modell in einem Arbeitsbereich zu testen.

Schaltfläche

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen