Baidu merilis ERNIE 5.1 pada 9 Mei 2026, dan angka utama sulit diabaikan: sebuah model Mixture-of-Experts dengan sekitar sepertiga dari total parameter ERNIE 5.0 yang berhasil menduduki posisi ke-4 secara global di papan peringkat Arena Search dan pertama di antara model Tiongkok dengan skor 1.223.
Ini adalah versi pertama dari keluarga ERNIE di mana Baidu secara terbuka bersaing dalam penggunaan alat agensi, penulisan kreatif bentuk panjang, dan penalaran melawan Gemini 3.1 Pro dan DeepSeek-V4-Pro, tidak lagi hanya pada tugas-tugas berbahasa Mandarin. Jika Anda membangun dengan Apidog dan Anda telah menunggu model perbatasan Tiongkok yang dapat Anda masukkan ke dalam tumpukan agen tanpa jejak 70B-parameter, rilis ini patut dicermati.
Panduan ini menguraikan apa itu ERNIE 5.1, apa yang berubah di balik layar, bagaimana tolok ukur dibandingkan dengan DeepSeek-V4-Pro dan Gemini 3.1 Pro, dan di mana model ini cocok jika Anda sudah menggunakan DeepSeek V4 atau Kimi K2.6 dalam produksi.
TL;DR: ERNIE 5.1 dalam satu paragraf
ERNIE 5.1 adalah model MoE khusus teks yang dilatih dengan biaya pra-pelatihan sekitar 6% dari model perbatasan sebanding. Total parameter sekitar sepertiga dari ERNIE 5.0, dan parameter aktif per lintasan maju sekitar setengahnya. Model ini meraih skor 1.223 di papan peringkat Arena Search (ke-4 global, ke-1 di Tiongkok), mengalahkan DeepSeek-V4-Pro pada tolok ukur agensi τ³-bench dan SpreadsheetBench-Verified, serta mencapai 99,6 pada AIME26 dengan penggunaan alat. Akses tersedia melalui UI obrolan ERNIE, ERNIE 5.1 Playground Baidu AI Studio, dan API Qianfan.

Mengapa rilis ini penting
Tiga hal menonjol, dan tidak satu pun di antaranya adalah "Baidu merilis model lain."
1. Rasio biaya-kualitas. Sebuah proses pra-pelatihan dengan biaya sekitar 6% dari model sebanding adalah angka yang mengubah ekspektasi harga di seluruh industri. Jika Baidu dapat melayani ini melalui Qianfan dengan harga yang jauh lebih rendah dari model tertutup terkemuka, harga API hilir akan mengikutinya.
2. Desain MoE elastis pada tiga sumbu. Sebagian besar model MoE mengarahkan lintas lebar (pakar mana yang aktif) dan terkadang kedalaman (melewatkan lapisan). Baidu mengklaim ERNIE 5.1 mengarahkan lintas kedalaman, lebar, dan sparsity sekaligus, itulah cara mereka mengecilkan model tanpa kehilangan skor penggunaan alat agensi. Ini lebih dekat dengan filosofi desain di DeepSeek-V3.x daripada MoE gaya GShard standar.
3. Kemampuan agensi adalah inti berita, bukan catatan kaki. ERNIE 5.0 diposisikan sebagai model pengetahuan dan penulisan kreatif. ERNIE 5.1 secara eksplisit memasarkan "kemampuan agensi setara dengan model top dunia" dan dilengkapi dengan playground Baidu AI Studio yang disetel untuk demo panggilan alat. Itu adalah perubahan strategis.

Tolok ukur, berdampingan
Berikut adalah apa yang Baidu publikasikan, dipetakan terhadap titik perbandingan publik terdekat.
| Tolok Ukur | ERNIE 5.1 | Apa yang diuji | Pesaing terdekat |
|---|---|---|---|
| Papan Peringkat Arena Search | 1.223 (ke-4 global, ke-1 Tiongkok) | QA sadar pencarian yang dinilai manusia | Gemini 3.1 Pro, GPT-5.x |
| τ³-bench | Mengalahkan DeepSeek-V4-Pro | Penggunaan alat agensi, multi-giliran | DeepSeek-V4-Pro |
| SpreadsheetBench-Verified | Mengalahkan DeepSeek-V4-Pro | Tugas spreadsheet dunia nyata | DeepSeek-V4-Pro |
| AIME26 (dengan alat) | 99.6 | Matematika kompetisi dengan juru bahasa kode | GPT-5.x, Gemini 3.1 Pro |
| GPQA | "Mendekati sumber tertutup terkemuka" | QA sains tingkat pascasarjana | Claude Sonnet 4.6 |
| MMLU-Pro | "Mendekati sumber tertutup terkemuka" | Pengetahuan luas | Semua model perbatasan |
Beberapa peringatan jujur. Skor Arena tergantung pada campuran perintah dan kelompok pemilih, dan perintah yang condong ke bahasa Mandarin kemungkinan membantu di sini. Skor AIME26-dengan-alat juga diperkaya alat; angka AIME murni penalaran tidak diungkapkan. Penulisan kreatif digambarkan sebagai "mendekati Gemini 3.1 Pro" daripada menyamai.
Meskipun demikian, hasil τ³-bench dan SpreadsheetBench adalah yang harus diperhatikan. Keduanya bersifat agensi, keduanya dipelihara secara eksternal, dan keduanya secara historis sulit dimanipulasi.
Apa yang kita ketahui tentang arsitektur
Baidu mengungkapkan lebih sedikit daripada DeepSeek untuk makalah seri V3-nya, tetapi inilah yang dikonfirmasi oleh pos rilis dan pos terkait:
- Total parameter: sekitar sepertiga dari ERNIE 5.0
- Parameter aktif per token: sekitar setengah dari ERNIE 5.0
- Routing: elastis pada kedalaman, lebar, dan sparsity (MoE tiga sumbu)
- Biaya pra-pelatihan: ~6% dari "model sebanding"
- Modalitas: khusus teks saat peluncuran (tanpa visi, tanpa audio)
- Bahasa: Versi Mandarin dan Inggris tersedia
Panjang konteks, jumlah parameter yang tepat, dan anggaran token pelatihan tidak diungkapkan. Jika Anda pernah membangun dengan model MoE Tiongkok seperti GLM 5.1 sebelumnya, harapkan area permukaan pengembang yang serupa.

Apa yang belum bisa Anda lakukan dengan ERNIE 5.1 (untuk saat ini)
Perlu disebutkan agar Anda tidak mendesain berdasarkan itu dan kemudian kecewa.
- Tidak ada input gambar. ERNIE 5.1 hanya berupa teks. Untuk alur kerja multimodal Baidu, Anda masih memerlukan ERNIE-VL atau model visi eksternal.
- Tidak ada input atau output audio. Tidak ada ucapan asli, tidak ada suara waktu nyata.
- Tidak ada jendela konteks yang dipublikasikan. Sampai Baidu mengkonfirmasi angkanya, perlakukan kasus penggunaan dokumen panjang dengan hati-hati.
- Tidak ada bobot HuggingFace. Ini adalah model yang dihosting saja. Jika lokasi penting, Anda mencari DeepSeek V4 secara lokal atau LLM lokal sebagai gantinya.
Bagaimana ERNIE 5.1 dibandingkan dengan model perbatasan Tiongkok
Jika Anda sudah memilih antara DeepSeek, Kimi, GLM, dan Qwen, berikut adalah model mental cepatnya.
Pilih ERNIE 5.1 ketika Anda membutuhkan penggunaan alat agen yang kuat ditambah jawaban yang diperkuat pencarian dalam bahasa Mandarin atau Inggris, dan Anda menginginkan kurva harga termurah di sisi cloud Tiongkok.
Pilih DeepSeek V4 ketika Anda membutuhkan bobot terbuka, penyebaran di tempat, atau skor penalaran murni terkuat pada matematika sulit tanpa alat.
Pilih Kimi K2.6 ketika Anda membutuhkan jendela konteks panjang untuk alur kerja yang banyak dokumen.
Pilih GLM 5.1 ketika Anda membutuhkan generalis yang seimbang dan Anda sudah memiliki Z.ai atau Zhipu dalam tumpukan Anda.
Ini bukan peringkat ketat; ini tentang pertukaran mana yang cocok dengan beban kerja Anda. Jalankan evaluasi Anda sendiri pada 50 perintah sebelum berkomitmen.
Di mana mencoba ERNIE 5.1 hari ini
Tiga jalur, dalam urutan gesekan:
- ernie.baidu.com: UI obrolan konsumen. Gratis, tanpa kunci API, wilayah Tiongkok. Terbaik untuk mencoba penulisan kreatif dan penalaran.
- Baidu AI Studio ERNIE 5.1 Playground: playground yang dihosting dengan demo panggilan alat yang sudah terhubung. Baik untuk eksperimen agensi sebelum Anda berkomitmen pada pekerjaan API.
- Qianfan API: titik akhir pengembang. Bentuk permintaan yang kompatibel dengan OpenAI, otentikasi token Bearer. Panduan langkah demi langkah lengkap ada di postingan pendamping kami Cara menggunakan API ERNIE 5.1.
Jika Anda mengevaluasi beberapa penyedia model Tiongkok secara paralel, Apidog adalah cara paling bersih untuk mengelola kunci, menyimpan badan permintaan per penyedia, dan membandingkan respons secara berdampingan tanpa menulis skrip sekali pakai.
Harga dan peluncuran
Baidu mengumumkan bahwa ERNIE 5.1 akan diluncurkan di 10+ platform produksi kreatif dalam beberapa minggu setelah peluncuran. Harga per token publik di Qianfan tidak ada di postingan rilis; berdasarkan klaim biaya pra-pelatihan ~6% dan lembar tarif Qianfan historis Baidu, perkirakan harga input dalam kisaran yang sama dengan ERNIE 4.5 Turbo atau lebih rendah. Selalu periksa konsol Qianfan langsung sebelum mengutip angka secara internal.
Bagaimana pengembang harus memikirkan ERNIE 5.1
Tiga rekomendasi konkret jika Anda memutuskan apakah akan memasangnya ke dalam tumpukan Anda.
1. Jalankan terhadap evaluasi agensi Anda sendiri, bukan tolok ukur publik. τ³-bench adalah sinyal yang baik tetapi itu bukan beban kerja Anda. Bangun evaluasi 20–50 kasus yang mencerminkan pola penggunaan alat Anda yang sebenarnya, lalu bandingkan ERNIE 5.1 dengan model Anda saat ini. Uji LLM sebagai API menjelaskan satu cara untuk melakukan ini dengan Apidog.
2. Perlakukan model sebagai taruhan cloud Tiongkok. Qianfan dihosting di Tiongkok. Jika aturan kedaulatan data Anda mengatakan "tidak ada infrastruktur RRT," ini adalah non-starter terlepas dari tolok ukur.
3. Perhatikan pengumuman harga. Klaim biaya pra-pelatihan ~6% adalah angka paling menarik dalam rilis ini. Jika Baidu meneruskannya ke API, seluruh dasar harga model Tiongkok akan turun, yang memaksa DeepSeek, Zhipu, dan Moonshot untuk merespons.
Pertanyaan yang sering diajukan
Apakah ERNIE 5.1 sumber terbuka? Tidak. ERNIE 5.1 adalah model yang dihosting saja yang dapat diakses melalui UI obrolan Baidu, Baidu AI Studio, dan API Qianfan. Tidak ada bobot publik di HuggingFace saat ini.
Apakah ERNIE 5.1 mendukung input gambar atau visi? Tidak. ERNIE 5.1 hanya berupa teks saat peluncuran. Keluarga ERNIE-VL Baidu menangani tugas visi. Jika Anda membutuhkan satu model multimodal Tiongkok, lihat Qwen 3.5 Omni sebagai gantinya.
Berapa panjang konteksnya? Baidu tidak mempublikasikan angka jendela konteks spesifik dalam postingan rilis. Sampai mereka mengkonfirmasinya, rancang alur kerja dokumen panjang secara defensif dan potong input.
Dapatkah saya menggunakan ERNIE 5.1 dari luar Tiongkok? UI obrolan dan API Qianfan dapat diakses dari sebagian besar wilayah, tetapi latensi dan verifikasi akun berbeda. Beberapa fitur perusahaan masih memerlukan nomor telepon atau izin usaha daratan. Panduan pendamping Cara menggunakan API ERNIE 5.1 membahas alur akses secara detail.
Apakah ERNIE 5.1 lebih baik dari DeepSeek-V4-Pro? Pada τ³-bench dan SpreadsheetBench-Verified, Baidu mengatakan ya. Pada akses bobot terbuka, tidak. Pada tolok ukur matematika penalaran murni tanpa penggunaan alat, angka publik tidak memberikan jawaban yang jelas. Posisi jujurnya: mereka menargetkan model penyebaran yang sedikit berbeda.
Siap untuk mulai membangun? Unduh Apidog dan impor spesifikasi Qianfan OpenAPI untuk menguji ERNIE 5.1 bersama model Anda saat ini dalam satu ruang kerja.
