Cara Menggunakan API ERNIE 5.1

Ashley Innocent

Ashley Innocent

14 May 2026

Cara Menggunakan API ERNIE 5.1

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

ERNIE 5.1 dirilis pada 9 Mei 2026, dan dalam seminggu API Qianfan sudah tersedia untuknya. Jika Anda ingin memanggil model dari kode Anda sendiri, mengarahkan panggilan alat melaluinya, atau mengintegrasikannya ke dalam loop agen dengan Apidog, panduan ini akan membahas langkah-langkah lengkapnya: akun, kunci, isi permintaan, streaming, penggunaan alat, penanganan kesalahan.

Kami akan menjaganya tetap praktis. Pada akhirnya, Anda akan memiliki cuplikan curl, Python, dan Node yang berfungsi, ditambah koleksi permintaan yang dapat Anda masukkan ke Apidog.

Jika Anda belum membaca rincian peluncuran ERNIE 5.1, bacalah sekilas terlebih dahulu; ini mencakup tolok ukur dan kompromi dibandingkan DeepSeek V4 dan Kimi K2.6. Postingan ini adalah pendamping implementasinya.

Langkah 1: Dapatkan kunci API Qianfan

ERNIE 5.1 disajikan melalui platform Qianfan dari Baidu Intelligent Cloud. Tidak ada "API ERNIE" terpisah; semuanya dialihkan melalui Qianfan.

  1. Buka cloud.baidu.com dan buat atau masuk ke akun Baidu Intelligent Cloud. Pengembang internasional dapat menggunakan pendaftaran email; beberapa fitur perusahaan masih memerlukan nomor telepon daratan Tiongkok.
  2. Buka konsol Qianfan di console.bce.baidu.com/qianfan.
  3. Di bawah Manajemen Kunci API (API Key 管理), klik Buat Kunci API. Pilih ruang kerja dan berikan akses ke layanan chat-completions.
  4. Salin kuncinya. Bentuknya seperti bce-v3/ALTAK-xxxx/xxxx. Simpan dalam variabel lingkungan, bukan di kode sumber.
export QIANFAN_API_KEY="bce-v3/ALTAK-xxxx/xxxx"

Dua hal yang perlu diketahui di awal. Pertama, titik akhir v2 yang baru menggunakan satu token Bearer; alur OAuth access_token v1 yang lebih lama sedang dihentikan dan Anda tidak boleh membangun kode baru di atasnya. Kedua, ERNIE 5.1 adalah model berbayar sejak hari pertama. Isi ulang saldo kecil (¥10 cukup untuk pengujian) sebelum permintaan pertama Anda.

Langkah 2: Akses titik akhir yang kompatibel dengan OpenAI menggunakan curl

Qianfan menyediakan titik akhir chat-completions yang kompatibel dengan OpenAI, jadi apa pun di tumpukan Anda yang sudah memahami format OpenAI akan berfungsi dengan pertukaran URL dasar dan perubahan ID model.

URL Dasar: https://qianfan.baidubce.com/v2 ID Model: ernie-5.1 (juga: ernie-5.1-preview untuk fitur akses awal)

Permintaan minimal yang berfungsi:

curl https://qianfan.baidubce.com/v2/chat/completions \
  -H "Authorization: Bearer $QIANFAN_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "ernie-5.1",
    "messages": [
      {"role": "system", "content": "You are a senior API designer."},
      {"role": "user", "content": "Sketch a REST schema for a GitHub-style PR review API. Be concise."}
    ],
    "temperature": 0.3
  }'

Anda akan mendapatkan kembali respons berbentuk OpenAI standar:

{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "created": 1746780000,
  "model": "ernie-5.1",
  "choices": [
    {
      "index": 0,
      "message": { "role": "assistant", "content": "..." },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 42,
    "completion_tokens": 318,
    "total_tokens": 360
  }
}

Jika Anda melihat 401 Unauthorized, kunci Anda salah atau kedaluwarsa. Jika Anda melihat 403, kuncinya valid tetapi model tidak diaktifkan di ruang kerja ini; kembali ke konsol dan tambahkan ERNIE 5.1 ke model yang diizinkan di ruang kerja tersebut.

Langkah 3: Panggil ERNIE 5.1 dari Python

Karena titik akhirnya kompatibel dengan OpenAI, SDK Python openai resmi berfungsi apa adanya. Arahkan ke Qianfan.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["QIANFAN_API_KEY"],
    base_url="https://qianfan.baidubce.com/v2",
)

response = client.chat.completions.create(
    model="ernie-5.1",
    messages=[
        {"role": "system", "content": "You explain APIs in plain English."},
        {"role": "user", "content": "Why would I use server-sent events over WebSockets for a chat UI?"},
    ],
    temperature=0.4,
)

print(response.choices[0].message.content)
print(f"\nTokens used: {response.usage.total_tokens}")

Jika Anda sudah memiliki pembungkus di sekitar SDK OpenAI di basis kode Anda, menukar ERNIE 5.1 untuk pengujian A/B adalah perubahan satu baris. Trik yang sama berfungsi untuk API DeepSeek dan sebagian besar penyedia model Tiongkok lainnya.

Langkah 4: Streaming token untuk UI gaya obrolan

Untuk obrolan yang menghadap pengguna, Anda menginginkan streaming. Atur stream: true dan konsumsi peristiwa yang dikirim server.

stream = client.chat.completions.create(
    model="ernie-5.1",
    messages=[{"role": "user", "content": "Write a haiku about API versioning."}],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Setara dengan Curl untuk debugging:

curl https://qianfan.baidubce.com/v2/chat/completions \
  -H "Authorization: Bearer $QIANFAN_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "ernie-5.1",
    "stream": true,
    "messages": [{"role": "user", "content": "Stream a 3-sentence joke."}]
  }' \
  --no-buffer

Format stream identik dengan OpenAI: baris data: {...} diakhiri dengan data: [DONE].

Langkah 5: Gunakan ERNIE 5.1 dengan alat (bagian agentic)

Di sinilah ERNIE 5.1 mendapatkan sorotan peluncurannya. Model ini mencetak skor di atas DeepSeek-V4-Pro pada τ³-bench dan SpreadsheetBench-Verified, yang berarti pemanggilan alat berfungsi dalam produksi, tidak hanya dalam demo.

Skema yang sama dengan pemanggilan fungsi OpenAI:

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "Get current weather for a city.",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "City name, e.g. Singapore"},
                    "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
                },
                "required": ["city"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="ernie-5.1",
    messages=[{"role": "user", "content": "What's the weather in Tokyo right now?"}],
    tools=tools,
    tool_choice="auto",
)

tool_calls = response.choices[0].message.tool_calls
if tool_calls:
    call = tool_calls[0]
    print(f"Model wants to call: {call.function.name}({call.function.arguments})")

Setelah kode Anda menjalankan alat yang sebenarnya, tambahkan hasilnya sebagai pesan peran tool dan panggil lagi. Loop akan berhenti ketika finish_reason == "stop" dan tool_calls kosong.

Satu hal yang perlu diperhatikan: ERNIE 5.1 kadang-kadang mengembalikan argumen alat sebagai JSON yang diubah menjadi string di dalam blok kode, bukan sebagai string JSON yang bersih. Parse secara defensif dengan json.loads() yang dibungkus dalam try/except, dan jika gagal, hapus pembatas ```json sebelum mencoba lagi.

Langkah 6: Panggil ERNIE 5.1 dari Node.js

Integrasi langsung untuk proyek Node apa pun yang menggunakan openai v5+:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QIANFAN_API_KEY,
  baseURL: "https://qianfan.baidubce.com/v2",
});

const completion = await client.chat.completions.create({
  model: "ernie-5.1",
  messages: [
    { role: "user", content: "Return a JSON object with 3 API design tips." },
  ],
  response_format: { type: "json_object" },
});

console.log(completion.choices[0].message.content);

response_format: { type: "json_object" } berfungsi dan dapat diandalkan. Skema JSON yang ketat (json_schema) masih diluncurkan di Qianfan; verifikasi bentuk respons dalam kode daripada memercayai kendala tersebut.

Langkah 7: Uji dan bandingkan dengan Apidog

Jika Anda memutuskan antara ERNIE 5.1, DeepSeek V4, dan Kimi K2.6, jangan lakukan dari terminal. Gunakan Apidog untuk membangun satu ruang kerja dengan satu folder per penyedia, isi permintaan yang identik, dan lingkungan tersimpan per kunci API.

Pengaturan 60 detik:

  1. Buka Apidog dan buat proyek baru bernama “LLM bake-off.”

Tambahkan lingkungan dengan QIANFAN_API_KEY, DEEPSEEK_API_KEY, MOONSHOT_API_KEY sebagai variabel.

Buat tiga permintaan yang mengarah ke URL dasar setiap penyedia dengan model diatur ke ernie-5.1, deepseek-chat, dan kimi-k2-6 secara berurutan.

Sematkan array messages yang sama pada ketiganya. Gunakan fitur "Jalankan" Apidog untuk menjalankannya secara paralel dan membandingkan keluarannya.

Tier gratis menangani ini dengan nyaman. Apidog menyimpan riwayat permintaan per lingkungan, sehingga Anda dapat kembali minggu depan dan menjalankan ulang evaluasi yang sama persis terhadap versi model baru. Mengalahkan keharusan mengawasi curl di panel tmux.

Untuk lebih lanjut tentang pengujian multi-penyedia, lihat Uji LLM lokal sebagai API dan panduan API GLM 5.1 kami.

Harga, batas kecepatan, dan kuota

Harga Qianfan publik untuk ERNIE 5.1 tidak ada dalam postingan rilis; periksa kartu tarif konsol langsung sebelum mengutip angka secara internal. Tiga tips praktis selagi menunggu:

Penanganan kesalahan yang akan menyelamatkan Anda

Kesalahan yang akan Anda temui dalam praktiknya, secara kasar berdasarkan frekuensi:

Status Arti Perbaikan
401 Token Bearer salah atau kedaluwarsa Buat ulang dari konsol
403 Model tidak diaktifkan di ruang kerja ini Tambahkan ERNIE 5.1 di konsol
429 Batas kecepatan tercapai Backoff + coba lagi dengan jitter
400 (invalid messages) Urutan peran pesan salah Pastikan pergantian pengguna/asisten
500/502 Kesalahan sisi Qianfan Coba lagi sekali; jika terus berlanjut, periksa halaman status

Bungkus setiap panggilan dengan coba ulang dengan exponential-backoff yang dibatasi hingga 3 percobaan. Untuk produksi, catat request_id dari header respons; dukungan Baidu membutuhkannya untuk men-debug kasus Anda.

Pembungkus minimal berbentuk produksi

Jika Anda ingin memasukkan ERNIE 5.1 ke dalam aplikasi nyata hari ini, berikut adalah pembungkus terkecil yang tidak memalukan:

import os, time, random, json
from openai import OpenAI, RateLimitError, APIError

client = OpenAI(
    api_key=os.environ["QIANFAN_API_KEY"],
    base_url="https://qianfan.baidubce.com/v2",
)

def chat(messages, *, model="ernie-5.1", temperature=0.3, max_retries=3):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(
                model=model,
                messages=messages,
                temperature=temperature,
            )
        except RateLimitError:
            time.sleep((2 ** attempt) + random.random())
        except APIError as e:
            if e.status_code and e.status_code >= 500 and attempt < max_retries - 1:
                time.sleep(1 + attempt)
                continue
            raise
    raise RuntimeError("ERNIE 5.1 retries exhausted")

Itu menangani 80% kasus. Untuk tool-loops dan streaming, bangun di atasnya.

Pertanyaan yang sering diajukan

Apakah API ERNIE 5.1 gratis? Tidak. Qianfan adalah layanan bayar sesuai penggunaan. Tidak ada tier gratis permanen; akun baru terkadang mendapatkan kredit percobaan. Untuk eksperimen gratis, gunakan UI obrolan ernie.baidu.com atau lihat opsi LLM gratis.

Bisakah saya menjalankan ERNIE 5.1 secara lokal? Tidak. Tidak ada bobot publik. Jika persyaratan lokal adalah mutlak, lihat cara menjalankan DeepSeek V4 secara lokal atau LLM lokal terbaik di tahun 2026 sebagai gantinya.

Apakah OpenAI SDK berfungsi tanpa perubahan? Ya, dengan base_url diatur ke https://qianfan.baidubce.com/v2 dan api_key diatur ke kunci Qianfan Anda. Bidang model mengambil ID model Qianfan, bukan ID OpenAI. Pemanggilan fungsi, streaming, dan response_format: json_object semuanya berfungsi. Validasi json_schema yang ketat masih dalam proses peluncuran.

Bagaimana ERNIE 5.1 menangani prompt Bahasa Mandarin vs Bahasa Inggris? Keduanya adalah kelas satu. Skor Arena Search sebesar 1.223 berasal dari kumpulan pemilih multibahasa. Untuk tugas teknis Bahasa Inggris (kode, desain API), ia kompetitif dengan batas tertutup; untuk penulisan kreatif Bahasa Mandarin, ia adalah yang terbaik di antara model-model Tiongkok.

Berapa panjang output maksimum? Tidak dipublikasikan secara resmi. Dalam praktiknya, respons satu giliran dibatasi sekitar 8K token sebelum model selesai. Untuk pembuatan bentuk panjang, pecah dan lanjutkan.

Membangun agen di ERNIE 5.1? Unduh Apidog dan gunakan koleksi permintaan yang kompatibel dengan OpenAI untuk mem-mock, menguji, dan mendokumentasikan titik akhir Qianfan bersama dengan layanan Anda yang lain.

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.

Cara Menggunakan API ERNIE 5.1