Cara Menggunakan API Grok 4.3

Ashley Innocent

Ashley Innocent

8 May 2026

Cara Menggunakan API Grok 4.3

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

xAI meluncurkan Grok 4.3 secara bertahap: beta pada 17 April 2026, akses API pada 30 April, dan ketersediaan umum penuh pada 6 Mei. Penawaran ini langsung: jendela konteks 1.000.000 token, input video asli untuk pertama kalinya pada seri Grok, penalaran selalu aktif, dan penurunan harga sekitar 40% dibandingkan Grok 4.20. Delapan model Grok lama akan dihentikan pada 15 Mei, jadi siapa pun yang berjalan pada seri grok-3 atau grok-4 harus merencanakan migrasi minggu ini.

Panduan ini mencakup cara memanggil Grok 4.3 dari kode Anda: bentuk endpoint, otentikasi, URL dasar yang kompatibel dengan OpenAI, parameter upaya penalaran, input video, pemanggilan fungsi, dan pengaturan uji coba yang berfungsi di Apidog.

Untuk sisi suara dari rilis yang sama, lihat Cara menggunakan Grok Voice secara gratis. Untuk perbandingan langsung dengan model suara unggulan OpenAI, lihat Grok Voice vs GPT-Realtime.

tombol

TL;DR

Apa yang berubah di Grok 4.3

Peningkatan utama, berdasarkan urutan dampaknya bagi sebagian besar tim:

Indeks Intelijen 53 (Artificial Analysis) menempatkan Grok 4.3 di atas rata-rata 35 untuk tingkat harganya, dan kesepuluh dari 146 model yang dilacak.

Prasyarat

Sebelum permintaan pertama, siapkan empat hal:

Ekspor kunci sekali:

export XAI_API_KEY="xai-..."

Endpoint dan otentikasi

Grok 4.3 dikirimkan pada antarmuka Chat Completions yang kompatibel dengan OpenAI, dengan URL dasar xAI.

POST https://api.x.ai/v1/chat/completions

Otentikasi menggunakan bearer token. Header-nya standar:

Authorization: Bearer $XAI_API_KEY
Content-Type: application/json

Kompatibilitas OpenAI berarti Anda dapat menggunakan SDK Python atau Node OpenAI dan mengubah `base_url`. Itu adalah jalur termudah bagi sebagian besar tim yang bermigrasi dari gpt-4 atau gpt-5.

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XAI_API_KEY"],
    base_url="https://api.x.ai/v1",
)

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
    ],
    reasoning_effort="medium",
)

print(response.choices[0].message.content)

Jika Anda lebih memilih SDK xAI, bentuk panggilannya sama; satu-satunya perubahan adalah impornya.

Parameter permintaan

Peta parameter lengkap untuk Grok 4.3:

Parameter Tipe Nilai Catatan
model string grok-4.3 Wajib.
messages array Bentuk pesan OpenAI Wajib. Mendukung role: system / user / assistant.
reasoning_effort string low, medium, high Opsional. Default: medium. Tingkat yang lebih tinggi meningkatkan latensi dan token output.
max_tokens int 1–32768 Membatasi output.
temperature float 0.0–2.0 Default 1.0.
top_p float 0.0–1.0 Sampling nukleus.
stream bool true / false Event yang dikirim server jika true.
tools array Bentuk alat OpenAI Pemanggilan fungsi.
tool_choice string / object auto, none, atau alat spesifik Semantik OpenAI standar.
response_format object { type: "json_object" } Output terstruktur.
seed int apa pun Untuk reproduktifitas pada temperature: 0.

Permintaan `curl` yang berfungsi:

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.3",
    "messages": [
      {"role": "system", "content": "You are a senior backend engineer."},
      {"role": "user", "content": "Review this query plan and flag the bottleneck."}
    ],
    "reasoning_effort": "high"
  }'

Responsnya memiliki bentuk standar OpenAI: `choices[].message.content`, ditambah objek `usage` dengan `prompt_tokens`, `completion_tokens`, `reasoning_tokens`, dan `total_tokens` yang dipisahkan.

Upaya penalaran

Tiga tingkatan, dengan panduan konkret:

Penalaran selalu aktif berarti bahkan `rendah` pun melakukan beberapa pemikiran; itulah yang mendorong peningkatan akurasi faktual dibandingkan Grok 4.20. Jangan berharap menghemat uang dengan menghindari penalaran sama sekali; itu sudah termasuk.

Pemanggilan fungsi

Bentuk OpenAI standar berfungsi langsung. Deklarasikan alat, model mengeluarkan array `tool_calls` pada pesan asisten, Anda mengeksekusi, Anda membalas dengan pesan peran `tool`:

tools = [{
    "type": "function",
    "function": {
        "name": "lookup_user",
        "description": "Look up a user by ID.",
        "parameters": {
            "type": "object",
            "properties": {"user_id": {"type": "string"}},
            "required": ["user_id"],
        },
    },
}]

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
    tools=tools,
    reasoning_effort="medium",
)

tool_calls = response.choices[0].message.tool_calls

Peningkatan 300 Elo pada GDPval-AA terlihat di sini dalam praktik; Grok 4.3 memilih alat yang lebih baik, lebih sedikit panggilan yang berlebihan, dan pulih dari kesalahan alat tanpa berputar. Jika Anda menguji alur alat, pengujian server MCP di Apidog mencakup pengaturan pemutaran ulang yang kami gunakan secara internal.

Input video

Grok 4.3 adalah model Grok pertama dengan input video asli. Berikan URL video di dalam blok konten:

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
            {"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
        ],
    }],
)

Token video dihitung terhadap meteran input. Klip panjang menghabiskan konteks dengan cepat; ambil sampel yang lebih rendah atau pangkas sebelum Anda mengirim jika biaya menjadi perhatian. Model melakukan penalaran pada setiap frame secara native, jadi Anda tidak perlu mengekstrak keyframe secara manual.

Konteks 1 juta token

Jendela konteks 1 juta adalah alat produksi nyata, bukan trofi tolok ukur. Pola umum:

Input cache seharga $0,20/1 juta membuatnya terjangkau. Prompt sistem 400 ribu token yang Anda jaga tetap stabil menghabiskan $0,08 per panggilan cache daripada $0,50 yang baru.

Migrasi dari model Grok lama

Delapan model Grok lama akan dihentikan pada **15 Mei 2026, pukul 12:00 PM PT**. Jika Anda menggunakan salah satu di antaranya, tukar string `model` menjadi `grok-4.3` sebelum batas waktu. Sebagian besar panggilan akan berfungsi tanpa perubahan lebih lanjut karena bentuk permintaannya tidak berubah.

Dua hal yang perlu diperhatikan:

Untuk perbandingan harga lengkap di seluruh lini OpenAI, lihat Harga GPT-5.5; untuk model penalaran head-to-head, lihat Cara menggunakan API GPT-5.5.

Pengujian di Apidog

Cara tercepat untuk memvalidasi Grok 4.3 terhadap kasus penggunaan Anda sendiri:

  1. Buat lingkungan Apidog dengan `XAI_API_KEY` dan `BASE_URL = https://api.x.ai/v1`.
  2. Simpan koleksi permintaan dengan tiga varian: penalaran `rendah`, `sedang`, `tinggi`. Prompt yang sama, upaya yang berbeda.
  3. Jalankan ketiganya. Bandingkan respons, latensi, dan jumlah `usage.reasoning_tokens` secara berdampingan.
  4. Tambahkan varian keempat yang menunjuk ke URL dasar OpenAI untuk membandingkan Grok 4.3 dengan GPT-5.5 pada input yang identik. SDK yang sama, model dan URL dasar yang berbeda.

Unduh Apidog untuk menjalankan perbandingan. Koleksi ini dapat dipindahkan dengan bersih saat Anda mengganti penyedia, itulah intinya. Untuk strategi pengujian API yang lebih luas, lihat Alat pengujian API untuk insinyur QA.

Batas kecepatan

Batas tingkat pada xAI Console berkisar dari beberapa ribu permintaan per menit pada Tingkat 1 hingga ratusan ribu pada tingkat perusahaan. Angka konkret dapat berubah; periksa dasbor konsol. Throughput 159 token/detik yang diiklankan xAI adalah kecepatan output per-stream, bukan agregat; permintaan bersamaan berskala linier dalam batas tingkat.

Jika Anda mencapai batas kecepatan, API akan mengembalikan 429 dengan header `retry-after`. Backoff eksponensial standar akan menanganinya.

FAQ

**Apakah Grok 4.3 sepenuhnya kompatibel dengan OpenAI?**Untuk Chat Completions, ya. Gunakan SDK OpenAI, ubah `base_url`, ubah `model`. Pemanggilan fungsi, output terstruktur, dan streaming semuanya berfungsi identik.

**Apakah ini mendukung Responses API?**Antarmuka xAI adalah Chat Completions saat ini. Responses API hanya untuk OpenAI.

**Berapa batas konteks sebenarnya dalam praktik?**1.000.000 token. Input panjang memakan biaya nyata bahkan pada $1,25/1 juta; cache secara agresif jika prompt Anda stabil.

**Bagaimana penalaran selalu aktif memengaruhi latensi?**Latensi token pertama sedikit lebih tinggi daripada model non-penalaran, tetapi Grok 4.3 mengalirkan output pada ~159 token/detik, sehingga waktu respons end-to-end kompetitif. Pertukaran ini sepadan pada beban kerja yang sensitif terhadap akurasi.

**Bisakah saya menggunakan Grok 4.3 dengan Grok Voice?**Ya. Agen suara (`grok-voice-think-fast-1.0`) memanggil Grok 4.3 di balik layar saat melakukan penalaran. Anda juga dapat memanggil Grok 4.3 langsung dari loop suara yang Anda bangun di atas primitif TTS dan STT.

**Apa yang terjadi dengan panggilan Grok 3 / Grok 4 lama saya setelah 15 Mei?**Mereka akan gagal dengan 410 (model dihentikan). Migrasi sebelum batas waktu.

**Apakah Grok 4.3 mendukung input gambar?**Ya, bersama dengan input video baru. Berikan URL gambar dalam blok konten, bentuknya sama dengan OpenAI.

Ringkasan

Grok 4.3 adalah langkah harga-kinerja paling agresif yang telah dikirimkan xAI. Pemotongan 40%, konteks 1 juta, penalaran selalu aktif, dan video asli bersama-sama menjadikannya pendorong harian yang serius untuk sebagian besar beban kerja agen. Kompatibilitas OpenAI berarti migrasi adalah perubahan URL dasar, bukan penulisan ulang.

Jalur validasi tercepat: skrip tiga varian penalaran di Apidog, masukkan prompt Anda yang sebenarnya, ukur latensi dan token penalaran. Migrasi sebelum 15 Mei.

tombol

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.