Cara Menggunakan API Grok 4.3

xAI meluncurkan Grok 4.3 secara bertahap: beta pada 17 April 2026, akses API pada 30 April, dan ketersediaan umum penuh pada 6 Mei. Penawaran ini langsung: jendela konteks 1.000.000 token, input video asli untuk pertama kalinya pada seri Grok, penalaran selalu aktif, dan penurunan harga sekitar 40% dibandingkan Grok 4.20. Delapan model Grok lama akan dihentikan pada 15 Mei, jadi siapa pun yang berjalan pada seri grok-3 atau grok-4 harus merencanakan migrasi minggu ini.

Panduan ini mencakup cara memanggil Grok 4.3 dari kode Anda: bentuk endpoint, otentikasi, URL dasar yang kompatibel dengan OpenAI, parameter upaya penalaran, input video, pemanggilan fungsi, dan pengaturan uji coba yang berfungsi di Apidog.

Untuk sisi suara dari rilis yang sama, lihat Cara menggunakan Grok Voice secara gratis. Untuk perbandingan langsung dengan model suara unggulan OpenAI, lihat Grok Voice vs GPT-Realtime.

tombol

TL;DR

Grok 4.3 tersedia secara umum (GA) pada 6 Mei 2026. Delapan model lama akan dihentikan pada 15 Mei 2026.
Harga: $1,25 per 1 juta token input, $2,50 per 1 juta token output, input cache $0,20 per 1 juta. Kira-kira potongan 40% dibandingkan Grok 4.20.
Jendela konteks 1 juta token. **Input video asli**. Penalaran selalu aktif.
Upaya penalaran: `low` / `medium` / `high`. Defaultnya adalah `medium`.
Endpoint: `https://api.x.ai/v1/chat/completions` (URL dasar yang kompatibel dengan OpenAI).
Throughput: ~159 token/detik pada tingkatan standar.
Indeks Intelijen 53 (Analisis Buatan), peringkat ke-10 dari 146 model secara global.
Gunakan Apidog untuk membuat skrip permintaan, menyimpan konfigurasi penalaran sebagai variabel, dan memutar ulang di mode kompatibilitas Grok dan OpenAI.

Apa yang berubah di Grok 4.3

Peningkatan utama, berdasarkan urutan dampaknya bagi sebagian besar tim:

**Penurunan harga 40%.** Input turun 37,5% dibandingkan Grok 4.20; output turun 58,3%. Tarif input cache sekarang $0,20/1 juta, pemotongan agresif yang membuat prompt sistem stabil yang panjang jauh lebih murah.
**Konteks 1 juta token.** Naik dari 256 ribu pada Grok 4.20. Cukup untuk memuat codebase ukuran sedang, panggilan pendapatan lengkap, atau kontrak hukum lengkap dalam satu prompt.
**Input video asli.** Pertama kali pada seri Grok. Berikan URL video dan model akan melakukan penalaran pada setiap frame secara native.
**Penalaran selalu aktif.** Grok 4.3 dilengkapi dengan langkah penalaran dasar pada setiap permintaan. Parameter `reasoning_effort` mengatur kedalamannya, tetapi model tidak pernah melakukan penalaran kurang dari `low`.
**Peningkatan agentic yang signifikan.** +300 poin Elo pada GDPval-AA dibandingkan Grok 4.20. Pengiriman alat (tool dispatch) dan alur kerja multi-langkah berperilaku jauh lebih baik.

Indeks Intelijen 53 (Artificial Analysis) menempatkan Grok 4.3 di atas rata-rata 35 untuk tingkat harganya, dan kesepuluh dari 146 model yang dilacak.

Prasyarat

Sebelum permintaan pertama, siapkan empat hal:

Akun **xAI Console** di `console.x.ai`. Alur login yang sama dengan Grok Voice.
Tingkat yang dapat ditagih dengan kunci API. Kunci yang terbatas pada proyek direkomendasikan untuk produksi.
**SDK OpenAI** (Grok 4.3 kompatibel dengan OpenAI) atau SDK xAI. Keduanya berfungsi.
Klien API yang dapat memutar ulang permintaan tanpa membanjiri terminal Anda.

Ekspor kunci sekali:

export XAI_API_KEY="xai-..."

Endpoint dan otentikasi

Grok 4.3 dikirimkan pada antarmuka Chat Completions yang kompatibel dengan OpenAI, dengan URL dasar xAI.

POST https://api.x.ai/v1/chat/completions

Otentikasi menggunakan bearer token. Header-nya standar:

Authorization: Bearer $XAI_API_KEY
Content-Type: application/json

Kompatibilitas OpenAI berarti Anda dapat menggunakan SDK Python atau Node OpenAI dan mengubah `base_url`. Itu adalah jalur termudah bagi sebagian besar tim yang bermigrasi dari gpt-4 atau gpt-5.

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XAI_API_KEY"],
    base_url="https://api.x.ai/v1",
)

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
    ],
    reasoning_effort="medium",
)

print(response.choices[0].message.content)

Jika Anda lebih memilih SDK xAI, bentuk panggilannya sama; satu-satunya perubahan adalah impornya.

Parameter permintaan

Peta parameter lengkap untuk Grok 4.3:

Parameter	Tipe	Nilai	Catatan
`model`	string	`grok-4.3`	Wajib.
`messages`	array	Bentuk pesan OpenAI	Wajib. Mendukung `role: system / user / assistant`.
`reasoning_effort`	string	`low`, `medium`, `high`	Opsional. Default: `medium`. Tingkat yang lebih tinggi meningkatkan latensi dan token output.
`max_tokens`	int	1–32768	Membatasi output.
`temperature`	float	0.0–2.0	Default 1.0.
`top_p`	float	0.0–1.0	Sampling nukleus.
`stream`	bool	true / false	Event yang dikirim server jika true.
`tools`	array	Bentuk alat OpenAI	Pemanggilan fungsi.
`tool_choice`	string / object	`auto`, `none`, atau alat spesifik	Semantik OpenAI standar.
`response_format`	object	`{ type: "json_object" }`	Output terstruktur.
`seed`	int	apa pun	Untuk reproduktifitas pada `temperature: 0`.

Permintaan `curl` yang berfungsi:

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.3",
    "messages": [
      {"role": "system", "content": "You are a senior backend engineer."},
      {"role": "user", "content": "Review this query plan and flag the bottleneck."}
    ],
    "reasoning_effort": "high"
  }'

Responsnya memiliki bentuk standar OpenAI: `choices[].message.content`, ditambah objek `usage` dengan `prompt_tokens`, `completion_tokens`, `reasoning_tokens`, dan `total_tokens` yang dipisahkan.

Upaya penalaran

Tiga tingkatan, dengan panduan konkret:

**`rendah`**. Gunakan untuk klasifikasi, ringkasan, ekstraksi aturan, Q&A sederhana. Latensi singkat, output langsung.
**`sedang`**. Default. Gunakan untuk layanan pelanggan, pemanggilan fungsi, analisis data, penggunaan alat satu langkah. Kedalaman penalaran cukup untuk sebagian besar lalu lintas produksi.
**`tinggi`**. Gunakan untuk agen multi-langkah, tinjauan kode berantai panjang, matematika kompleks, dan tugas di mana model perlu merencanakan sebelum menjawab.

Penalaran selalu aktif berarti bahkan `rendah` pun melakukan beberapa pemikiran; itulah yang mendorong peningkatan akurasi faktual dibandingkan Grok 4.20. Jangan berharap menghemat uang dengan menghindari penalaran sama sekali; itu sudah termasuk.

Pemanggilan fungsi

Bentuk OpenAI standar berfungsi langsung. Deklarasikan alat, model mengeluarkan array `tool_calls` pada pesan asisten, Anda mengeksekusi, Anda membalas dengan pesan peran `tool`:

tools = [{
    "type": "function",
    "function": {
        "name": "lookup_user",
        "description": "Look up a user by ID.",
        "parameters": {
            "type": "object",
            "properties": {"user_id": {"type": "string"}},
            "required": ["user_id"],
        },
    },
}]

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
    tools=tools,
    reasoning_effort="medium",
)

tool_calls = response.choices[0].message.tool_calls

Peningkatan 300 Elo pada GDPval-AA terlihat di sini dalam praktik; Grok 4.3 memilih alat yang lebih baik, lebih sedikit panggilan yang berlebihan, dan pulih dari kesalahan alat tanpa berputar. Jika Anda menguji alur alat, pengujian server MCP di Apidog mencakup pengaturan pemutaran ulang yang kami gunakan secara internal.

Input video

Grok 4.3 adalah model Grok pertama dengan input video asli. Berikan URL video di dalam blok konten:

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
            {"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
        ],
    }],
)

Token video dihitung terhadap meteran input. Klip panjang menghabiskan konteks dengan cepat; ambil sampel yang lebih rendah atau pangkas sebelum Anda mengirim jika biaya menjadi perhatian. Model melakukan penalaran pada setiap frame secara native, jadi Anda tidak perlu mengekstrak keyframe secara manual.

Konteks 1 juta token

Jendela konteks 1 juta adalah alat produksi nyata, bukan trofi tolok ukur. Pola umum:

**Tinjauan kode seluruh codebase.** Gabungkan diff, semua file yang disentuh, dan output lint. Minta Grok untuk meninjau.
**QA dokumen bentuk panjang.** Masukkan kontrak 200 halaman dan ajukan pertanyaan yang ditargetkan.
**Memori percakapan.** Simpan seluruh percakapan agen selama sebulan dalam konteks untuk personalisasi.

Input cache seharga $0,20/1 juta membuatnya terjangkau. Prompt sistem 400 ribu token yang Anda jaga tetap stabil menghabiskan $0,08 per panggilan cache daripada $0,50 yang baru.

Migrasi dari model Grok lama

Delapan model Grok lama akan dihentikan pada **15 Mei 2026, pukul 12:00 PM PT**. Jika Anda menggunakan salah satu di antaranya, tukar string `model` menjadi `grok-4.3` sebelum batas waktu. Sebagian besar panggilan akan berfungsi tanpa perubahan lebih lanjut karena bentuk permintaannya tidak berubah.

Dua hal yang perlu diperhatikan:

**Upaya penalaran.** Beberapa model lama tidak menerima `reasoning_effort`. Grok 4.3 selalu melakukan penalaran; jika kode Anda sebelumnya mengandalkan jalur non-penalaran yang cepat, terima peningkatan latensi atau tetap gunakan `low`.
**Pemformatan output.** Grok 4.3 secara default lebih terstruktur daripada Grok 4.20. Jika Anda menggunakan post-processing regex yang berat, uji ulang sebelum menukar.

Untuk perbandingan harga lengkap di seluruh lini OpenAI, lihat Harga GPT-5.5; untuk model penalaran head-to-head, lihat Cara menggunakan API GPT-5.5.

Pengujian di Apidog

Cara tercepat untuk memvalidasi Grok 4.3 terhadap kasus penggunaan Anda sendiri:

Buat lingkungan Apidog dengan `XAI_API_KEY` dan `BASE_URL = https://api.x.ai/v1`.
Simpan koleksi permintaan dengan tiga varian: penalaran `rendah`, `sedang`, `tinggi`. Prompt yang sama, upaya yang berbeda.
Jalankan ketiganya. Bandingkan respons, latensi, dan jumlah `usage.reasoning_tokens` secara berdampingan.
Tambahkan varian keempat yang menunjuk ke URL dasar OpenAI untuk membandingkan Grok 4.3 dengan GPT-5.5 pada input yang identik. SDK yang sama, model dan URL dasar yang berbeda.

Unduh Apidog untuk menjalankan perbandingan. Koleksi ini dapat dipindahkan dengan bersih saat Anda mengganti penyedia, itulah intinya. Untuk strategi pengujian API yang lebih luas, lihat Alat pengujian API untuk insinyur QA.

Batas kecepatan

Batas tingkat pada xAI Console berkisar dari beberapa ribu permintaan per menit pada Tingkat 1 hingga ratusan ribu pada tingkat perusahaan. Angka konkret dapat berubah; periksa dasbor konsol. Throughput 159 token/detik yang diiklankan xAI adalah kecepatan output per-stream, bukan agregat; permintaan bersamaan berskala linier dalam batas tingkat.

Jika Anda mencapai batas kecepatan, API akan mengembalikan 429 dengan header `retry-after`. Backoff eksponensial standar akan menanganinya.

FAQ

**Apakah Grok 4.3 sepenuhnya kompatibel dengan OpenAI?**Untuk Chat Completions, ya. Gunakan SDK OpenAI, ubah `base_url`, ubah `model`. Pemanggilan fungsi, output terstruktur, dan streaming semuanya berfungsi identik.

**Apakah ini mendukung Responses API?**Antarmuka xAI adalah Chat Completions saat ini. Responses API hanya untuk OpenAI.

**Berapa batas konteks sebenarnya dalam praktik?**1.000.000 token. Input panjang memakan biaya nyata bahkan pada $1,25/1 juta; cache secara agresif jika prompt Anda stabil.

**Bagaimana penalaran selalu aktif memengaruhi latensi?**Latensi token pertama sedikit lebih tinggi daripada model non-penalaran, tetapi Grok 4.3 mengalirkan output pada ~159 token/detik, sehingga waktu respons end-to-end kompetitif. Pertukaran ini sepadan pada beban kerja yang sensitif terhadap akurasi.

**Bisakah saya menggunakan Grok 4.3 dengan Grok Voice?**Ya. Agen suara (`grok-voice-think-fast-1.0`) memanggil Grok 4.3 di balik layar saat melakukan penalaran. Anda juga dapat memanggil Grok 4.3 langsung dari loop suara yang Anda bangun di atas primitif TTS dan STT.

**Apa yang terjadi dengan panggilan Grok 3 / Grok 4 lama saya setelah 15 Mei?**Mereka akan gagal dengan 410 (model dihentikan). Migrasi sebelum batas waktu.

**Apakah Grok 4.3 mendukung input gambar?**Ya, bersama dengan input video baru. Berikan URL gambar dalam blok konten, bentuknya sama dengan OpenAI.

Ringkasan

Grok 4.3 adalah langkah harga-kinerja paling agresif yang telah dikirimkan xAI. Pemotongan 40%, konteks 1 juta, penalaran selalu aktif, dan video asli bersama-sama menjadikannya pendorong harian yang serius untuk sebagian besar beban kerja agen. Kompatibilitas OpenAI berarti migrasi adalah perubahan URL dasar, bukan penulisan ulang.

Jalur validasi tercepat: skrip tiga varian penalaran di Apidog, masukkan prompt Anda yang sebenarnya, ukur latensi dan token penalaran. Migrasi sebelum 15 Mei.

tombol