API Claude Opus 4.8 telah diluncurkan bersamaan dengan perilisan model pada 28 Mei 2026. ID modelnya adalah claude-opus-4-8, dan berjalan di Messages API yang sudah Anda kenal. Panduan ini akan membahas pengaturan lengkap: mendapatkan kunci, panggilan pertama Anda, parameter effort yang baru, pemikiran adaptif, streaming, penggunaan alat, dan menguji semuanya di Apidog.
Jika Anda pernah memanggil model Claude sebelumnya, satu-satunya string yang berubah adalah nama model. Konsep baru satu-satunya adalah kontrol usaha (effort control), dan ini patut dipahami selama sepuluh menit karena menggantikan pola anggaran pemikiran (thinking-budget) yang lama. Baru menggunakan Claude API? Anda bisa membuat panggilan Opus 4.8 yang berfungsi dalam waktu sekitar sepuluh menit. Untuk latar belakang model itu sendiri, lihat apa itu Claude Opus 4.8.
Apa yang Anda dapatkan dengan API Opus 4.8
Angka-angka yang membentuk integrasi Anda:
claude-opus-4-8: Konteks masukan 1 juta token, keluaran 128 ribu token- Endpoint Messages yang sama: dapat langsung digunakan untuk proyek yang sudah memanggil Opus 4.7
- Kontrol
effort: lima tingkatan darilowhinggamax, diatur per permintaan - Pemikiran adaptif: model memutuskan seberapa dalam untuk bernalar
- Harga standar: $5 per juta token masukan, $25 per juta token keluaran
Untuk perhitungan biaya lengkap dan tarif mode cepat, lihat panduan harga Opus 4.8. Jika Anda belum memiliki paket berbayar, panduan akses gratis mencakup opsi Anda.
Langkah 1: Dapatkan kunci API Claude Anda
- Buka console.anthropic.com
- Masuk atau buat akun
- Buka Settings, lalu API Keys
- Klik Create Key, beri nama, dan salin
Simpan kunci dalam variabel lingkungan agar tidak pernah masuk ke kode Anda:
export ANTHROPIC_API_KEY="sk-ant-..."
Akun baru mendapatkan kredit percobaan untuk diuji sebelum Anda menambahkan penagihan. Kunci ini langsung berfungsi untuk claude-opus-4-8.
Langkah 2: Instal SDK
Anthropic menyediakan SDK resmi untuk Python, TypeScript, Go, Java, C#, Ruby, dan PHP. Pilih bahasa Anda:
# Python
pip install anthropic
# Node.js / TypeScript
npm install @anthropic-ai/sdk
Anda dapat melewati SDK sepenuhnya dan memanggil endpoint REST dengan curl, seperti yang ditunjukkan di bawah. Sumber SDK Python adalah referensi jika Anda membutuhkan tipe yang tepat.
Langkah 3: Lakukan panggilan Opus 4.8 pertama Anda
Python
import anthropic
client = anthropic.Anthropic() # membaca ANTHROPIC_API_KEY
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[
{"role": "user", "content": "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat."}
],
)
print(message.content[0].text)
Node.js
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic();
const message = await client.messages.create({
model: "claude-opus-4-8",
max_tokens: 4096,
messages: [
{ role: "user", content: "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat." },
],
});
console.log(message.content[0].text);
curl
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-8",
"max_tokens": 4096,
"messages": [
{"role": "user", "content": "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat."}
]
}'
Itulah jalan yang mudah. Dari sini Anda menambahkan fitur yang Anda butuhkan.
Kontrol usaha (effort): satu-satunya parameter baru
Parameter effort mengontrol berapa banyak token yang dihabiskan Opus 4.8 di seluruh respons: teks, panggilan alat, dan penalaran. Parameter ini berada di dalam output_config dan menerima nilai low, medium, high, xhigh, dan max. Defaultnya adalah high, jadi mengabaikannya akan memberikan Anda perilaku high.
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=8192,
messages=[{"role": "user", "content": "Refaktor modul 600 baris ini agar mudah diuji."}],
output_config={"effort": "xhigh"},
)
Node:
const message = await client.messages.create({
model: "claude-opus-4-8",
max_tokens: 8192,
messages: [{ role: "user", content: "Refaktor modul 600 baris ini agar mudah diuji." }],
output_config: { effort: "xhigh" },
});
Cara memilih, berdasarkan dokumen usaha Anthropic:
| Tingkat | Gunakan untuk |
|---|---|
low |
Klasifikasi, pencarian cepat, pekerjaan bervolume tinggi, sub-agen |
medium |
Pekerjaan agensi yang seimbang di mana biaya menjadi pertimbangan |
high |
Default. Penalaran kompleks di mana kualitas mengalahkan kecepatan |
xhigh |
Pengkodean dan tugas agensi jangka panjang; titik awal yang direkomendasikan |
max |
Masalah-masalah perbatasan sejati di mana Anda telah mengukur ruang gerak |
Dua aturan praktis. Mulai dari xhigh untuk pengkodean dan loop agensi. Saat Anda menjalankan xhigh atau max, atur max_tokens yang besar (64K adalah titik awal yang masuk akal) agar model memiliki ruang untuk berpikir dan bertindak.
Pemikiran adaptif
Opus 4.8 menggunakan pemikiran adaptif. Atur thinking: {type: "adaptive"} dan model akan memutuskan kapan dan seberapa banyak untuk bernalar. Tanpa itu, permintaan akan berjalan tanpa pemikiran.
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "xhigh"},
messages=[{"role": "user", "content": "Temukan kondisi balapan (race condition) dalam penjadwal ini."}],
)
for block in message.content:
if block.type == "thinking":
print("[thinking]", block.thinking[:200])
elif block.type == "text":
print(block.text)
Satu jebakan migrasi: pemikiran yang diperpanjang secara manual dengan budget_tokens **tidak didukung** di Opus 4.8 dan mengembalikan kesalahan 400. Jika Anda membawa itu dari Opus 4.5 atau sebelumnya, hapus bidang budget_tokens dan gunakan pemikiran adaptif dengan parameter effort sebagai gantinya.
Respons streaming
Streaming membuat Opus 4.8 terasa cepat di UI. SDK memberi Anda pembantu:
with client.messages.stream(
model="claude-opus-4-8",
max_tokens=4096,
messages=[{"role": "user", "content": "Tulis panduan 5 langkah untuk menulis klien REST di Go."}],
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)
Node:
const stream = client.messages.stream({
model: "claude-opus-4-8",
max_tokens: 4096,
messages: [{ role: "user", content: "Tulis panduan 5 langkah untuk menulis klien REST di Go." }],
});
for await (const event of stream) {
if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
process.stdout.write(event.delta.text);
}
}
Untuk REST mentah, tambahkan "stream": true ke body permintaan dan baca peristiwa yang dikirim server.
Penggunaan alat dan pemanggilan fungsi
Opus 4.8 memanggil alat lebih efisien daripada 4.7, dan tingkat effort membentuk berapa banyak panggilan yang dilakukannya. Definisikan alat dengan input_schema:
tools = [
{
"name": "get_weather",
"description": "Dapatkan cuaca saat ini untuk suatu kota.",
"input_schema": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "Nama kota"},
"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
},
"required": ["city"],
},
}
]
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
tools=tools,
messages=[{"role": "user", "content": "Bagaimana cuaca di Singapura sekarang?"}],
)
for block in message.content:
if block.type == "tool_use":
print(f"Panggilan: {block.name}")
print(f"Argumen: {block.input}")
Anda menjalankan alat secara lokal, menambahkan blok tool_result, dan memanggil lagi untuk melanjutkan. Usaha yang lebih rendah membuat Claude menggabungkan operasi menjadi lebih sedikit panggilan; usaha yang lebih tinggi membuatnya menjelaskan rencananya terlebih dahulu. Jika Anda membangun sistem multi-agen, panduan agen terkelola vs SDK Agen Claude kami mencakup pilihan arsitektur.
Pesan sistem di tengah percakapan
Opus 4.8 hadir dengan perubahan API Messages: Anda sekarang dapat menempatkan entri sistem di tengah array messages, tidak hanya di awal. Itu memungkinkan Anda menyuntikkan instruksi atau izin baru di tengah tugas, yang merupakan dasar untuk Alur Kerja Dinamis (Dynamic Workflows) Claude Code. Jika Anda mengatur sub-agen melalui API, baca ulasan mendalam Alur Kerja Dinamis untuk pola lengkapnya.
Menguji integrasi Opus 4.8 Anda dengan Apidog
Panggilan SDK yang berfungsi adalah langkah pertama. Integrasi produksi harus menangani bagian-bagian yang rumit: potongan streaming, validasi panggilan alat, bentuk output_config yang baru, dan blok pemikiran adaptif dalam respons. Di situlah pengaturan pengujian yang sebenarnya membuahkan hasil.
Apidog menangani seluruh permukaan API Messages dalam satu ruang kerja:
- Simpan endpoint sebagai permintaan: tempel
https://api.anthropic.com/v1/messages, lampirkan headerx-api-keydananthropic-versionAnda, tekan Kirim - Putar ulang di berbagai versi model: tukar
claude-opus-4-7denganclaude-opus-4-8pada permintaan yang sama dan bandingkan hasilnya - Streaming respons secara inline: Apidog merender potongan streaming saat tiba, dengan waktu per-potongan
- Validasi bentuk respons: tambahkan pernyataan yang menangkap penyimpangan saat Anda mengubah tingkat
effortatau mengaktifkan/menonaktifkan pemikiran - Membuat mock endpoint: hasilkan respons Messages mock sehingga Anda dapat menguji kode downstream tanpa menghabiskan kredit
- Bangun skenario loop agen: rantai panggilan dengan validasi panggilan alat di antara langkah-langkah
Untuk memulai, unduh Apidog, buat permintaan yang mengarah ke endpoint Messages, dan impor cuplikan curl dari sebelumnya. Pengaturan membutuhkan waktu sekitar dua menit. Alur yang sama berfungsi untuk API Gemini 3.5 dan API Qwen 3.7 jika Anda menggunakan lebih dari satu penyedia.
Penanganan kesalahan dan batas kecepatan
Model kesalahan Claude konsisten. Kode yang penting:
- 400
invalid_request_error: body yang salah format, seringkalibudget_tokenspada Opus 4.8 atau nilaieffortyang buruk - 401
authentication_error: kunci API salah atau hilang - 403
permission_error: kunci Anda tidak dapat mengakses model - 429
rate_limit_error: tunggu sebentar dan coba lagi - 500
api_error: sisi server, coba lagi dengan backoff - 529
overloaded_error: API sementara kelebihan beban, coba lagi dengan backoff
Bungkus panggilan dengan loop percobaan ulang dan backoff eksponensial:
import time
import anthropic
client = anthropic.Anthropic()
def call_with_retry(prompt, max_retries=4):
for attempt in range(max_retries):
try:
return client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=[{"role": "user", "content": prompt}],
)
except anthropic.RateLimitError:
if attempt == max_retries - 1:
raise
time.sleep(2 ** attempt)
Batas kecepatan (rate limits) berskala dengan tingkat penggunaan Anda. Untuk pekerjaan batch throughput tinggi yang tidak membutuhkan latensi waktu nyata, Batch API juga membuka hingga 300K token keluaran dengan header beta.
Migrasi dari Opus 4.7 ke 4.8
Sebagian besar proyek hanya mengubah satu string:
# Sebelum
model="claude-opus-4-7"
# Sesudah
model="claude-opus-4-8"
Apa yang harus diverifikasi setelah penukaran:
- Tingkat usaha (effort levels): perilakunya sama dengan 4.7, tetapi jalankan ulang evaluasi Anda pada tingkat yang Anda gunakan
- Konfigurasi pemikiran (thinking config): jika Anda pernah mengatur
budget_tokens, hapus; Opus 4.8 menolaknya dengan 400 - Skema alat (tool schemas): tetap sama, tetapi jalankan ulang evaluasi penggunaan alat Anda
- Biaya: tarif per-token identik dengan 4.7, jadi tidak ada kejutan tagihan
FAQ
Apa ID model API Claude Opus 4.8? claude-opus-4-8 di Claude API dan Vertex AI, serta anthropic.claude-opus-4-8 di AWS Bedrock.
Apakah ada tingkat gratis untuk API Opus 4.8? Tidak ada tingkat API gratis yang tetap, tetapi akun baru mendapatkan kredit percobaan. Lihat panduan akses gratis untuk jalur berbiaya rendah lainnya.
Bagaimana cara mengatur tingkat usaha (effort level)? Kirim output_config: {"effort": "xhigh"} (atau low, medium, high, max) dalam permintaan. Defaultnya adalah high.
Mengapa permintaan saya mengembalikan 400 tentang budget_tokens? Opus 4.8 tidak mendukung pemikiran yang diperpanjang secara manual. Hapus budget_tokens dan gunakan thinking: {type: "adaptive"} dengan parameter effort.
Apakah Opus 4.8 berfungsi dengan OpenAI-compatible SDK? Anthropic menyediakan lapisan kompatibilitas untuk OpenAI SDK. Arahkan URL dasar ke endpoint Anthropic dan gunakan kunci Anthropic Anda; pertahankan string model claude-opus-4-8.
Berapa max_tokens yang harus saya atur untuk pekerjaan agensi? Mulai dari 64K saat menjalankan usaha xhigh atau max agar model memiliki ruang untuk berpikir dan merantai panggilan alat. Sesuaikan ke bawah setelah Anda melihat penggunaan yang sebenarnya.
Bagaimana cara menguji respons streaming di Apidog? Buka permintaan, aktifkan streaming di body, dan Apidog merender potongan event yang dikirim server saat tiba, yang memudahkan untuk melihat respons yang tidak lengkap.
