Cara Menggunakan API Claude Opus 4.8

Panduan lengkap Claude Opus 4.8 API: dapatkan kunci API, buat panggilan pertama Anda dalam Python/Node/curl, gunakan parameter effort dan pemikiran adaptif, tangani streaming, penggunaan alat, dan kesalahan.

Ashley Innocent

Ashley Innocent

29 May 2026

Cara Menggunakan API Claude Opus 4.8

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

API Claude Opus 4.8 telah diluncurkan bersamaan dengan perilisan model pada 28 Mei 2026. ID modelnya adalah claude-opus-4-8, dan berjalan di Messages API yang sudah Anda kenal. Panduan ini akan membahas pengaturan lengkap: mendapatkan kunci, panggilan pertama Anda, parameter effort yang baru, pemikiran adaptif, streaming, penggunaan alat, dan menguji semuanya di Apidog.

Jika Anda pernah memanggil model Claude sebelumnya, satu-satunya string yang berubah adalah nama model. Konsep baru satu-satunya adalah kontrol usaha (effort control), dan ini patut dipahami selama sepuluh menit karena menggantikan pola anggaran pemikiran (thinking-budget) yang lama. Baru menggunakan Claude API? Anda bisa membuat panggilan Opus 4.8 yang berfungsi dalam waktu sekitar sepuluh menit. Untuk latar belakang model itu sendiri, lihat apa itu Claude Opus 4.8.

Apa yang Anda dapatkan dengan API Opus 4.8

Angka-angka yang membentuk integrasi Anda:

Untuk perhitungan biaya lengkap dan tarif mode cepat, lihat panduan harga Opus 4.8. Jika Anda belum memiliki paket berbayar, panduan akses gratis mencakup opsi Anda.

Langkah 1: Dapatkan kunci API Claude Anda

  1. Buka console.anthropic.com
  2. Masuk atau buat akun
  3. Buka Settings, lalu API Keys
  4. Klik Create Key, beri nama, dan salin

Simpan kunci dalam variabel lingkungan agar tidak pernah masuk ke kode Anda:

export ANTHROPIC_API_KEY="sk-ant-..."

Akun baru mendapatkan kredit percobaan untuk diuji sebelum Anda menambahkan penagihan. Kunci ini langsung berfungsi untuk claude-opus-4-8.

Langkah 2: Instal SDK

Anthropic menyediakan SDK resmi untuk Python, TypeScript, Go, Java, C#, Ruby, dan PHP. Pilih bahasa Anda:

# Python
pip install anthropic

# Node.js / TypeScript
npm install @anthropic-ai/sdk

Anda dapat melewati SDK sepenuhnya dan memanggil endpoint REST dengan curl, seperti yang ditunjukkan di bawah. Sumber SDK Python adalah referensi jika Anda membutuhkan tipe yang tepat.

Langkah 3: Lakukan panggilan Opus 4.8 pertama Anda

Python

import anthropic

client = anthropic.Anthropic()  # membaca ANTHROPIC_API_KEY

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {"role": "user", "content": "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat."}
    ],
)

print(message.content[0].text)

Node.js

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

const message = await client.messages.create({
  model: "claude-opus-4-8",
  max_tokens: 4096,
  messages: [
    { role: "user", content: "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat." },
  ],
});

console.log(message.content[0].text);

curl

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-opus-4-8",
    "max_tokens": 4096,
    "messages": [
      {"role": "user", "content": "Jelaskan alur OAuth 2.0 PKCE dalam 3 paragraf singkat."}
    ]
  }'

Itulah jalan yang mudah. Dari sini Anda menambahkan fitur yang Anda butuhkan.

Kontrol usaha (effort): satu-satunya parameter baru

Parameter effort mengontrol berapa banyak token yang dihabiskan Opus 4.8 di seluruh respons: teks, panggilan alat, dan penalaran. Parameter ini berada di dalam output_config dan menerima nilai low, medium, high, xhigh, dan max. Defaultnya adalah high, jadi mengabaikannya akan memberikan Anda perilaku high.

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=8192,
    messages=[{"role": "user", "content": "Refaktor modul 600 baris ini agar mudah diuji."}],
    output_config={"effort": "xhigh"},
)

Node:

const message = await client.messages.create({
  model: "claude-opus-4-8",
  max_tokens: 8192,
  messages: [{ role: "user", content: "Refaktor modul 600 baris ini agar mudah diuji." }],
  output_config: { effort: "xhigh" },
});

Cara memilih, berdasarkan dokumen usaha Anthropic:

Tingkat Gunakan untuk
low Klasifikasi, pencarian cepat, pekerjaan bervolume tinggi, sub-agen
medium Pekerjaan agensi yang seimbang di mana biaya menjadi pertimbangan
high Default. Penalaran kompleks di mana kualitas mengalahkan kecepatan
xhigh Pengkodean dan tugas agensi jangka panjang; titik awal yang direkomendasikan
max Masalah-masalah perbatasan sejati di mana Anda telah mengukur ruang gerak

Dua aturan praktis. Mulai dari xhigh untuk pengkodean dan loop agensi. Saat Anda menjalankan xhigh atau max, atur max_tokens yang besar (64K adalah titik awal yang masuk akal) agar model memiliki ruang untuk berpikir dan bertindak.

Pemikiran adaptif

Opus 4.8 menggunakan pemikiran adaptif. Atur thinking: {type: "adaptive"} dan model akan memutuskan kapan dan seberapa banyak untuk bernalar. Tanpa itu, permintaan akan berjalan tanpa pemikiran.

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},
    messages=[{"role": "user", "content": "Temukan kondisi balapan (race condition) dalam penjadwal ini."}],
)

for block in message.content:
    if block.type == "thinking":
        print("[thinking]", block.thinking[:200])
    elif block.type == "text":
        print(block.text)

Satu jebakan migrasi: pemikiran yang diperpanjang secara manual dengan budget_tokens **tidak didukung** di Opus 4.8 dan mengembalikan kesalahan 400. Jika Anda membawa itu dari Opus 4.5 atau sebelumnya, hapus bidang budget_tokens dan gunakan pemikiran adaptif dengan parameter effort sebagai gantinya.

Respons streaming

Streaming membuat Opus 4.8 terasa cepat di UI. SDK memberi Anda pembantu:

with client.messages.stream(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Tulis panduan 5 langkah untuk menulis klien REST di Go."}],
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

Node:

const stream = client.messages.stream({
  model: "claude-opus-4-8",
  max_tokens: 4096,
  messages: [{ role: "user", content: "Tulis panduan 5 langkah untuk menulis klien REST di Go." }],
});

for await (const event of stream) {
  if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
    process.stdout.write(event.delta.text);
  }
}

Untuk REST mentah, tambahkan "stream": true ke body permintaan dan baca peristiwa yang dikirim server.

Penggunaan alat dan pemanggilan fungsi

Opus 4.8 memanggil alat lebih efisien daripada 4.7, dan tingkat effort membentuk berapa banyak panggilan yang dilakukannya. Definisikan alat dengan input_schema:

tools = [
    {
        "name": "get_weather",
        "description": "Dapatkan cuaca saat ini untuk suatu kota.",
        "input_schema": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "Nama kota"},
                "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
            },
            "required": ["city"],
        },
    }
]

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    tools=tools,
    messages=[{"role": "user", "content": "Bagaimana cuaca di Singapura sekarang?"}],
)

for block in message.content:
    if block.type == "tool_use":
        print(f"Panggilan: {block.name}")
        print(f"Argumen: {block.input}")

Anda menjalankan alat secara lokal, menambahkan blok tool_result, dan memanggil lagi untuk melanjutkan. Usaha yang lebih rendah membuat Claude menggabungkan operasi menjadi lebih sedikit panggilan; usaha yang lebih tinggi membuatnya menjelaskan rencananya terlebih dahulu. Jika Anda membangun sistem multi-agen, panduan agen terkelola vs SDK Agen Claude kami mencakup pilihan arsitektur.

Pesan sistem di tengah percakapan

Opus 4.8 hadir dengan perubahan API Messages: Anda sekarang dapat menempatkan entri sistem di tengah array messages, tidak hanya di awal. Itu memungkinkan Anda menyuntikkan instruksi atau izin baru di tengah tugas, yang merupakan dasar untuk Alur Kerja Dinamis (Dynamic Workflows) Claude Code. Jika Anda mengatur sub-agen melalui API, baca ulasan mendalam Alur Kerja Dinamis untuk pola lengkapnya.

Menguji integrasi Opus 4.8 Anda dengan Apidog

Panggilan SDK yang berfungsi adalah langkah pertama. Integrasi produksi harus menangani bagian-bagian yang rumit: potongan streaming, validasi panggilan alat, bentuk output_config yang baru, dan blok pemikiran adaptif dalam respons. Di situlah pengaturan pengujian yang sebenarnya membuahkan hasil.

Apidog menangani seluruh permukaan API Messages dalam satu ruang kerja:

Untuk memulai, unduh Apidog, buat permintaan yang mengarah ke endpoint Messages, dan impor cuplikan curl dari sebelumnya. Pengaturan membutuhkan waktu sekitar dua menit. Alur yang sama berfungsi untuk API Gemini 3.5 dan API Qwen 3.7 jika Anda menggunakan lebih dari satu penyedia.

Penanganan kesalahan dan batas kecepatan

Model kesalahan Claude konsisten. Kode yang penting:

Bungkus panggilan dengan loop percobaan ulang dan backoff eksponensial:

import time
import anthropic

client = anthropic.Anthropic()

def call_with_retry(prompt, max_retries=4):
    for attempt in range(max_retries):
        try:
            return client.messages.create(
                model="claude-opus-4-8",
                max_tokens=4096,
                messages=[{"role": "user", "content": prompt}],
            )
        except anthropic.RateLimitError:
            if attempt == max_retries - 1:
                raise
            time.sleep(2 ** attempt)

Batas kecepatan (rate limits) berskala dengan tingkat penggunaan Anda. Untuk pekerjaan batch throughput tinggi yang tidak membutuhkan latensi waktu nyata, Batch API juga membuka hingga 300K token keluaran dengan header beta.

Migrasi dari Opus 4.7 ke 4.8

Sebagian besar proyek hanya mengubah satu string:

# Sebelum
model="claude-opus-4-7"

# Sesudah
model="claude-opus-4-8"

Apa yang harus diverifikasi setelah penukaran:

  1. Tingkat usaha (effort levels): perilakunya sama dengan 4.7, tetapi jalankan ulang evaluasi Anda pada tingkat yang Anda gunakan
  2. Konfigurasi pemikiran (thinking config): jika Anda pernah mengatur budget_tokens, hapus; Opus 4.8 menolaknya dengan 400
  3. Skema alat (tool schemas): tetap sama, tetapi jalankan ulang evaluasi penggunaan alat Anda
  4. Biaya: tarif per-token identik dengan 4.7, jadi tidak ada kejutan tagihan

FAQ

Apa ID model API Claude Opus 4.8? claude-opus-4-8 di Claude API dan Vertex AI, serta anthropic.claude-opus-4-8 di AWS Bedrock.

Apakah ada tingkat gratis untuk API Opus 4.8? Tidak ada tingkat API gratis yang tetap, tetapi akun baru mendapatkan kredit percobaan. Lihat panduan akses gratis untuk jalur berbiaya rendah lainnya.

Bagaimana cara mengatur tingkat usaha (effort level)? Kirim output_config: {"effort": "xhigh"} (atau low, medium, high, max) dalam permintaan. Defaultnya adalah high.

Mengapa permintaan saya mengembalikan 400 tentang budget_tokens? Opus 4.8 tidak mendukung pemikiran yang diperpanjang secara manual. Hapus budget_tokens dan gunakan thinking: {type: "adaptive"} dengan parameter effort.

Apakah Opus 4.8 berfungsi dengan OpenAI-compatible SDK? Anthropic menyediakan lapisan kompatibilitas untuk OpenAI SDK. Arahkan URL dasar ke endpoint Anthropic dan gunakan kunci Anthropic Anda; pertahankan string model claude-opus-4-8.

Berapa max_tokens yang harus saya atur untuk pekerjaan agensi? Mulai dari 64K saat menjalankan usaha xhigh atau max agar model memiliki ruang untuk berpikir dan merantai panggilan alat. Sesuaikan ke bawah setelah Anda melihat penggunaan yang sebenarnya.

Bagaimana cara menguji respons streaming di Apidog? Buka permintaan, aktifkan streaming di body, dan Apidog merender potongan event yang dikirim server saat tiba, yang memudahkan untuk melihat respons yang tidak lengkap.

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.