Cara Mengatasi Penolakan Fable 5 di API

Anda memanggil claude-fable-5, responsnya terlihat normal, lalu Anda memeriksa bidang model: claude-opus-4-8. Permintaan Anda memicu pengklasifikasi keamanan, Fable 5 menolak untuk menjawab, dan model yang berbeda mengambil alih. Ini bukan bug. Ini adalah cara Fable 5 dirancang untuk bekerja, dan integrasi Anda harus menanganinya dengan sengaja, bukan secara tidak sengaja.

Kami membahas alasan di balik arsitektur ini dalam penjelasan kami tentang perlindungan keamanan Fable 5. Artikel ini adalah panduan praktisnya. Anda akan mempelajari apa yang memicu pengalihan (reroute), cara mendeteksinya dalam kode, bagaimana parameter beta fallbacks mengotomatiskan percobaan ulang, dan cara menguji penanganan penolakan Anda sebelum pengguna sesungguhnya mengalaminya.

Mengapa Fable 5 Mengalihkan Beberapa Permintaan

Claude Fable 5 dilengkapi dengan pengklasifikasi keamanan yang menyaring permintaan masuk. Mereka memantau tiga domain: keamanan siber, biologi dan kimia, serta distilasi model. Ketika pengklasifikasi terpicu, Fable 5 menolak permintaan tersebut. Pada antarmuka konsumen Claude, permintaan tersebut kemudian ditangani oleh Claude Opus 4.8 dan pengguna diberi tahu bahwa hal itu terjadi. Pada API, pemulihan adalah tanggung jawab Anda, dan di sinilah parameter fallbacks berperan.

Pengklasifikasi tidak bersifat statis. Setelah penangguhan bulan Juni, Anthropic melatih ulang pengklasifikasi terhadap teknik jailbreak yang dilaporkan; versi terbaru memblokir lebih dari 99% upaya. Fable 5 dikerahkan kembali pada 1 Juli 2026 dengan pengklasifikasi baru. Jika Anda menunda integrasi Anda selama pemadaman, pusat informasi Fable 5 kembali kami memiliki linimasa lengkap dan apa yang berubah.

Satu konteks tambahan membantu di sini. Pengklasifikasi berada di depan model, bukan di dalamnya. Claude Mythos 5 adalah model yang sama tanpa pengklasifikasi, dan aksesnya dibatasi untuk peserta Project Glasswing. Lebih dari 95% sesi Fable tidak melibatkan fallback sama sekali, dan untuk sesi tersebut, kinerja Fable 5 secara efektif identik dengan Mythos 5. Kami menguraikan perbedaannya dalam Fable 5 vs Mythos 5.

Apa Arti Pengalihan (Reroute) untuk Aplikasi Anda

Fable 5 dan Opus 4.8 keduanya adalah model yang kuat, tetapi tidak dapat dipertukarkan dari sudut pandang rekayasa. Fable 5 menjalankan jendela konteks 1M token dengan output maksimum 128K dengan harga $10 per juta token input dan $50 per juta token output; Opus 4.8 memiliki harga dan profil perilakunya sendiri. Gambaran umum model mencantumkan spesifikasi saat ini untuk keduanya. Prompt yang Anda sesuaikan dengan Fable 5 mungkin menghasilkan panjang, format, atau pola pemanggilan alat yang berbeda pada Opus 4.8.

Apakah itu penting tergantung pada kasus penggunaan Anda:

Biasanya tidak. Untuk asisten obrolan, agen, dan generasi umum, jawaban Opus 4.8 adalah jawaban yang bagus. Lebih dari 95% sesi tidak pernah mengalami fallback, sehingga efek gabungan pada kualitas kecil.
Penting untuk evaluasi dan alur kerja yang terpaku. Jika Anda melakukan benchmark terhadap model tertentu, pengalihan diam-diam akan mencemari data Anda. Sama halnya untuk ekstraksi terstruktur dengan prompt yang disesuaikan dengan perilaku model tertentu.
Penting untuk atribusi biaya dan kepatuhan. Upaya fallback ditagih dengan tarif model yang melayani, dan beberapa tim harus mencatat model mana yang menghasilkan setiap output.
Paling penting di dekat domain pemicu. Alat keamanan dan pekerjaan ilmu hayati berada dekat dengan target pengklasifikasi, sehingga positif palsu lebih sering terjadi di sana daripada di tempat lain. Jika itu kasus Anda, perlakukan penanganan fallback sebagai jalur kode kelas satu, bukan kasus tepi.

Mendeteksi Fallback secara Programatis

Sinyal yang dapat diandalkan adalah bidang model dari respons. Setiap respons Messages API menyebutkan model yang menghasilkannya, jadi permintaan yang dikirim ke claude-fable-5 yang mengembalikan claude-opus-4-8 telah dialihkan. Itu adalah perilaku Messages API standar; Anda tidak memerlukan fitur beta apa pun untuk membacanya.

Dua bidang lainnya termasuk dalam baris log yang sama. stop_reason memberi tahu Anda apakah permintaan ditolak sepenuhnya: permintaan yang ditolak tanpa penanganan fallback mengembalikan HTTP 200 dengan stop_reason diatur ke "refusal" dan tanpa konten yang dapat digunakan, jadi periksa ini sebelum membaca response.content. Dan usage memberi Anda jumlah token yang Anda butuhkan untuk mengaitkan biaya ke model yang menagihnya.

response = client.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    messages=[{"role": "user", "content": prompt}],
)

if response.stop_reason == "refusal":
    # Declined with no fallback configured: no usable content came back
    handle_refusal(response)
elif not response.model.startswith("claude-fable-5"):
    logger.info(
        "fallback served_by=%s in=%d out=%d",
        response.model,
        response.usage.input_tokens,
        response.usage.output_tokens,
    )

Jika Anda menyiapkan API dari awal, mulailah dengan panduan kami tentang cara menggunakan Claude Fable 5 API dan tambahkan pemeriksaan ini setelah panggilan pertama Anda berfungsi.

Parameter fallbacks

Tanpa konfigurasi fallback apa pun, permintaan API yang ditolak akan berhenti begitu saja. Anda mendapatkan penolakan, pengguna Anda tidak mendapatkan apa-apa, dan logika percobaan ulang adalah tugas Anda untuk menuliskannya. Parameter fallbacks memindahkan percobaan ulang tersebut ke server: ketika Fable 5 menolak, API menjalankan kembali permintaan yang sama pada model yang Anda sebutkan, di dalam panggilan yang sama, dan mengembalikan jawaban model tersebut.

Parameter ini dalam versi beta pada Claude API dan Claude Platform di AWS, didokumentasikan di halaman penolakan dan fallback Anthropic. Anda dapat memilih untuk menggunakannya dengan header beta, dan saat peluncuran, satu-satunya target fallback yang didukung adalah claude-opus-4-8:

response = client.beta.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    betas=["server-side-fallback-2026-06-01"],
    fallbacks=[{"model": "claude-opus-4-8"}],
    messages=[{"role": "user", "content": prompt}],
)

print(response.model)  # claude-opus-4-8 if the request was rerouted

Penagihan bekerja untuk keuntungan Anda. Permintaan yang ditolak sebelum output apa pun dihasilkan tidak akan ditagih sama sekali; upaya penyelamatan ditagih dengan tarif model fallback itu sendiri. Deteksi tetap sama seperti sebelumnya: response.model menyebutkan model yang menjawab.

Beberapa batasan yang perlu diketahui. Parameter ini ditolak pada Batches API dan tidak tersedia di Amazon Bedrock, Google Vertex AI, atau Microsoft Foundry; pada platform tersebut Anda menangani percobaan ulang di sisi klien. Dan jika model fallback juga menolak, respons akhir akan membawa stop_reason: "refusal", jadi pertahankan cabang penolakan dari bagian sebelumnya bahkan dengan fallback diaktifkan.

Merancang Kebijakan Penanganan Anda

Deteksi dan percobaan ulang adalah mekanisme. Keputusan sebenarnya adalah apa yang dilakukan produk Anda ketika fallback terjadi, dan ada tiga kebijakan yang masuk akal:

Terima jawaban Opus. Tepat untuk produk obrolan, asisten, dan sebagian besar agen. Aktifkan fallbacks, catat kejadiannya, dan lanjutkan. Pengguna Anda mendapatkan jawaban dalam satu putaran perjalanan alih-alih kesalahan.
Coba lagi dengan permintaan yang diubah. Tepat untuk alur kerja di mana konsistensi model lebih penting daripada latensi. Jangan mengirim ulang prompt yang sama ke Fable 5; pengklasifikasi yang menolaknya sekali akan menolaknya lagi. Ubah frasa menjauhi pemicu, arahkan seluruh pekerjaan ke Opus 4.8, atau antrekan untuk ditinjau manusia.
Tampilkan kepada pengguna. Tepat ketika pelanggan membayar khusus untuk Fable 5, atau ketika kepatuhan memerlukan pengungkapan. Tunjukkan model mana yang menjawab dan biarkan pengguna memutuskan apakah akan menjalankan ulang.

Kebijakan apa pun yang Anda pilih, lacak tingkat fallback Anda. Tingkat yang mendekati nol sesuai dengan dasar platform secara keseluruhan. Tingkat yang merayap melewati beberapa persen berarti prompt Anda bersinggungan dengan domain pemicu, dan ada baiknya untuk meninjau kembali hal tersebut sebelum volumenya meningkat.

Menguji Jalur Penolakan Sebelum Produksi

Penanganan fallback adalah jenis kode yang berfungsi dalam demo dan gagal enam minggu kemudian, karena penolakan jarang terjadi berdasarkan desain. Anda tidak bisa menunggu pengguna sungguhan memicu pengklasifikasi untuk mengetahui apakah logging, percobaan ulang, dan UI Anda berfungsi. Anda harus memprovokasi jalur tersebut sendiri.

Apidog membuatnya praktis. Definisikan endpoint Claude Messages sekali, simpan kunci API Anda dalam variabel lingkungan, dan bangun skenario pengujian dari serangkaian kecil prompt kasus tepi: beberapa prompt yang berdekatan dengan keamanan dan biologi yang berada di dekat target pengklasifikasi, ditambah kontrol jinak yang seharusnya tidak pernah dialihkan. Kemudian verifikasi pada badan respons. Setiap pengujian memeriksa bidang model (apakah kontrol tetap pada claude-fable-5? apakah kasus tepi kembali dari claude-opus-4-8?) dan stop_reason (apakah ada yang menolak secara langsung?).

Jalankan skenario sesuai jadwal atau di CI. Ketika Anthropic melatih ulang pengklasifikasi, seperti yang dilakukan sebelum pengerahan ulang 1 Juli, suite Anda memberi tahu Anda dalam sehari apakah kasus tepi Anda masih berperilaku seperti yang diharapkan oleh kode penanganan Anda. Itu adalah pengaturan lima menit di Apidog dibandingkan kejutan produksi yang senyap.

FAQ

Apakah parameter fallback dikenakan biaya tambahan? Tidak. Permintaan yang ditolak sebelum menghasilkan output tidak akan ditagih. Jika model fallback menjawab, Anda membayar tarif per-token normal model tersebut untuk upaya penyelamatan. Anda tidak pernah ditagih dua kali untuk jawaban yang sama.

Apakah prompt terkait keamanan akan selalu memicu fallback? Tidak. Pengklasifikasi menargetkan permintaan berbahaya di keamanan siber, biologi dan kimia, serta distilasi model, bukan topiknya itu sendiri. Sebagian besar pekerjaan rekayasa keamanan melewati tanpa tersentuh; lebih dari 95% dari semua sesi tidak melihat fallback. Positif palsu memang terjadi di dekat domain-domain tersebut, itulah sebabnya Anda menguji jalur dan mencatat tingkatnya.

Saya beralih dari Fable 5 selama penangguhan bulan Juni. Apakah aman untuk kembali? Ya. Dengan pengerahan ulang 1 Juli, pengklasifikasi yang dilatih ulang telah aktif dan antarmuka API tidak berubah. Panduan kami tentang beralih kembali ke Fable 5 API menjelaskan cara mengaktifkannya kembali, dan parameter fallbacks adalah bagian yang paling sering ditambahkan oleh sebagian besar tim saat kembali.

Kesimpulan

Pengalihan Fable 5 adalah keputusan desain, bukan insiden, jadi perlakukanlah seperti itu dalam kode Anda. Periksa response.model pada setiap panggilan, pertahankan cabang penolakan bahkan dengan fallback diaktifkan, pilih untuk menggunakan parameter fallbacks kecuali Anda memiliki alasan untuk tidak melakukannya, dan pilih kebijakan untuk apa yang dilakukan produk Anda ketika Opus 4.8 menjawab. Kemudian buktikan seluruh jalur berfungsi: bangun suite kasus tepi di Apidog, verifikasi pada model dan stop_reason, dan jalankan sesuai jadwal. Unduh Apidog dan Anda dapat menjalankan suite penolakan sebelum penyebaran (deploy) Anda berikutnya.