Sie rufen claude-fable-5 auf, die Antwort sieht normal aus, und dann überprüfen Sie das model-Feld: claude-opus-4-8. Ihre Anfrage hat einen Sicherheitsklassifikator ausgelöst, Fable 5 lehnte die Beantwortung ab, und ein anderes Modell sprang ein. Das ist kein Fehler. Es ist so, wie Fable 5 konzipiert ist, und Ihre Integration sollte dies absichtlich handhaben, nicht zufällig.
Wir haben die Gründe für diese Architektur in unserem Erklärartikel zu den Sicherheitsvorkehrungen von Fable 5 behandelt. Dieser Artikel ist der praktische Begleiter dazu. Sie erfahren, was eine Umleitung auslöst, wie Sie diese im Code erkennen, wie der Beta-Parameter fallbacks den Wiederholungsversuch automatisiert und wie Sie Ihre Ablehnungsbehandlung testen können, bevor ein echter Benutzer darauf stößt.

Warum Fable 5 einige Anfragen umleitet
Claude Fable 5 wird mit Sicherheitsklassifikatoren ausgeliefert, die eingehende Anfragen überprüfen. Sie überwachen drei Bereiche: Cybersicherheit, Biologie und Chemie sowie Modelldestillation. Wenn ein Klassifikator auslöst, lehnt Fable 5 die Anfrage ab. Auf Claudes Endnutzer-Oberflächen wird die Anfrage dann von Claude Opus 4.8 bearbeitet und der Benutzer wird darüber informiert. Bei der API liegt die Wiederherstellung in Ihrer Hand, und hier kommt der fallbacks-Parameter ins Spiel.

Die Klassifikatoren sind nicht statisch. Nach der Suspendierung im Juni hat Anthropic den Klassifikator gegen eine gemeldete Jailbreak-Technik neu trainiert; die aktualisierte Version blockiert mehr als 99 % der Versuche. Fable 5 wurde am 1. Juli 2026 mit dem neuen Klassifikator wieder in Betrieb genommen. Wenn Sie Ihre Integration während des Ausfalls pausiert haben, finden Sie in unserem Fable 5 ist zurück Hub den vollständigen Zeitplan und die Änderungen.
Ein weiterer Kontext hilft hier. Die Klassifikatoren sitzen vor dem Modell, nicht darin. Claude Mythos 5 ist dasselbe Modell ohne Klassifikatoren, und der Zugang ist auf Teilnehmer von Project Glasswing beschränkt. Mehr als 95 % der Fable-Sitzungen beinhalten keinerlei Fallback, und für diese Sitzungen ist die Leistung von Fable 5 praktisch identisch mit Mythos 5. Die Unterschiede haben wir in Fable 5 vs Mythos 5 aufgeschlüsselt.
Was eine Umleitung für Ihre App bedeutet
Fable 5 und Opus 4.8 sind beides starke Modelle, aber aus technischer Sicht nicht austauschbar. Fable 5 verwendet ein 1M Token Kontextfenster mit maximal 128K Output zu 10 $ pro Million Eingabe-Tokens und 50 $ pro Million Ausgabe-Tokens; Opus 4.8 hat seine eigene Preisgestaltung und sein eigenes Verhaltensprofil. Die Modellübersicht listet die aktuellen Spezifikationen für beide auf. Ein Prompt, den Sie für Fable 5 optimiert haben, kann auf Opus 4.8 zu unterschiedlichen Längen, unterschiedlicher Formatierung oder unterschiedlichen Tool-Calling-Mustern führen.
- Meistens nicht. Für Chat-Assistenten, Agenten und allgemeine Generierung ist eine Opus 4.8-Antwort eine gute Antwort. Mehr als 95 % der Sitzungen greifen niemals auf einen Fallback zurück, sodass der Gesamteffekt auf die Qualität gering ist.
- Es ist wichtig für Evaluierungen und festgelegte Pipelines. Wenn Sie gegen ein bestimmtes Modell benchmarken, verunreinigt eine stille Umleitung Ihre Daten. Dasselbe gilt für die strukturierte Extraktion mit Prompts, die auf das exakte Verhalten eines Modells abgestimmt sind.
- Es ist wichtig für die Kostenattribution und Compliance. Fallback-Versuche werden zu den Raten des tatsächlich verwendeten Modells abgerechnet, und einige Teams müssen aufzeichnen, welches Modell jede Ausgabe erzeugt hat.
- Es ist am wichtigsten in der Nähe der Auslösebereiche. Sicherheits-Tools und Arbeiten in den Biowissenschaften liegen nahe an den Zielen des Klassifikators, daher treten dort False Positives häufiger auf als anderswo. Wenn dies auf Sie zutrifft, behandeln Sie die Fallback-Behandlung als erstklassigen Code-Pfad, nicht als Edge Case.
Einen Fallback programmatisch erkennen
Das zuverlässige Signal ist das model-Feld der Antwort. Jede Messages API-Antwort benennt das Modell, das sie erzeugt hat, sodass eine Anfrage an claude-fable-5, die claude-opus-4-8 zurückgibt, umgeleitet wurde. Das ist ein Standardverhalten der Messages API; Sie benötigen keine Beta-Funktion, um dies zu lesen.
Zwei weitere Felder gehören in dieselbe Log-Zeile. stop_reason sagt Ihnen, ob die Anfrage direkt abgelehnt wurde: Eine abgelehnte Anfrage ohne Fallback-Behandlung gibt HTTP 200 mit stop_reason auf "refusal" gesetzt und keinen nutzbaren Inhalt zurück, also überprüfen Sie dies, bevor Sie response.content lesen. Und usage gibt Ihnen die Token-Anzahlen, die Sie benötigen, um die Kosten dem Modell zuzuordnen, das sie abgerechnet hat.
response = client.messages.create(
model="claude-fable-5",
max_tokens=16000,
messages=[{"role": "user", "content": prompt}],
)
if response.stop_reason == "refusal":
# Declined with no fallback configured: no usable content came back
handle_refusal(response)
elif not response.model.startswith("claude-fable-5"):
logger.info(
"fallback served_by=%s in=%d out=%d",
response.model,
response.usage.input_tokens,
response.usage.output_tokens,
)
Wenn Sie die API von Grund auf neu einrichten, beginnen Sie mit unserem Leitfaden wie man die Claude Fable 5 API verwendet und fügen Sie diese Überprüfung hinzu, sobald Ihre ersten Aufrufe funktionieren.
Der Fallbacks-Parameter
Ohne Fallback-Konfiguration stoppt eine abgelehnte API-Anfrage einfach. Sie erhalten die Ablehnung, Ihr Benutzer erhält nichts, und die Wiederholungslogik müssen Sie selbst schreiben. Der fallbacks-Parameter verschiebt diesen Wiederholungsversuch auf den Server: Wenn Fable 5 ablehnt, führt die API dieselbe Anfrage auf einem von Ihnen benannten Modell innerhalb desselben Aufrufs erneut aus und gibt die Antwort dieses Modells zurück.
Der Parameter befindet sich in der Beta-Phase der Claude API und der Claude Platform auf AWS, dokumentiert auf Anthropic’s Seite für Ablehnungen und Fallbacks. Sie aktivieren ihn mit einem Beta-Header, und zum Start ist das einzige unterstützte Fallback-Ziel claude-opus-4-8:
response = client.beta.messages.create(
model="claude-fable-5",
max_tokens=16000,
betas=["server-side-fallback-2026-06-01"],
fallbacks=[{"model": "claude-opus-4-8"}],
messages=[{"role": "user", "content": prompt}],
)
print(response.model) # claude-opus-4-8 if the request was rerouted
Die Abrechnung funktioniert zu Ihren Gunsten. Eine Anfrage, die abgelehnt wird, bevor eine Ausgabe generiert wurde, wird überhaupt nicht abgerechnet; der Rettungsversuch wird zu den eigenen Raten des Fallback-Modells abgerechnet. Die Erkennung bleibt dieselbe wie zuvor: response.model benennt das Modell, das geantwortet hat.
Einige Grenzen, die Sie kennen sollten. Der Parameter wird auf der Batches API abgelehnt und ist nicht auf Amazon Bedrock, Google Vertex AI oder Microsoft Foundry verfügbar; auf diesen Plattformen handhaben Sie Wiederholungsversuche clientseitig. Und wenn auch das Fallback-Modell ablehnt, enthält die endgültige Antwort stop_reason: "refusal", behalten Sie also den Ablehnungszweig aus dem vorherigen Abschnitt bei, selbst wenn Fallbacks aktiviert sind.
Ihre Handhabungsrichtlinie entwerfen
Erkennung und Wiederholung sind Mechanismen. Die eigentliche Entscheidung ist, was Ihr Produkt tut, wenn ein Fallback eintritt, und es gibt drei vernünftige Richtlinien:
- Die Opus-Antwort akzeptieren. Richtig für Chat-Produkte, Assistenten und die meisten Agenten. Aktivieren Sie
fallbacks, protokollieren Sie das Ereignis und fahren Sie fort. Ihr Benutzer erhält eine Antwort in einem Roundtrip statt eines Fehlers. - Erneut versuchen mit einer geänderten Anfrage. Richtig für Pipelines, bei denen die Modellkonsistenz wichtiger ist als die Latenz. Senden Sie denselben Prompt nicht erneut an Fable 5; der Klassifikator, der ihn einmal abgelehnt hat, wird ihn erneut ablehnen. Formulieren Sie die Anfrage um, um den Auslöser zu vermeiden, leiten Sie den gesamten Auftrag an Opus 4.8 weiter oder stellen Sie ihn zur manuellen Überprüfung in die Warteschlange.
- Es dem Benutzer anzeigen. Richtig, wenn Kunden speziell für Fable 5 bezahlen oder wenn die Compliance eine Offenlegung erfordert. Zeigen Sie an, welches Modell geantwortet hat, und lassen Sie den Benutzer entscheiden, ob er den Vorgang erneut ausführen möchte.
Welche Richtlinie Sie auch wählen, verfolgen Sie Ihre Fallback-Rate. Eine Rate nahe Null entspricht dem plattformweiten Basiswert. Eine Rate, die ein paar Prozent überschreitet, bedeutet, dass Ihre Prompts einen Auslösebereich streifen, und es lohnt sich, diese zu überprüfen, bevor das Volumen zunimmt.
Ablehnungspfade vor der Produktion testen
Die Fallback-Behandlung ist die Art von Code, die in der Demo funktioniert und sechs Wochen später versagt, weil Ablehnungen konstruktionsbedingt selten sind. Sie können nicht darauf warten, dass ein echter Benutzer den Klassifikator auslöst, um herauszufinden, ob Ihre Protokollierung, Wiederholungsversuche und Benutzeroberfläche alle richtig funktionieren. Sie müssen den Pfad selbst provozieren.
Apidog macht dies praktikabel. Definieren Sie den Claude Messages-Endpunkt einmal, speichern Sie Ihren API-Schlüssel in einer Umgebungsvariablen und erstellen Sie ein Testszenario aus einer kleinen Suite von Edge-Case-Prompts: eine Handvoll sicherheitsnaher und bio-naher Prompts, die sich in der Nähe der Ziele des Klassifikators befinden, plus gutartige Kontrollen, die niemals umleiten sollten. Überprüfen Sie dann den Antwortkörper. Jeder Test überprüft das model-Feld (blieb die Kontrolle bei claude-fable-5? Kam der Edge Case von claude-opus-4-8 zurück?) und den stop_reason (wurde etwas direkt abgelehnt?).
Führen Sie das Szenario nach einem Zeitplan oder in CI aus. Wenn Anthropic den Klassifikator neu trainiert, wie es vor der Wiederinbetriebnahme am 1. Juli der Fall war, sagt Ihnen Ihre Suite innerhalb eines Tages, ob Ihre Edge Cases sich immer noch so verhalten, wie Ihr Handhabungscode es erwartet. Das ist eine Fünf-Minuten-Einrichtung in Apidog gegenüber einer stillen Produktionsüberraschung.
FAQ
- Kostet der Fallbacks-Parameter extra? Nein. Eine Anfrage, die abgelehnt wird, bevor sie eine Ausgabe erzeugt, wird überhaupt nicht abgerechnet; der Rettungsversuch wird zu den eigenen Raten des Fallback-Modells abgerechnet. Sie werden niemals doppelt für dieselbe Antwort abgerechnet.
- Werden sicherheitsrelevante Prompts immer einen Fallback auslösen? Nein. Die Klassifikatoren zielen auf schädliche Anfragen in den Bereichen Cybersicherheit, Biologie und Chemie sowie Modelldestillation ab, nicht auf die Themen selbst. Die meisten Arbeiten im Bereich Sicherheits-Engineering werden unberührt durchgelassen; mehr als 95 % aller Sitzungen erfahren keinen Fallback. Falsch positive Ergebnisse treten in der Nähe dieser Bereiche auf, genau deshalb testen Sie den Pfad und protokollieren die Rate.
- Ich bin während der Suspendierung im Juni von Fable 5 gewechselt. Ist es sicher, zurückzukommen? Ja. Mit der Wiederinbetriebnahme am 1. Juli ist der neu trainierte Klassifikator live und die API-Oberfläche ist unverändert. Unser Leitfaden zum Zurückwechseln zur Fable 5 API führt Sie durch die erneute Aktivierung, und der
fallbacks-Parameter ist der Teil, den die meisten Teams beim Zurückwechseln hinzufügen.
Zusammenfassung
Die Umleitungen von Fable 5 sind eine Designentscheidung, kein Zwischenfall, also behandeln Sie sie auch so in Ihrem Code. Überprüfen Sie response.model bei jedem Aufruf, behalten Sie einen Ablehnungszweig bei, auch wenn Fallbacks aktiviert sind, entscheiden Sie sich für den fallbacks-Parameter, es sei denn, Sie haben einen Grund dagegen, und wählen Sie eine Richtlinie dafür, was Ihr Produkt tut, wenn Opus 4.8 antwortet. Dann beweisen Sie, dass der gesamte Pfad funktioniert: Erstellen Sie die Edge-Case-Suite in Apidog, überprüfen Sie model und stop_reason und führen Sie sie nach einem Zeitplan aus. Laden Sie Apidog herunter und Sie können die Ablehnungssuite noch vor Ihrem nächsten Deployment in Betrieb nehmen.
