Die Preise für Claude Fable 5 beginnen bei 10 US-Dollar pro Million Eingabetoken und 50 US-Dollar pro Million Ausgabetoken in der Anthropic API. Das ist die ganze Geschichte für die meisten Leute, die nur eine Zahl wollen, aber das Gesamtbild hat ein paar bewegliche Teile, die man kennen sollte, bevor man das Modell in Produktion nimmt. Fable 5 wurde am 9. Juni 2026 eingeführt, und Anthropic positioniert es als Modell, das „weniger als die Hälfte des Preises von Claude Mythos Preview“ kostet. Dieser Leitfaden erläutert jeden Kostenhebel: die API-Tarife, was Sie bei Pro- und Max-Plänen zahlen, drei durchgerechnete Beispiele mit realer Arithmetik und wie Fable 5 im Vergleich zu günstigeren Modellen wie Claude Opus 4.8 abschneidet. Wenn Sie nur eine schnelle Kostenprüfung benötigen, finden Sie diese im nächsten Abschnitt.
TL;DR
Claude Fable 5 kostet 10 US-Dollar pro Million Eingabetoken und 50 US-Dollar pro Million Ausgabetoken in der API. Vom 9. Juni bis einschließlich 22. Juni 2026 ist es in Pro-, Max-, Team- und sitzplatzbasierten Enterprise-Plänen kostenlos enthalten. Ab dem 23. Juni 2026 wird die Nutzung in diesen Plänen von gemessenen Nutzungsguthaben zu den gleichen Token-Raten von 10/50 US-Dollar abgezogen.
Claude Fable 5 Preise auf einen Blick
Hier sind die wichtigsten Zahlen in einer Tabelle. Die Spalte „pro 1.000 Token“ zeigt den gleichen Preis in einer kleineren Einheit, was praktisch ist, wenn Sie die Kosten einer einzelnen Anfrage grob abschätzen.
| Tokentyp | Preis pro 1 Mio. Token | Preis pro 1.000 Token | Anmerkungen |
|---|---|---|---|
| Eingabe | $10,00 | $0,01 | Alles, was Sie senden: Prompt, Systemnachricht, Kontext, Tool-Definitionen |
| Ausgabe | $50,00 | $0,05 | Alles, was das Modell generiert, einschließlich Begründung und Tool-Aufrufe |
Die API-Modell-ID ist claude-fable-5. Ausgabetoken kosten das Fünffache der Eingabetoken, was für Anthropic-Frontier-Modelle normal ist und den größten Teil der Optimierungsempfehlungen in diesem Beitrag prägt. Sie können die aktuellen Tarife jederzeit auf der Anthropic-Preisseite und in den Modell- und Preisdokumenten bestätigen.
Was Sie über die API bezahlen
Anthropic rechnet zwei Dinge separat ab, und Sie zahlen für beides.
Eingabetoken sind alles, was Sie bei einer Anfrage an das Modell senden. Dazu gehören Ihr Prompt-Text, die Systemnachricht, alle früheren Konversationsrunden, die Sie zur Kontextbildung wiedergeben, abgerufene Dokumente und das JSON für alle von Ihnen definierten Tools. Diese werden mit 10 US-Dollar pro Million oder einem Cent pro Tausend berechnet.

Ausgabetoken sind alles, was das Modell zurückgeneriert. Das ist die sichtbare Antwort plus jede interne Argumentation, die das Modell produziert, und alle Tool-Call-Argumente, die es schreibt. Diese werden mit 50 US-Dollar pro Million oder fünf Cent pro Tausend berechnet.
Eine einzelne Anfrage, die 2.000 Token sendet und 600 Token zurückerhält, kostet Sie also 2.000 Eingabetoken plus 600 Ausgabetoken, abgerechnet zu ihren separaten Raten. Es gibt keine pauschale Gebühr pro Anfrage zusätzlich. Ihre Rechnung ist rein die Summe der Eingabe- und Ausgabetoken über jeden von Ihnen getätigten Aufruf.
Anthropic beschreibt Fable 5 als „weniger als die Hälfte des Preises von Claude Mythos Preview“, was die Positionierung des Modells gegenüber der früheren Vorschau-Frontier-Stufe ist. Das eingeschränkte Schwestermodell, Claude Mythos 5, hat die identischen Eingabe- und Ausgaberaten von 10 US-Dollar und 50 US-Dollar, sodass ein Wechsel zwischen den beiden Ihre Kosten pro Token nicht ändert. Wenn Sie den konzeptionellen Hintergrund des Modells kennen möchten, bevor Sie dafür budgetieren, behandelt was ist Claude Fable 5 die Funktionsseite.
Pläne inklusive vs. Nutzungsguthaben
Die Preisgestaltung über die API ist eine Sache. Was Sie innerhalb eines Claude-Abonnementplans zahlen, folgt einem anderen Zeitplan, und die Daten sind wichtig.
Vom 9. Juni bis einschließlich 22. Juni 2026 ist Claude Fable 5 ohne zusätzliche Kosten in Pro-, Max-, Team- und sitzplatzbasierten Enterprise-Plänen enthalten. In diesem Zeitraum können Sie das Modell in diesen Plänen nutzen, ohne dass es auf ein gemessenes Guthaben angerechnet wird. Dies ist eine Einführungsaktion und kein Dauerzustand.
Am 23. Juni 2026 wird Fable 5 aus dem enthaltenen Umfang dieser Pläne entfernt. Nach diesem Datum wird die Nutzung von Fable 5 auf Pro-, Max-, Team- oder sitzplatzbasierten Enterprise-Plänen von Nutzungsguthaben abgezogen, was bedeutet, dass es zu den gleichen Raten von 10 US-Dollar Eingabe und 50 US-Dollar Ausgabe pro Million Token gemessen wird, die Sie bei der reinen API zahlen würden. Anthropic hat angekündigt, den Standard-Planzugriff wiederherzustellen, wenn die Kapazität dies zulässt, sodass sich der Zustand nach dem 23. Juni möglicherweise später entspannen könnte, aber das kreditgesteuerte Verhalten ist das, wofür Sie jetzt budgetieren sollten.
Verbrauchsbasierte Enterprise-Pläne sind anders. Fable 5 ist dort ab dem Start vollständig verfügbar, ohne dass Sie sich um ein Inklusionsfenster kümmern müssen, da diese Pläne von Anfang an nach Nutzung abrechnen. Wenn Ihre Zugangsfrage über die Abrechnung hinausgeht, zeigt wie man auf Claude Fable 5 zugreift jeden Einstiegspunkt auf.
Die praktische Erkenntnis: Wenn Sie diese Woche auf einem Pro- oder Max-Sitz Prototypen entwickeln, haben Sie bis zum 22. Juni freie Hand. Planen Sie Ihre umfangreicheren Experimente entsprechend, und wenn Sie dauerhaften Produktionsverkehr erwarten, kalkulieren Sie Ihre Kosten anhand der API-Raten von 10/50 US-Dollar und nicht anhand des kostenlosen Zeitfensters, denn das ist es, worauf Sie sich einstellen werden.
Durchgerechnete Beispiele: Was eine reale Arbeitslast kostet
Zahlen pro Million Token sind abstrakt. Hier sind drei konkrete Arbeitslasten mit der ausgeführten Arithmetik, damit Sie Ihre eigene Nutzung darauf abbilden können.
Die Formel ist jedes Mal dieselbe: (Eingabetoken / 1.000.000) * $10 plus (Ausgabetoken / 1.000.000) * $50.
Beispiel 1: Eine Runde eines Support-Chatbots
Eine typische Kundensupport-Runde enthält einige Systemanweisungen und eine kurze Konversationshistorie und liefert dann eine fokussierte Antwort. Sagen wir 1.500 Eingabetoken und 500 Ausgabetoken.
- Eingabe: 1.500 / 1.000.000 * $10 = $0,015
- Ausgabe: 500 / 1.000.000 * $50 = $0,025
- Gesamt: $0,04 pro Runde
Vier Cent pro Runde. Wenn dieser Chatbot 1.000 Runden pro Tag bearbeitet, liegen Sie bei ungefähr $40/Tag oder etwa $1.200/Monat, noch bevor Sie die Kostenhebel im nächsten Abschnitt berücksichtigen. Das ist ein nützlicher Realitätscheck: Chat-ähnliche Arbeitslasten auf Fable 5 bleiben pro Anruf günstig, summieren sich aber bei hohem Volumen.
Beispiel 2: Eine Code-Generierungsanfrage
Die Code-Generierung sendet in der Regel mehr Kontext: die Datei, die Sie bearbeiten, verwandte Snippets und Anweisungen. Sagen wir 8.000 Eingabetoken und 3.000 Ausgabetoken für eine umfangreiche generierte Funktion mit Erklärung.
- Eingabe: 8.000 / 1.000.000 * $10 = $0,08
- Ausgabe: 3.000 / 1.000.000 * $50 = $0,15
- Gesamt: $0,23 pro Anfrage
Beachten Sie, dass, obwohl Sie fast dreimal mehr Eingabe als Ausgabe gesendet haben, die Ausgabe mit $0,15 von den $0,23 immer noch den Großteil der Rechnung ausmacht. Dieses 5:1-Preisverhältnis von Ausgabe zu Eingabe ist der Grund, warum das Kürzen ausführlicher Generierungen echtes Geld spart.
Beispiel 3: Ein langfristiger Agentenlauf
Agentenläufe, die große Codebasen oder Dokumente lesen und viele Schritte ausführen, treiben die Eingabe stark in die Höhe. Sagen wir 300.000 Eingabetoken (viel abgerufener Kontext, der über mehrere Schritte wiedergegeben wird) und 50.000 Ausgabetoken.
- Eingabe: 300.000 / 1.000.000 * $10 = $3,00
- Ausgabe: 50.000 / 1.000.000 * $50 = $2,50
- Gesamt: $5,50 pro Lauf
Ein einziger tiefer Agentenlauf kostet etwa fünfeinhalb Dollar. Wenn Sie das 200 Mal am Tag in einem Team durchführen, liegen Sie bei $1.100/Tag. Dies ist genau die Arbeitslast, bei der Prompt-Caching sich auszahlt, da Agenten denselben großen Kontext wiederholt abspielen. Wir werden dies als Nächstes quantifizieren.
Wie Sie Ihre Claude Fable 5 Rechnung reduzieren können
Sobald Sie entschieden haben, dass Fable 5 das richtige Modell ist, sind dies die Standardfunktionen der Anthropic API, die die Kosten senken. Keine davon erfordert speziellen Zugang.
- Prompt-Caching. Cache-Lesevorgänge kosten etwa das 0,1-fache des Eingabepreises, sodass gecachte Eingaben etwa $1 pro Million statt $10 kosten. Cache-Schreibvorgänge kosten etwa das 1,25-fache der Eingabe (etwa $12,50 pro Million für die 5-Minuten-TTL), sodass sich das Caching auszahlt, wenn Sie denselben Kontext über viele Anfragen hinweg wiederverwenden. Nehmen Sie den Agentenlauf aus Beispiel 3: Wenn 250.000 der 300.000 Eingabetoken ein stabiler, aus dem Cache bereitgestellter Kontext sind, sinkt diese Eingabe von $3,00 auf etwa $0,25 (250.000 gecachte Lesevorgänge bei $1/M = $0,25, plus 50.000 neue Eingaben bei $10/M = $0,50). Der gesamte Lauf sinkt von $5,50 auf etwa $3,25. Für Agenten und Chatbots, die einen großen System-Prompt wiedergeben, ist Caching die größte Kostenänderung, die Sie vornehmen können.
- Batches API. Für Arbeiten, die keine sofortige Antwort erfordern, wie die nächtliche Dokumentenverarbeitung oder Massenklassifizierung, läuft die Batches API mit etwa 50 % Rabatt. Das verwandelt die 10/50-$-Raten in etwa 5/25-$, was Opus-Tier-Preise für Fable-Tier-Ausgabe sind. Wenn Ihr Job eine Verzögerung toleriert, ist das fast wie geschenktes Geld.
- Modell richtig dimensionieren. Nicht jede Anfrage benötigt Fable 5. Leiten Sie die schwierigen, neuartigen Schlussfolgerungen an Fable und den Routineverkehr an Opus 4.8, Sonnet 4.6 oder Haiku 4.5. Ein gestufter Router, der 80 % der Anrufe an ein günstigeres Modell sendet, kann eine Rechnung allein um mehr als die Hälfte reduzieren.
max_tokenskürzen. Die Ausgabe ist mit $50 pro Million die teure Seite. Setzen Siemax_tokensauf das, was die Aufgabe tatsächlich benötigt, anstatt es weit offen zu lassen, und fordern Sie prägnante Antworten im Prompt an. Eine Generierung von 3.000 Token auf 1.500 Token zu kürzen, halbiert die Ausgabekosten dieses Aufrufs.- Antworten streamen. Streaming ändert den Preis pro Token nicht, aber es ermöglicht Ihnen, die Generierung frühzeitig zu stoppen, sobald Sie haben, was Sie benötigen, und es verbessert die wahrgenommene Latenz, sodass Sie weniger dazu verleitet sind, übermäßig viele Anfragen zu stellen. In Kombination mit einem engen
max_tokenshält es die Ausgaben für die Ausgabe im Rahmen.
Claude Fable 5 Ausgaben mit Apidog verfolgen
Der sauberste Weg, die Token-Kosten während der Entwicklung sichtbar zu halten, ist, sie bei jeder Anfrage zu überwachen, nicht erst am Ende des Monats, wenn die Rechnung kommt. Apidog ist ein API-Client, mit dem Sie Anfragen an die Anthropic API senden und genau überprüfen können, was zurückkommt.

Wenn Sie claude-fable-5 über Apidog aufrufen, enthält der Antworttext ein usage-Objekt mit input_tokens und output_tokens für diese Anfrage. Das Ablesen dieser beiden Zahlen verrät Ihnen die genauen Kosten des Aufrufs: Multiplizieren Sie Eingabetoken mit $0,00001 und Ausgabetoken mit $0,00005, addieren Sie diese, und Sie haben die Rechnung für diese Anfrage bis auf einen Bruchteil eines Cents genau. Dies während der Iteration an Prompts zu tun, zeigt Ihnen sofort, wenn eine Änderung Ihre Token-Anzahl in die Höhe treibt, lange bevor sie in der Produktion sichtbar wird.
Ein praktischer Workflow: Richten Sie die Anthropic Chat Completions-Anfrage in Apidog ein, speichern Sie ein paar repräsentative Prompts als Beispiele und vergleichen Sie die usage-Zahlen über verschiedene Prompt-Variationen hinweg. Sie werden schnell sehen, welche Systemnachrichten-Bearbeitungen Hunderte von Eingabetoken hinzufügen und welche Änderungen am Antwortformat die Ausgabe aufblähen. Diese Feedback-Schleife ist allein über das Dashboard schwer zu erhalten. Laden Sie Apidog herunter, um dies einzurichten, und kombinieren Sie es mit dem Claude Fable 5 API-Leitfaden für die Anfragestruktur. Wenn Sie das Budget genau im Auge behalten, behandelt wie man Claude Fable 5 kostenlos nutzt die kostenlosen Wege während des Inklusionsfensters.
Apidog speichert auch eine Anfragehistorie, sodass Sie bei der Schätzung der Kosten einer neuen Funktion auf frühere Aufrufe und deren Token-Anzahlen zurückblicken können. Die Verwendung von Apidog als Ihre Kosteninspektionsschicht während der Entwicklung bedeutet, dass es keine Token-Überraschungen gibt, wenn der Traffic skaliert.
Die Preise für Claude Fable 5 reduzieren sich auf ein einfaches Zahlenpaar: $10 Eingabe und $50 Ausgabe pro Million Token, mit einem kostenlosen Planfenster bis zum 22. Juni und gemessenen Guthaben nach dem 23. Juni. Der Rest ist Arbeitslast-Mathematik und ein paar Kostenhebel: Cachen Sie Ihren stabilen Kontext, fassen Sie das zusammen, was nicht dringend ist, und wechseln Sie zu Opus 4.8 oder Sonnet 4.6, wenn die Aufgabe nicht die Frontier-Stufe benötigt. Ihr nächster Schritt ist, eine einzelne claude-fable-5-Anfrage einzurichten und das usage-Objekt zu lesen, damit Ihre Schätzungen auf tatsächlichen Token-Anzahlen basieren. Laden Sie Apidog herunter, um diese erste Anfrage zu senden und die Kosten in Echtzeit zu beobachten.
