Claude Sonnet 5 wurde am 30. Juni 2026 eingeführt, und der Preis ist die Schlagzeile. Sie erhalten eine Leistung, die Opus 4.8 bei agentischen und Tool-Nutzungsaufgaben nahekommt, und das zu einem Bruchteil der Kosten. Dieser Leitfaden liefert Ihnen die genauen Zahlen: den Einführungstarif, den Standardtarif, das Umstellungsdatum und ein Tokenizer-Detail, das Ihre tatsächliche Rechnung stillschweigend verändert. Sie erfahren auch, wie sich Sonnet 5 im Vergleich zu Opus 4.8 und Fable 5 schlägt, damit Sie das richtige Modell nicht nur nach der Leistungsfähigkeit, sondern auch nach den Kosten auswählen können. Wenn Sie beginnen, die API aufzurufen, ist Apidog der Ort, an dem Sie diese Anfragen senden, speichern und genau verfolgen können, wofür Sie bezahlen.
Das erhalten Sie: die Rate pro Token, ein durchgerechnetes Kostenbeispiel, eine Modell-für-Modell-Vergleichstabelle und eine kurze Checkliste zur Schätzung und Überwachung der Ausgaben, bevor sie Sie überraschen.

Claude Sonnet 5 Preise auf einen Blick
Sonnet 5 verwendet die gleiche Token-Rate wie sein Vorgänger, Sonnet 4.6. Am Listenpreis hat sich nichts geändert. Geändert hat sich der Einführungsrabatt, der für die ersten zwei Monate gilt.
| Tarif | Eingabe (pro 1 Mio. Tokens) | Ausgabe (pro 1 Mio. Tokens) | Gültig |
|---|---|---|---|
| Einführung | $2 | $10 | Bis 31. August 2026 |
| Standard | $3 | $15 | Ab 1. September 2026 |
Die Modell-ID ist claude-sonnet-5 ohne Datumsanhang. Diese einzelne Zeichenfolge senden Sie in der API-Anfrage, und sie wird zu diesen Raten abgerechnet.
Zwei Dinge, die Sie sich jetzt merken sollten:
- Der Einführungstarif (2 $ Eingabe / 10 $ Ausgabe) ist bis zum 31. August 2026 gültig. Danach wechselt er zum Standardtarif von 3 $ / 15 $.
- Der Standardtarif ist identisch mit dem von Sonnet 4.6. Wenn Sie bereits Sonnet 4.6 verwendet haben, steigt Ihr Preis pro Token bei der Migration nicht an.
Dieser letzte Punkt klingt nach einem klaren Gewinn. Das ist er größtenteils auch. Aber es gibt ein Tokenizer-Detail, das die Rechnung verändert und leicht zu übersehen ist.
Die Tokenizer-Falle: gleicher Preis, mehr Tokens
Sonnet 5 wird mit einem neuen Tokenizer ausgeliefert. Derselbe Eingabetext erzeugt etwa 30 % mehr Tokens als bei Sonnet 4.6, ungefähr das 1,3-fache. Dies ist keine API-Änderung. Die Anfragen-, Antwort- und Streaming-Strukturen sind identisch, und Sie müssen keinen neuen Code schreiben. Aber alles, was Sie in Tokens messen oder budgetieren, verschiebt sich.
Da Sie pro Token bezahlen, bedeuten mehr Tokens für denselben Text höhere Kosten für eine äquivalente Anfrage, obwohl sich die Rate pro Token nie geändert hat.
Hier ist ein durchgerechnetes Beispiel. Nehmen wir an, ein Prompt hatte 10.000 Tokens bei Sonnet 4.6.
- Bei Sonnet 4.6 mit $3 pro Million Eingabe-Tokens: 10.000 Tokens kosten etwa $0.030.
- Bei Sonnet 5 entspricht derselbe Text etwa 13.000 Tokens. Beim Einführungspreis von $2 pro Million Eingabe-Tokens: etwa $0.026.
- Bei Sonnet 5 zum Standardtarif von $3 pro Million Eingabe-Tokens (nach dem 31. August): etwa $0.039.
Während des Einführungszeitraums gleicht der Rabatt die zusätzlichen Tokens also ungefähr aus, und Sie zahlen möglicherweise etwa den gleichen Betrag oder etwas weniger. Sobald der Standardtarif in Kraft tritt, kostet derselbe Text mit 1,3-fachen Tokens mehr als bei Sonnet 4.6 zum gleichen Token-Tarif. Der Tarif ist fest. Die Rechnung nicht.
Dies wirkt sich auf mehr als nur die Kosten aus:
usage-Felder und Token-Zählergebnisse sind für denselben Text höher. Zählen Sie neu für Sonnet 5. Verwenden Sie Ihre alten Sonnet 4.6-Zählungen nicht wieder.- Das 1M-Token-Kontextfenster fasst im Durchschnitt weniger Text, da jedes Token nun weniger Text abdeckt.
max_tokens-Budgets, die Sie nahe Ihrer erwarteten Ausgabe dimensioniert haben, können abgeschnitten werden. Überprüfen Sie diese.
Die Quintessenz ist einfach: Modellieren Sie Ihre realen Arbeitslasten mit Token-Zählung auf Sonnet 5, bevor Sie von einer gleichbleibenden Parität ausgehen. Die Token-Zähldokumentation von Anthropic zeigt, wie man einen Prompt mit dem aktuellen Tokenizer misst. Für eine vollständige Schritt-für-Schritt-Anleitung eines ersten API-Aufrufs und wo der usage-Block zu lesen ist, siehe unseren Claude Sonnet 5 API-Leitfaden.
Wie sich Sonnet 5 im Vergleich zu Opus 4.8 und Fable 5 schlägt
Sonnet 5 ist als Arbeitspferd für große Volumina konzipiert. Der Wert wird am deutlichsten, wenn man es mit den darüber liegenden Modellen vergleicht. Alle drei teilen sich ein 1M-Token-Kontextfenster und eine maximale Ausgabe von 128K, der Unterschied liegt also im Preis und darin, wo jedes Modell seinen Wert hat.
| Modell | Modell-ID | Eingabe (pro 1 Mio.) | Ausgabe (pro 1 Mio.) |
|---|---|---|---|
| Sonnet 5 (Einführung) | claude-sonnet-5 |
$2 | $10 |
| Sonnet 5 (Standard) | claude-sonnet-5 |
$3 | $15 |
| Sonnet 4.6 | claude-sonnet-4-6 |
$3 | $15 |
| Opus 4.8 | claude-opus-4-8 |
$5 | $25 |
| Fable 5 | claude-fable-5 |
$10 | $50 |
Lesen Sie diese Tabelle unter Berücksichtigung der Benchmarks. Bei agentischen und Tool-Nutzungsaufgaben liegen die Startwerte von Anthropic für Sonnet 5 innerhalb von etwa 1 bis 3 Punkten von Opus 4.8. Die gemeldeten Zahlen umfassen SWE-bench Pro bei 63,2 % für Sonnet 5 gegenüber 69,2 % für Opus 4.8, Terminal-Bench 2.1 bei 80,4 % gegenüber 82,7 % und OSWorld-Verified bei 81,2 % gegenüber 83,4 %. Opus liegt bei reinem Reasoning um etwa 6 Punkte vorn, ohne auf Unterstützung angewiesen zu sein.
Die Kostenentscheidung läuft also auf Folgendes hinaus:
- Zum Standardtarif ist Sonnet 5 40 % günstiger bei der Eingabe und 40 % günstiger bei der Ausgabe als Opus 4.8, für eine Leistung, die Opus bei toolintensiven Arbeiten nahekommt.
- Fable 5 liegt bei $10 / $50, mehr als das Dreifache des Standard-Eingabetarifs von Sonnet 5. Sie greifen darauf zurück, wenn Sie das leistungsfähigste, weit verbreitete Modell von Anthropic benötigen, nicht für Agenten-Loops mit hohem Volumen.
- Im Vergleich zu Sonnet 4.6 zahlen Sie pro Token den gleichen Preis für bessere Coding- und Agenten-Scores, mit dem oben genannten Tokenizer-Vorbehalt.
Wenn Sie für eine bestimmte Aufgabe die Leistungsfähigkeit gegen den Preis abwägen, geht unsere Aufschlüsselung Sonnet 5 vs. Opus 4.8 die Entscheidung Aufgabe für Aufgabe durch. Für die Fable 5-Leistungsstufe sehen Sie den Fable 5 Preisleitfaden.
Anfragen testen und verfolgen, für die Sie mit Apidog bezahlen
Jeder Dollar auf Ihrer Sonnet 5-Rechnung entspricht einer HTTP-Anfrage: ein POST an die Messages API mit einem JSON-Body, einem API-Schlüssel und einer Antwort, für die Sie pro Token bezahlen. Wenn Sie diese Anfragen erraten, erraten Sie Ihre Kosten.

Apidog bietet Ihnen eine Plattform, um diese Anfragen real und wiederholbar zu machen:
- Senden Sie eine Sonnet 5-Anfrage und sehen Sie die exakte Antwort, einschließlich des
usage-Blocks, der Ihnen die Anzahl der Eingabe- und Ausgabe-Tokens pro Aufruf anzeigt. Das sind Ihre Kosten pro Anfrage, bevor Sie sie skalieren. - Speichern Sie die Anfrage in einer Sammlung, damit Ihr Team denselben Aufruf ausführt und nicht leicht unterschiedliche, die unterschiedlich abgerechnet werden.
- Speichern Sie Ihren API-Schlüssel als Umgebungsvariable und wechseln Sie zwischen Test- und Produktionsschlüsseln, ohne die Anfrage zu bearbeiten.
- Fügen Sie automatisierte Assertions hinzu, damit eine Prompt-Änderung, die die Ausgabelänge verdoppelt, in der CI und nicht auf der Rechnung erfasst wird.
- Mocken Sie den Endpunkt, damit Sie Ihre Integration erstellen und testen können, ohne bei jedem Entwicklungsdurchlauf echte Tokens auszugeben.
Hier ist eine erste Anfrage im Format der Anthropic Messages API. Senden Sie sie in Apidog, lesen Sie die usage-Felder in der Antwort, und Sie erhalten eine reale Kosten pro Aufruf-Zahl zum Multiplizieren.
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in two sentences."}
]
}'
Die Antwort enthält ein usage-Objekt mit input_tokens und output_tokens. Multiplizieren Sie diese mit den Raten in der obigen Tabelle, und Sie erhalten die Kosten für genau diesen Aufruf. Machen Sie das für Ihre echten Prompts, und Ihre Schätzung ist keine Vermutung mehr.
Laden Sie Apidog herunter, um Sonnet 5-Anfragen zu senden, die Token-Nutzung zu prüfen und die Anrufe, die Sie abrechnen, in einem Arbeitsbereich zu organisieren.
Häufig gestellte Fragen
Was kostet die Claude Sonnet 5 API?
Während des Einführungszeitraums bis zum 31. August 2026 kostet es $2 pro Million Eingabe-Tokens und $10 pro Million Ausgabe-Tokens. Ab dem 1. September 2026 wechselt es zum Standardtarif von $3 pro Million Eingabe-Tokens und $15 pro Million Ausgabe-Tokens.
Ist Sonnet 5 günstiger als Sonnet 4.6?
Die Token-Rate ist im Standard-Tier ($3 / $15) dieselbe wie bei Sonnet 4.6 und während des Einführungszeitraums niedriger. Aber der neue Tokenizer von Sonnet 5 erzeugt etwa 30 % mehr Tokens für denselben Text, sodass die Kosten einer äquivalenten Anfrage zum Standardtarif höher sein können. Zählen Sie die Tokens auf Sonnet 5, um Ihre tatsächliche Zahl zu sehen. Unser Sonnet 5 vs. Sonnet 4.6 Vergleich behandelt die Migrationsdetails.
Warum kostet derselbe Prompt auf Sonnet 5 mehr als auf Sonnet 4.6?
Die Token-Rate hat sich nicht geändert, aber der neue Tokenizer teilt denselben Text in etwa 1,3-mal so viele Tokens auf. Mehr Tokens zum gleichen Preis bedeuten höhere Kosten für äquivalenten Text, am deutlichsten sichtbar, sobald der Einführungsrabatt endet.
Wie verhält sich der Preis von Sonnet 5 im Vergleich zu Opus 4.8?
Opus 4.8 kostet $5 pro Million Eingabe-Tokens und $25 pro Million Ausgabe-Tokens, im Vergleich zu Sonnet 5s Standard von $3 / $15. Sonnet 5 liegt bei den von Anthropic gemeldeten agentischen Benchmarks innerhalb von etwa 1 bis 3 Punkten von Opus 4.8, sodass Sie bei toolintensiven Aufgaben eine vergleichbare Leistung zu einem niedrigeren Preis erhalten.
Gibt es günstigere Wege, Sonnet 5 zu betreiben?
Ja. Batch-Verarbeitung und Prompt-Caching senken die effektive Rate für geeignete Arbeitslasten. Die genauen reduzierten Raten finden Sie auf der Preisgestaltungsseite von Anthropic. Das korrekte Dimensionieren von max_tokens und das präzise Halten von Prompts senkt ebenfalls die Ausgabekosten, die das Fünffache der Eingaberate betragen.
