Claude Sonnet 5 Preise: Die vollständige Kostenaufschlüsselung 2026

Claude Sonnet 5 Preisgestaltung erklärt: Einführung $2/$10 bis 31. August 2026, danach Standard $3/$15, plus die Tokenizer-Tücke, die Ihre tatsächlichen Kosten erhöht.

Ashley Innocent

Ashley Innocent

1 July 2026

Claude Sonnet 5 Preise: Die vollständige Kostenaufschlüsselung 2026

Apidog für Unternehmen

On-Premises Bereitstellung

SSO & RBAC

SOC 2 konform

Apidog Enterprise entdecken

Claude Sonnet 5 wurde am 30. Juni 2026 eingeführt, und der Preis ist die Schlagzeile. Sie erhalten eine Leistung, die Opus 4.8 bei agentischen und Tool-Nutzungsaufgaben nahekommt, und das zu einem Bruchteil der Kosten. Dieser Leitfaden liefert Ihnen die genauen Zahlen: den Einführungstarif, den Standardtarif, das Umstellungsdatum und ein Tokenizer-Detail, das Ihre tatsächliche Rechnung stillschweigend verändert. Sie erfahren auch, wie sich Sonnet 5 im Vergleich zu Opus 4.8 und Fable 5 schlägt, damit Sie das richtige Modell nicht nur nach der Leistungsfähigkeit, sondern auch nach den Kosten auswählen können. Wenn Sie beginnen, die API aufzurufen, ist Apidog der Ort, an dem Sie diese Anfragen senden, speichern und genau verfolgen können, wofür Sie bezahlen.

Button

Das erhalten Sie: die Rate pro Token, ein durchgerechnetes Kostenbeispiel, eine Modell-für-Modell-Vergleichstabelle und eine kurze Checkliste zur Schätzung und Überwachung der Ausgaben, bevor sie Sie überraschen.

Claude Sonnet 5 Preise auf einen Blick

Sonnet 5 verwendet die gleiche Token-Rate wie sein Vorgänger, Sonnet 4.6. Am Listenpreis hat sich nichts geändert. Geändert hat sich der Einführungsrabatt, der für die ersten zwei Monate gilt.

Tarif Eingabe (pro 1 Mio. Tokens) Ausgabe (pro 1 Mio. Tokens) Gültig
Einführung $2 $10 Bis 31. August 2026
Standard $3 $15 Ab 1. September 2026

Die Modell-ID ist claude-sonnet-5 ohne Datumsanhang. Diese einzelne Zeichenfolge senden Sie in der API-Anfrage, und sie wird zu diesen Raten abgerechnet.

Zwei Dinge, die Sie sich jetzt merken sollten:

Dieser letzte Punkt klingt nach einem klaren Gewinn. Das ist er größtenteils auch. Aber es gibt ein Tokenizer-Detail, das die Rechnung verändert und leicht zu übersehen ist.

Die Tokenizer-Falle: gleicher Preis, mehr Tokens

Sonnet 5 wird mit einem neuen Tokenizer ausgeliefert. Derselbe Eingabetext erzeugt etwa 30 % mehr Tokens als bei Sonnet 4.6, ungefähr das 1,3-fache. Dies ist keine API-Änderung. Die Anfragen-, Antwort- und Streaming-Strukturen sind identisch, und Sie müssen keinen neuen Code schreiben. Aber alles, was Sie in Tokens messen oder budgetieren, verschiebt sich.

Da Sie pro Token bezahlen, bedeuten mehr Tokens für denselben Text höhere Kosten für eine äquivalente Anfrage, obwohl sich die Rate pro Token nie geändert hat.

Hier ist ein durchgerechnetes Beispiel. Nehmen wir an, ein Prompt hatte 10.000 Tokens bei Sonnet 4.6.

Während des Einführungszeitraums gleicht der Rabatt die zusätzlichen Tokens also ungefähr aus, und Sie zahlen möglicherweise etwa den gleichen Betrag oder etwas weniger. Sobald der Standardtarif in Kraft tritt, kostet derselbe Text mit 1,3-fachen Tokens mehr als bei Sonnet 4.6 zum gleichen Token-Tarif. Der Tarif ist fest. Die Rechnung nicht.

Dies wirkt sich auf mehr als nur die Kosten aus:

Die Quintessenz ist einfach: Modellieren Sie Ihre realen Arbeitslasten mit Token-Zählung auf Sonnet 5, bevor Sie von einer gleichbleibenden Parität ausgehen. Die Token-Zähldokumentation von Anthropic zeigt, wie man einen Prompt mit dem aktuellen Tokenizer misst. Für eine vollständige Schritt-für-Schritt-Anleitung eines ersten API-Aufrufs und wo der usage-Block zu lesen ist, siehe unseren Claude Sonnet 5 API-Leitfaden.

Wie sich Sonnet 5 im Vergleich zu Opus 4.8 und Fable 5 schlägt

Sonnet 5 ist als Arbeitspferd für große Volumina konzipiert. Der Wert wird am deutlichsten, wenn man es mit den darüber liegenden Modellen vergleicht. Alle drei teilen sich ein 1M-Token-Kontextfenster und eine maximale Ausgabe von 128K, der Unterschied liegt also im Preis und darin, wo jedes Modell seinen Wert hat.

Modell Modell-ID Eingabe (pro 1 Mio.) Ausgabe (pro 1 Mio.)
Sonnet 5 (Einführung) claude-sonnet-5 $2 $10
Sonnet 5 (Standard) claude-sonnet-5 $3 $15
Sonnet 4.6 claude-sonnet-4-6 $3 $15
Opus 4.8 claude-opus-4-8 $5 $25
Fable 5 claude-fable-5 $10 $50

Lesen Sie diese Tabelle unter Berücksichtigung der Benchmarks. Bei agentischen und Tool-Nutzungsaufgaben liegen die Startwerte von Anthropic für Sonnet 5 innerhalb von etwa 1 bis 3 Punkten von Opus 4.8. Die gemeldeten Zahlen umfassen SWE-bench Pro bei 63,2 % für Sonnet 5 gegenüber 69,2 % für Opus 4.8, Terminal-Bench 2.1 bei 80,4 % gegenüber 82,7 % und OSWorld-Verified bei 81,2 % gegenüber 83,4 %. Opus liegt bei reinem Reasoning um etwa 6 Punkte vorn, ohne auf Unterstützung angewiesen zu sein.

Die Kostenentscheidung läuft also auf Folgendes hinaus:

Wenn Sie für eine bestimmte Aufgabe die Leistungsfähigkeit gegen den Preis abwägen, geht unsere Aufschlüsselung Sonnet 5 vs. Opus 4.8 die Entscheidung Aufgabe für Aufgabe durch. Für die Fable 5-Leistungsstufe sehen Sie den Fable 5 Preisleitfaden.

Anfragen testen und verfolgen, für die Sie mit Apidog bezahlen

Jeder Dollar auf Ihrer Sonnet 5-Rechnung entspricht einer HTTP-Anfrage: ein POST an die Messages API mit einem JSON-Body, einem API-Schlüssel und einer Antwort, für die Sie pro Token bezahlen. Wenn Sie diese Anfragen erraten, erraten Sie Ihre Kosten.

Apidog bietet Ihnen eine Plattform, um diese Anfragen real und wiederholbar zu machen:

Hier ist eine erste Anfrage im Format der Anthropic Messages API. Senden Sie sie in Apidog, lesen Sie die usage-Felder in der Antwort, und Sie erhalten eine reale Kosten pro Aufruf-Zahl zum Multiplizieren.

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in two sentences."}
    ]
  }'

Die Antwort enthält ein usage-Objekt mit input_tokens und output_tokens. Multiplizieren Sie diese mit den Raten in der obigen Tabelle, und Sie erhalten die Kosten für genau diesen Aufruf. Machen Sie das für Ihre echten Prompts, und Ihre Schätzung ist keine Vermutung mehr.

Laden Sie Apidog herunter, um Sonnet 5-Anfragen zu senden, die Token-Nutzung zu prüfen und die Anrufe, die Sie abrechnen, in einem Arbeitsbereich zu organisieren.

Häufig gestellte Fragen

Was kostet die Claude Sonnet 5 API?

Während des Einführungszeitraums bis zum 31. August 2026 kostet es $2 pro Million Eingabe-Tokens und $10 pro Million Ausgabe-Tokens. Ab dem 1. September 2026 wechselt es zum Standardtarif von $3 pro Million Eingabe-Tokens und $15 pro Million Ausgabe-Tokens.

Ist Sonnet 5 günstiger als Sonnet 4.6?

Die Token-Rate ist im Standard-Tier ($3 / $15) dieselbe wie bei Sonnet 4.6 und während des Einführungszeitraums niedriger. Aber der neue Tokenizer von Sonnet 5 erzeugt etwa 30 % mehr Tokens für denselben Text, sodass die Kosten einer äquivalenten Anfrage zum Standardtarif höher sein können. Zählen Sie die Tokens auf Sonnet 5, um Ihre tatsächliche Zahl zu sehen. Unser Sonnet 5 vs. Sonnet 4.6 Vergleich behandelt die Migrationsdetails.

Warum kostet derselbe Prompt auf Sonnet 5 mehr als auf Sonnet 4.6?

Die Token-Rate hat sich nicht geändert, aber der neue Tokenizer teilt denselben Text in etwa 1,3-mal so viele Tokens auf. Mehr Tokens zum gleichen Preis bedeuten höhere Kosten für äquivalenten Text, am deutlichsten sichtbar, sobald der Einführungsrabatt endet.

Wie verhält sich der Preis von Sonnet 5 im Vergleich zu Opus 4.8?

Opus 4.8 kostet $5 pro Million Eingabe-Tokens und $25 pro Million Ausgabe-Tokens, im Vergleich zu Sonnet 5s Standard von $3 / $15. Sonnet 5 liegt bei den von Anthropic gemeldeten agentischen Benchmarks innerhalb von etwa 1 bis 3 Punkten von Opus 4.8, sodass Sie bei toolintensiven Aufgaben eine vergleichbare Leistung zu einem niedrigeren Preis erhalten.

Gibt es günstigere Wege, Sonnet 5 zu betreiben?

Ja. Batch-Verarbeitung und Prompt-Caching senken die effektive Rate für geeignete Arbeitslasten. Die genauen reduzierten Raten finden Sie auf der Preisgestaltungsseite von Anthropic. Das korrekte Dimensionieren von max_tokens und das präzise Halten von Prompts senkt ebenfalls die Ausgabekosten, die das Fünffache der Eingaberate betragen.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen