Was ist Claude Sonnet 5? Funktionen, Benchmarks und Preise

Claude Sonnet 5 ist Anthropic’s neuestes Mid-Tier-Modell, das am 30. Juni 2026 veröffentlicht wurde. Anthropic bezeichnet es als „die beste Kombination aus Geschwindigkeit und Intelligenz“ und „das bisher agentischste Sonnet-Modell.“ Kurz gesagt: Es erreicht bei agentischen Aufgaben und Tool-Nutzung fast die Leistung von Opus 4.8, kostet aber deutlich weniger. Dieser Leitfaden behandelt, was Sonnet 5 ist, seine vollständigen Spezifikationen, die Launch-Benchmarks, Preise, Verfügbarkeit und für wen es gedacht ist. Wenn Sie planen, das Modell über HTTP aufzurufen, können Sie diese Anfragen währenddessen in Apidog testen.

Schaltfläche

Jeder Abschnitt hier verweist auf einen fokussierten Deep Dive, betrachten Sie diese Seite also als Karte und folgen Sie den Links, wenn Sie Details zur API, zur Preisgestaltung oder einen direkten Vergleich mit Opus 4.8 benötigen.

Was Claude Sonnet 5 ist

Claude Sonnet 5 ist der Nachfolger von Claude Sonnet 4.6. Seine API-Modell-ID ist die exakte Zeichenfolge claude-sonnet-5, ohne Datumssuffix. Es gehört zur Sonnet-Stufe, die Anthropic zwischen den kleineren Haiku-Modellen und den größeren Opus- und Fable-Modellen positioniert.

Die Hauptgeschichte handelt vom Wert. Bei Aufgaben, bei denen das Modell Tools verwendet, in einer Schleife läuft oder als Agent agiert, liegt Sonnet 5 nur wenige Punkte hinter Opus 4.8. Beim reinen Denken ohne externe Hilfsmittel ist Opus immer noch führend. Sonnet 5 ist also das Modell der Wahl, wenn Sie eine starke agentische Leistung wünschen, ohne die Preise von Opus zu zahlen.

Es ist auch ein Drop-in-Upgrade für Sonnet 4.6. Sie ändern die Modell-ID und überprüfen dann drei Verhaltensänderungen und eine Tokenizer-Änderung. Diese behandeln wir weiter unten und im speziellen Vergleich Sonnet 5 vs Sonnet 4.6.

Volle Spezifikationen

Hier ist, was Sie mit claude-sonnet-5 erhalten:

Spezifikation	Wert
Kontextfenster	1.000.000 Tokens (1M)
Max. Ausgabe	128.000 Tokens (128K)
Adaptives Denken	Standardmäßig aktiviert
Aufwandsparameter	low / medium / high / xhigh
Vision, Prompt-Caching, Tool-Nutzung, Batch-Verarbeitung, strukturierte Ausgaben	Unterstützt
Prioritätsstufe	Nicht verfügbar
Keine Datenaufbewahrung (ZDR)	Für Organisationen mit einer ZDR-Vereinbarung unterstützt

Ein paar Anmerkungen dazu:

Das 1M Kontextfenster ist sowohl die Standardeinstellung als auch das Maximum. Es gibt keine kleinere Kontextvariante zur Auswahl.
Adaptives Denken ist standardmäßig aktiviert. Dies ist eine Änderung gegenüber Sonnet 4.6, wo das Senden keines thinking-Feldes bedeutete, dass überhaupt kein Denken stattfand.
Der Aufwandsparameter steuert, wie stark das Modell denkt und wie viel es ausgibt. Sie stellen ihn auf low, medium, high oder xhigh ein, je nachdem, wie intensiv das Modell arbeiten soll.
Der Funktionsumfang entspricht Sonnet 4.6, mit einer Ausnahme: Priority Tier ist bei Sonnet 5 nicht verfügbar.

Für die vollständige Anfrages- und Antwortstruktur siehe den Schritt-für-Schritt-API-Leitfaden und Anthropic’s Modellübersicht.

Die drei Verhaltensänderungen und der neue Tokenizer

Wenn Sie von Sonnet 4.6 wechseln, haben sich auf API-Ebene drei Dinge geändert. Wenn Sie diese übersehen, können Ihre Anfragen einen 400-Fehler zurückgeben oder sich anders verhalten als zuvor.

Adaptives Denken ist standardmäßig aktiviert. Anfragen ohne thinking-Feld werden jetzt mit adaptivem Denken ausgeführt. Um es zu deaktivieren, senden Sie thinking: {type: "disabled"}. Da max_tokens die gesamte Ausgabe (Denk-Tokens plus Antworttext) begrenzt, überprüfen Sie max_tokens für Workloads, die zuvor ohne Denken ausgeführt wurden.
Manuelles erweitertes Denken wurde entfernt. Das Senden von thinking: {type: "enabled", budget_tokens: N} führt nun zu einem 400-Fehler. Verwenden Sie stattdessen adaptives Denken und den Aufwandsparameter.
Sampling-Parameter werden nicht akzeptiert. Das Setzen von temperature, top_p oder top_k auf einen nicht standardmäßigen Wert führt zu einem 400-Fehler. Entfernen Sie diese bei der Migration. Steuern Sie das Verhalten stattdessen über Anweisungen im System-Prompt.

Das Vorabfüllen von Assistenten-Nachrichten wird weiterhin nicht unterstützt und führt zu einem 400-Fehler, genau wie bei Sonnet 4.6. Verwenden Sie strukturierte Ausgaben oder System-Prompt-Anweisungen, um die Antwort zu gestalten.

Es gibt noch eine weitere Änderung, die leicht zu übersehen ist, da sie die API-Struktur nicht betrifft. Sonnet 5 verwendet einen neuen Tokenizer. Derselbe Eingabetext erzeugt ungefähr 30 % mehr Tokens als bei Sonnet 4.6, etwa 1,3-mal so viele. Nichts an Ihrer Anfrage, Antwort oder dem Streaming-Code ändert sich. Aber alles, was Sie in Tokens messen oder budgetieren, verschiebt sich:

Die `usage`-Felder und Token-Zählergebnisse sind für denselben Text höher. Zählen Sie gegen Sonnet 5 neu, anstatt Ihre 4.6-Werte wiederzuverwenden.
Das 1M-Fenster fasst im Durchschnitt weniger Text, da jedes Token nun weniger Text abdeckt.
`max_tokens`-Budgets, die nahe an Ihrer erwarteten Ausgabe bemessen sind, können nun gekürzt werden. Überprüfen Sie diese.
Die Kosten pro Anfrage für äquivalenten Text können steigen, auch wenn der Preis pro Token nicht geändert wurde.

Die „Was ist neu“-Seite dokumentiert jede dieser Änderungen, und die Token-Zähl-Dokumentation zeigt, wie man sie misst.

Benchmark-Momentaufnahme

Die untenstehenden Zahlen sind die von Anthropic zum Zeitpunkt des Launches gemeldeten Werte. Sie werden in den Berichten zum Starttag bestätigt, daher sollten Sie sie als gemeldete Ergebnisse und nicht als unabhängige Tests betrachten.

Benchmark	Sonnet 5	Opus 4.8	Sonnet 4.6
SWE-bench Pro (agentisches Programmieren)	63,2 %	69,2 %	58,1 %
Terminal-Bench 2.1	80,4 %	82,7 %	Nicht gemeldet
OSWorld-Verified (Computernutzung)	81,2 %	83,4 %	78,5 %

Das Muster ist konsistent. Mit Tools in der Schleife liegt Sonnet 5 nur etwa 1 bis 3 Punkte hinter Opus 4.8. Beim reinen Denken ohne Hilfsmittel ist Opus um etwa 6 Punkte voraus. Sonnet 5 ist bei agentischen Aufgaben und Tool-Nutzung stärker als beim reinen Denken.

Im Vergleich zu seinem Vorgänger verbessert sich Sonnet 5 deutlich: SWE-bench Pro steigt von 58,1 % auf 63,2 %, und OSWorld-Verified klettert von 78,5 % auf 81,2 %.

Die vollständige Aufschlüsselung, einschließlich dessen, was diese Benchmarks nicht erfassen, finden Sie im Sonnet 5 Benchmarks Deep Dive. Sie können auch Anthropic’s Transparenz-Hub für die zugrunde liegenden Zahlen überprüfen.

Preisgestaltung

Sonnet 5 behält den gleichen Preis pro Token wie Sonnet 4.6 bei und wurde mit einem Einführungsrabatt gestartet.

Preisgestaltung	Eingabe (pro M Tokens)	Ausgabe (pro M Tokens)
Einführungspreis (bis 31. August 2026)	$2	$10
Standard (ab 1. September 2026)	$3	$15

Der Einführungspreis von 2 $ pro Million Eingabe-Tokens und 10 $ pro Million Ausgabe-Tokens gilt bis zum 31. August 2026. Danach wechselt er zum Standardpreis von 3 $ pro Million Eingabe-Tokens und 15 $ pro Million Ausgabe-Tokens, was Sonnet 4.6 entspricht.

Es gibt einen Haken, den man berücksichtigen sollte. Da der neue Tokenizer für denselben Text etwa 30 % mehr Tokens erzeugt, können die Kosten für eine äquivalente Anfrage höher sein als bei Sonnet 4.6, auch wenn der Preis pro Token identisch ist. Gehen Sie nicht von einer pauschalen Gleichheit aus. Modellieren Sie Ihre tatsächlichen Workloads mit Token-Zählung, bevor Sie ein Budget festlegen.

Zum Vergleich: Opus 4.8 kostet 5 $ pro Million Eingabe-Tokens und 25 $ pro Million Ausgabe-Tokens, und Fable 5 kostet 10 $ pro Million Eingabe-Tokens und 50 $ pro Million Ausgabe-Tokens. Sonnet 5 liegt deutlich unter beiden. Für Batch- und Prompt-Caching-Raten prüfen Sie Anthropic’s Preisseite, anstatt sich auf sekundäre Angaben zu verlassen. Der vollständige Preisüberblick enthält ein durchgerechnetes Beispiel.

Verfügbarkeit

Sonnet 5 ist in Anthropic’s eigenen Produkten und den großen Cloud-Plattformen verfügbar:

Claude API: für alle Kunden verfügbar.
Claude-Apps: das Standardmodell für Free und Pro, und auch für Max, Team und Enterprise verfügbar.
Claude Code: verfügbar.
AWS: über Claude in Amazon Bedrock und die Claude-Plattform auf AWS. Nicht über den älteren Bedrock InvokeModel- oder Converse-Pfad.
Google Cloud: auf Vertex AI verfügbar.
Microsoft Foundry: in der Vorschau.

Da Sonnet 5 das Standardmodell im kostenlosen Claude-Plan ist, können die meisten Leute es ohne Bezahlung ausprobieren. Der Leitfaden für kostenlosen Zugang behandelt die ehrlichen kostenlosen Wege und ihre Grenzen.

Sicherheitszusammenfassung

Anthropic’s Systemkarte berichtet über eine geringere Gesamtrate unerwünschter Verhaltensweisen als bei Sonnet 4.6, und das Modell ist in agentischen Kontexten sicherer. Es zeigt eine geringere Halluzinations- und Sycophantie-Rate als Sonnet 4.6 und ist besser darin, bösartige Anfragen abzulehnen und Prompt-Injection zu widerstehen.

Sonnet 5 ist auch das erste Sonnet-Tier-Modell mit Echtzeit-Cybersicherheits-Schutzmaßnahmen. Anfragen, die verbotene oder hochriskante Cyberthemen betreffen, können abgelehnt werden. Eine Ablehnung wird als erfolgreicher HTTP 200 mit stop_reason: "refusal" zurückgegeben, nicht als Fehler, daher sollten Sie diesen Stoppgrund in Ihrem Code behandeln.

Um die Kompromisse fair zu beurteilen: Sonnet 5 zeigt höhere Raten von fehlangepasstem Verhalten als Opus 4.8 und Mythos Preview bei Anthropic’s automatisiertem Verhaltensaudi, und es hat eine geringere Cyber-Fähigkeit als die Opus-Modelle. Keines der Sonnet-Modelle konnte einen funktionierenden Exploit entwickeln, beide erzielten 0,0 % bei dieser Messung.

Testen Sie die Sonnet 5 API mit Apidog

Wenn Sie Sonnet 5 aufrufen, greifen Sie auf eine HTTP-API mit Authentifizierungs-Headern, JSON-Anfrage- und Antwort-Bodies, Ratenbegrenzungen und Fehlern zu. Genau für solche Aufgaben ist Apidog konzipiert. Apidog ist eine All-in-One-Plattform für die API-Entwicklung und -Tests, sodass Sie Sonnet 5-Anfragen senden, diese als wiederverwendbare Sammlung speichern und Ihre Schlüssel pro Umgebung verwalten können.

Ein praktisches Setup sieht wie folgt aus:

Erstellen Sie eine Anfrage an den Anthropic Messages-Endpunkt und speichern Sie Ihren API-Schlüssel als Umgebungsvariable, nicht im Anfragekörper.
Speichern Sie die Anfrage in einer Sammlung, damit Ihr Team sie wiederverwenden kann.
Fügen Sie eine Behauptung hinzu, um die Antwortform zu überprüfen, zum Beispiel dass `stop_reason` vorhanden ist, damit ein `refusal`-Ergebnis nicht unbemerkt bleibt.
Mocken Sie den Endpunkt, wenn Sie gegen eine stabile Antwort entwickeln möchten, ohne Tokens auszugeben.

Hier ist die Form der Messages API, die Sie senden würden:

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in one sentence."}
    ]
  }'

Da adaptives Denken standardmäßig aktiviert ist, wird diese Anfrage mit Denken ausgeführt, es sei denn, Sie fügen thinking: {type: "disabled"} hinzu. Denken Sie daran, dass max_tokens das Denken und den Antworttext zusammen begrenzt, also geben Sie ihm genügend Raum. Sobald Ihre Anfrage funktioniert, speichern Sie sie und fügen Sie einen Test hinzu, um Regressionen beim späteren Modellwechsel abzufangen. Wenn Sie mitmachen möchten, laden Sie Apidog herunter und importieren Sie die Anfrage. Der vollständige API-Walkthrough enthält den vollständigen Ablauf, einschließlich der Python SDK-Version.

Für wen Sonnet 5 gedacht ist

Sonnet 5 ist in vielen Situationen eine gute Standardwahl:

Sie entwickeln Agenten oder toollastige Workflows. Hier glänzt Sonnet 5 und bleibt nahe an Opus 4.8.
Sie arbeiten mit hohem Volumen und achten auf die Kosten. Der Preisunterschied zu Opus ist groß, und der Einführungspreis macht ihn bis August noch größer.
Sie möchten ein Drop-in-Upgrade von Sonnet 4.6. Tauschen Sie die Modell-ID aus, überprüfen Sie die drei Verhaltensänderungen und messen Sie Ihre Tokens neu.
Sie programmieren in Claude Code oder einem Editor. Sonnet 5 ist ein starker Standard für agentisches Programmieren. Sehen Sie, wie Sie es in Claude Code verwenden können.

Greifen Sie stattdessen zu Opus 4.8, wenn Sie das härteste reine Denken, langzeitige Autonomie oder die absolut höchste Qualität benötigen und die zusätzlichen Kosten es wert sind. Der Vergleich Sonnet 5 vs. Opus 4.8 legt diese Entscheidung detailliert dar. Für Hintergrundinformationen zur Opus-Ebene selbst siehe was Claude Opus 4.8 ist.

FAQ

Ist Claude Sonnet 5 besser als Opus 4.8? Das hängt von der Aufgabe ab. Bei agentischen Aufgaben und Tool-Nutzungs-Benchmarks liegt Sonnet 5 nur etwa 1 bis 3 Punkte hinter Opus 4.8, zu einem viel niedrigeren Preis. Beim reinen Denken ist Opus 4.8 um etwa 6 Punkte voraus. Wählen Sie Sonnet 5 für Agenten und hohes Volumen, und Opus 4.8 für das schwierigste Denken. Der direkte Vergleich schlüsselt dies auf.

Wie lautet die Modell-ID für Claude Sonnet 5? Die API-Modell-ID ist claude-sonnet-5, ohne Datumssuffix. Setzen Sie diese Zeichenfolge als `model`-Wert in Ihrer Anfrage.

Wie viel kostet Claude Sonnet 5? Der Einführungspreis beträgt 2 $ pro Million Eingabe-Tokens und 10 $ pro Million Ausgabe-Tokens bis zum 31. August 2026. Danach wechselt er zum Standardpreis von 3 $ pro Million Eingabe-Tokens und 15 $ pro Million Ausgabe-Tokens. Beachten Sie, dass der neue Tokenizer für denselben Text etwa 30 % mehr Tokens erzeugt, sodass eine äquivalente Anfrage selbst zum gleichen Token-Preis mehr kosten kann.

Kann ich Claude Sonnet 5 kostenlos nutzen? Ja. Sonnet 5 ist das Standardmodell im kostenlosen Claude-Plan unter claude.ai und im kostenlosen Tarif von Claude Code, vorbehaltlich der Nutzungsgrenzen. Siehe den Leitfaden für kostenlosen Zugang für die ehrlichen Wege und ihre Beschränkungen.

Muss ich meinen Code ändern, um von Sonnet 4.6 zu aktualisieren? Meistens ändern Sie nur die Modell-ID. Dann überprüfen Sie drei Dinge: adaptives Denken ist jetzt standardmäßig aktiviert, daher `max_tokens` erneut prüfen; das `budget_tokens`-Feld für erweitertes Denken gibt jetzt einen 400-Fehler zurück; und nicht standardmäßige Sampling-Parameter geben jetzt einen 400-Fehler zurück. Messen Sie Ihre Token-Anzahl aufgrund des neuen Tokenizers neu.

Schaltfläche