OpenAI verdoppelte den Preis pro Token für die GPT-5-Linie mit der Veröffentlichung von GPT-5.5 am 23. April 2026. Der Input steigt von $2,50 auf $5,00 pro Million Tokens. Der Output steigt von $15,00 auf $30,00 pro Million. Die Pro-Preise bleiben konstant bei $30 / $180. Das ist die Schlagzeile; die Details sind der Ort, wo die tatsächlichen Kosten liegen.
Dieser Leitfaden behandelt jedes Preismodell: API Standard, Batch, Flex und Priority; Pro-Preise; Codex-Limits pro Plan; und wie Sie die Kosten für Ihre tatsächliche Arbeitslast berechnen, bevor Sie sich für eine Änderung des Standardmodells entscheiden.
Für einen Modellüberblick, siehe Was ist GPT-5.5. Für eine Entwickleranleitung, siehe Wie man die GPT-5.5 API benutzt.
TL;DR
| Oberfläche | Input / M | Output / M |
|---|---|---|
| GPT-5.5 Standard-API | $5,00 | $30,00 |
| GPT-5.5 Pro-API | $30,00 | $180,00 |
| GPT-5.5 Batch (50 % Rabatt) | $2,50 | $15,00 |
| GPT-5.5 Flex (50 % Rabatt) | $2,50 | $15,00 |
| GPT-5.5 Priority (2,5×) | $12,50 | $75,00 |
| GPT-5.4 Standard-API | $2,50 | $15,00 |
| GPT-5.4-mini API | $0,25 | $2,00 |
Nettoeffekt: GPT-5.5 ist auf Token-Ebene 2× so teuer wie GPT-5.4, aber OpenAI behauptet eine Steigerung des Netto-Intelligenz-Index um ca. 20 %, sobald die Token-Effizienz berücksichtigt wird.
Die wichtigsten Zahlen
OpenAI veröffentlichte die Preise auf der API-Preisseite am selben Tag wie die Markteinführung.
- GPT-5.5: $5,00 pro Million Input-Tokens, $30,00 pro Million Output-Tokens.
- GPT-5.5 Pro: $30,00 pro Million Input-Tokens, $180,00 pro Million Output-Tokens.
- Kontextfenster: 1 Million Tokens bei beiden Varianten. Reasoning-Tokens werden auf das Fenster und auf die Output-Abrechnung angerechnet.
Batch, Flex und Priority
OpenAI bietet drei alternative Stufen an, die den Standardpreis neu gestalten.
Batch-API
Stellen Sie Anfragen über den Batch-Endpunkt in die Warteschlange, und sie werden zu 50 % des Standardpreises verarbeitet. Die Bearbeitungszeit beträgt weniger als 24 Stunden. Geeignet für:
- Nächtliche Auswertungen auf einem vollständigen Datensatz.
- Nachfüllungen und historische Neuverarbeitung.
- Jeden Workflow, bei dem das Latenzbudget in Stunden, nicht in Sekunden gemessen wird.
Bei Batch-Preisen kostet GPT-5.5 $2,50 / $15,00 pro Million Tokens; identisch mit den GPT-5.4-Standardpreisen. Für Offline-Workloads entfällt die Preisverdoppelung.
Flex-Verarbeitung
Flex bietet ebenfalls 50 % Rabatt auf die Standardpreise, aber die Wartezeit ist variabel; von Sekunden bis zu mehreren Minuten, je nach Auslastung. Nutzen Sie Flex, wenn Sie unvorhersehbare Latenzzeiten tolerieren können und Batch-ähnliche Preise mit annähernd synchronen Antworten wünschen.
Priority-Verarbeitung
Priority kostet das 2,5-fache des Standardtarifs ($12,50 / $75,00 pro Million Tokens bei GPT-5.5) und bietet Ihnen einen schnelleren Durchsatz als der Standard, höhere Rate-Limit-Obergrenzen und nahezu keine Warteschlange. Reservieren Sie es für Live-Benutzererlebnisse, bei denen die Endlatenz in den Bindungsmetriken sichtbar wird.
Kostenberechnung für den Thinking-Modus
GPT-5.5 Thinking ist dieselbe Modell-ID mit einem höheren reasoning.effort. Es ändert nicht den Preis pro Token; es ändert, wie viele Tokens eine einzelne Anfrage verwendet. Erwarten Sie, dass der Multiplikator in drei Bereiche fällt.
| Aufwand | Output-Token-Multiplikator | Wann zu verwenden |
|---|---|---|
low (Standard) |
1× | Die meisten Routineaufrufe |
medium |
1,3–2× | Mehrschrittige Codierung, strukturierte Generierung |
high |
2–4× | Tiefgehende Recherche, kritische Überprüfung der Korrektheit |
xhigh |
3–8× | Agenten-Loops mit Tool-Ketten, dichte Planung |
Ein einzelner xhigh-Aufruf mit einem langen Prompt kann leicht 20.000 Reasoning-Tokens verbrauchen; bei $30 pro Million sind das allein $0,60 für das Reasoning, zusätzlich zu den Kosten der endgültigen Output-Tokens.
Budget pro Arbeitslast, nicht pro Anfrage.
Codex-Preise
Der Codex-Zugang ist an den ChatGPT-Plan gebunden, nicht an die Abrechnung pro Token. Am 23. April 2026 sieht die Struktur so aus.
| Plan | Codex-Zugang | GPT-5.5 | Anmerkungen |
|---|---|---|---|
| Kostenlos | Ja (begrenzte Zeit) | Ja | Strenge wöchentliche Obergrenzen |
| Go | Ja (begrenzte Zeit) | Ja | 2× kostenlose Obergrenzen |
| Plus ($20 / Monat) | Ja | Ja | Standard-Obergrenzen |
| Pro ($200 / Monat) | Ja | Ja + Thinking + Pro (in ChatGPT) | Höchste Obergrenzen pro Benutzer |
| Business | Ja | Ja | Platzbasiert |
| Enterprise / Bildung | Ja | Ja | Vertragsbasiert |
Für Benutzer, die den Großteil ihrer Zeit in einem Terminal-Coding-Workflow verbringen, ist Plus oder Pro der günstigste Weg, GPT-5.5 zu nutzen; die pauschale monatliche Gebühr übertrifft selbst die Batch-Preise, sobald Sie täglich einige Hunderttausend Tokens überschreiten. Der Leitfaden zum kostenlosen Einstieg behandelt den kostenlosen Einstiegspunkt.
Vergleich: GPT-5.5 vs. der Rest der Reihe
Wann zahlen Sie für GPT-5.5 und wann behalten Sie GPT-5.4 oder GPT-5.4-mini? Die Kostenberechnung hängt davon ab, wie output-intensiv Ihre Arbeitslast ist.
| Modell | Input / M | Output / M | Kosten pro 1.000 Output-Tokens |
|---|---|---|---|
| GPT-5.4-mini | $0,25 | $2,00 | $0,0020 |
| GPT-5.4 | $2,50 | $15,00 | $0,0150 |
| GPT-5.5 | $5,00 | $30,00 | $0,0300 |
| GPT-5.5 Pro | $30,00 | $180,00 | $0,1800 |
Ein grober Entscheidungsfluss:
- Output mit hohem Volumen und geringem Risiko (Klassifizierung, Zusammenfassungen, einfacher Chat): GPT-5.4-mini.
- Allgemeiner Produktions-Traffic, bei dem 5.4 bereits die Qualitätsanforderungen erfüllt: GPT-5.4.
- Anspruchsvolle Codierung, mehrschrittige Agentenarbeit, Forschungs-Ketten: GPT-5.5.
- Korrektheitskritischer Output, bei dem eine falsche Antwort nachgelagert teuer zu erkennen ist: GPT-5.5 Pro.
Ein Beispiel: Kosten pro Aufgabe für einen Coding-Agenten
Eine typische Agenten-Codierungs-Sitzung über die API auf GPT-5.5 mit reasoning.effort: "medium" sieht wie folgt aus.
- Input-Tokens pro Aufgabe (Repo-Kontext + Benutzer-Prompt): ~15.000
- Output-Tokens pro Aufgabe (Code + Erklärungen): ~3.000
- Reasoning-Tokens pro Aufgabe (mittlerer Aufwand): ~6.000
Kosten pro Aufgabe bei Standardpreisen:
- Input: 15 K × $5,00 / M = $0,075
- Output: (3 K + 6 K) × $30,00 / M = $0,27
- Gesamt: $0,345 pro abgeschlossener Codierungsaufgabe.
Ausführung derselben Arbeitslast auf GPT-5.4:
- Input: 15 K × $2,50 / M = $0,0375
- Output: 9 K × $15,00 / M = $0,135
- Gesamt: $0,1725 pro abgeschlossener Codierungsaufgabe.
GPT-5.5 kostet genau das Doppelte pro Aufgabe bei gleichem Reasoning-Aufwand. Das Upgrade zahlt sich aus, wenn die SWE-Bench-Lücke (88,7 % vs. etwa 74 %) genügend Aufgaben erfolgreich schließt, um einen zweiten Roundtrip zu eliminieren. Wenn eine von acht Aufgaben auf GPT-5.4 eine manuelle Überarbeitung erfordert, ist GPT-5.5 insgesamt günstiger.
Kostenkontrollen, die es sich lohnt, am ersten Tag zu implementieren
Fünf Hebel, die GPT-5.5-Rechnungen unspektakulär halten.
- Harte
max_output_tokens-Obergrenzen. Bei jedem Aufruf, jedes Mal. Standardmäßig 2.000, es sei denn, Sie benötigen explizit lange Ausgaben. - Strikte JSON-Schemas. Fehlformatierte Ausgaben bedeuten Wiederholungsversuche; Wiederholungsversuche sind ein vollpreisiger Aufruf.
- Nach Schwierigkeit routen. Einfache Anfragen an GPT-5.4-mini weiterleiten; schwierige an GPT-5.5 eskalieren. Ein 10-Zeilen-Router spart mehr als jede Prompt-Level-Optimierung.
- Batch für alles Offline nutzen. Evaluierungen, Nachfüllungen, nächtliche Berichterstellung; alles 50 % Rabatt.
usage.reasoning_tokensverfolgen. Die Überraschung bei der Abrechnung von GPT-5.5 ist fast immer der Verbrauch von Reasoning-Tokens bei hohem Aufwand. Alarmieren Sie bei Überschreitung.
Monatliche Kostenübersicht pro Plan
Wenn Sie eine ChatGPT-Stufe für den GPT-5.5-Zugang wählen, sehen Sie hier, was jeder Plan kostet.
| Plan | Monatlicher Preis | Am besten geeignet für |
|---|---|---|
| Kostenlos | $0 | GPT-5.5 über Codex ausprobieren, bevor man sich festlegt |
| Go | $4 / Monat | Studenten und Gelegenheitsnutzer, die 2× kostenlose Obergrenzen wünschen |
| Plus | $20 / Monat | Einzelne Entwickler, die Codex + ChatGPT täglich nutzen |
| Pro | $200 / Monat | Power-User, die Thinking und Pro in ChatGPT wünschen |
| Business | $25 / Sitzplatz / Monat | Teams, die gemeinsame Arbeitsbereiche benötigen |
| Enterprise / Bildung | Kundenspezifisch | Vertragsbasiert mit SLA |
Für jeden, der mehr als ~4 Millionen Output-Tokens pro Monat über die API verarbeitet, ist Pro in ChatGPT plus die Codex CLI letztendlich günstiger als die Pay-as-you-go-API-Abrechnung, solange die Arbeitslast in das 400.000 Token Kontextfenster der CLI passt.
Preisänderungssignale, die man beobachten sollte
Zwei Signale, die es sich lohnt zu verfolgen, wenn Sie ein langfristiges Budget erstellen.
- Die allgemeine Verfügbarkeit der GPT-5.5 API. Die Preise könnten sinken, wenn OpenAI auf den Wettbewerbsdruck von Anthropic Claude Mythos, Gemini 3.5 und Open-Weight-Modellen reagiert, die im Vellum-Leaderboard bewertet werden.
- Demokratisierung des Pro-Modells. OpenAI hat historisch gesehen die Preise für Pro-Stufen innerhalb von 3–6 Monaten nach jeder Veröffentlichung gesenkt. Gehen Sie nicht davon aus, dass die heutigen $30 / $180 dauerhaft sind; gehen Sie aber auch nicht davon aus, dass sie sinken werden.
FAQ
Reduziert Caching die Input-Kosten?Ja. Gecachte Input-Tokens auf GPT-5.5 werden zu einem Bruchteil des Standardpreises abgerechnet; die OpenAI-Preisseite enthält den genauen Multiplikator. Cachen Sie alles, was Sie in mehr als einer Anfrage wiederverwenden (System-Prompts, Tool-Schemas, Repo-Kontext).
Gibt es einen Mengenrabatt?Keinen veröffentlichten. Unternehmensverträge beinhalten oft kundenspezifische Tarife, und OpenAI passt die Preise als Reaktion auf nachhaltige Nutzung an. Sprechen Sie mit dem Vertrieb, wenn Ihre jährlichen Ausgaben siebenstellige Beträge überschreiten.
Verursacht der Thinking-Modus zusätzliche Kosten zusätzlich zur Token-Preisgestaltung?Nein. Er kostet mehr, weil er mehr Tokens verbraucht, nicht weil sich der Preis pro Token ändert.
Wird die Nutzung der Codex CLI separat von der API-Nutzung abgerechnet?Nur wenn Sie sich mit einem API-Schlüssel anmelden. ChatGPT-Anmeldungen werden über die Plangebühr abgerechnet; API-Schlüssel-Anmeldungen werden über das nutzungsbasierte Konto abgerechnet.
Was ist der günstigste Weg, GPT-5.5 auszuprobieren?Kostenloser oder Go-Plan plus Codex CLI. Siehe unseren Leitfaden zum kostenlosen Einstieg für jede kostenlose Option.
