TL;DR / Kurzantwort
GPT-5.4 ist OpenAIs fortschrittlichstes Grenzmodell für professionelle Arbeiten, das am 5. März 2026 veröffentlicht wurde. Es kombiniert branchenführende Codierungsfähigkeiten von GPT-5.3-Codex mit verbesserter Argumentation, Computernutzung und Tool-Integration. Das Modell erreicht eine Erfolgsquote von 83 % bei Wissensarbeitsaufgaben, 75 % bei Computernutzungs-Benchmarks und verbraucht deutlich weniger Tokens als GPT-5.2. Verfügbar über API zu 2,50 $/M Eingabe-Tokens und 15 $/M Ausgabe-Tokens, mit Pro-Version (30 $/180 $) für komplexe Aufgaben.
Einführung
OpenAI hat die Messlatte für KI-gestützte professionelle Arbeit gerade höher gelegt. Am 5. März 2026 veröffentlichten sie GPT-5.4, ein Modell, das bei realen Wissensarbeitsaufgaben eine Erfolgsquote von 83 % gegenüber Branchenexperten erzielt, während es deutlich weniger Tokens als sein Vorgänger verbraucht.
Wenn Sie mit KI-Modellen gearbeitet haben, die Fakten halluzinieren, mit komplexen Workflows zu kämpfen haben oder bei einfachen Aufgaben Tokens verbrauchen, behebt GPT-5.4 diese Probleme direkt. Es ist um 33 % weniger anfällig für Sachfehler und erledigt Computernutzungsaufgaben dreimal schneller als frühere Modelle.
Dieser Leitfaden erklärt, was GPT-5.4 tatsächlich leistet, wie es sich zu früheren Versionen verhält und ob die Leistungssteigerungen die höheren Token-Kosten rechtfertigen. Sie erhalten spezifische Benchmark-Daten, reale Leistungsvergleiche und klare Anleitungen, welche GPT-5.4-Variante zu Ihrem Anwendungsfall passt.
Was Sie lernen werden:
- Genaue Leistungsverbesserungen gegenüber GPT-5.2 und GPT-5.3-Codex
- Benchmark-Ergebnisse in den Bereichen Codierung, Computernutzung und Wissensarbeit
- Neue Computernutzungs- und Visionsfähigkeiten mit realen Beispielen
- Preisaufschlüsselung und wann Pro vs. Standard verwendet werden sollte
- Integrationsüberlegungen für API-Entwickler
Was ist GPT-5.4?
GPT-5.4 stellt OpenAIs erstes Allzweckmodell mit nativen Computernutzungsfunktionen dar. Es vereint die herausragende Codierungsleistung von GPT-5.3-Codex mit verbesserter Argumentation, visueller Wahrnehmung und Tool-Integration in einem einzigen Grenzmodell.

Das Modell zielt auf drei zentrale professionelle Szenarien ab:
Wissensarbeit – Erstellen von Tabellenkalkulationen, Präsentationen, Dokumenten und Analysen in 44 Berufen. GPT-5.4 erreicht oder übertrifft Branchenexperten in 83 % der Vergleiche auf GDPval, gegenüber 70,9 % bei GPT-5.2.
Computernutzung und Agenten – Bedienung von Computern durch Maus-/Tastaturbefehle, Browserautomatisierung und mehrstufige Workflows über Anwendungen hinweg. Erreicht eine Erfolgsquote von 75 % auf OSWorld-Verified und übertrifft die menschliche Leistung von 72,4 %.
Codierung und Entwicklung – Schreiben, Debuggen und Iterieren von Code mit Spitzenleistung auf SWE-Bench Pro (57,7 %) bei gleichzeitiger Unterstützung von Kontextfenstern mit bis zu 1 Mio. Tokens für komplexe Codebasen.
GPT-5.4 ist in zwei Varianten erhältlich:
- GPT-5.4 – Standardmodell für die meisten professionellen Aufgaben
- GPT-5.4 Pro – Maximale Leistung bei komplexen Denkaufgaben (30 $/M Eingabe, 180 $/M Ausgabe)
Wichtige Verbesserungen gegenüber GPT-5.2
GPT-5.4 ist kein inkrementelles Update. OpenAI erzielte erhebliche Fortschritte in vier kritischen Bereichen.
1. Faktische Genauigkeit und Reduzierung von Halluzinationen
Falsche Behauptungen gingen auf individueller Behauptungsebene um 33 % zurück. Vollständige Antworten enthalten insgesamt 18 % weniger Fehler. Dies ist wichtig, wenn Sie rechtliche Dokumente, Finanzmodelle oder technische Dokumentationen erstellen, bei denen eine einzige halluzinierte Tatsache ein ganzes Projekt zum Scheitern bringen kann.
2. Token-Effizienz
GPT-5.4 verbraucht deutlich weniger Tokens zur Problemlösung im Vergleich zu GPT-5.2. In toolintensiven Workflows mit MCP-Atlas-Benchmarks sank der Token-Verbrauch um 47 %, während die Genauigkeit erhalten blieb. Für API-Benutzer mit hohem Volumen gleicht dieser Effizienzgewinn die höhere Preisgestaltung pro Token aus.
3. Computernutzungsfähigkeiten
Frühere Modelle benötigten separate spezialisierte Modelle für die Computernutzung. GPT-5.4 handhabt dies nativ:
- Erteilt Maus- und Tastaturbefehle basierend auf Screenshots
- Automatisiert Browser über Playwright
- Navigiert in Desktop-Umgebungen durch koordinatenbasierte Interaktionen
- Unterstützt benutzerdefinierte Sicherheitsrichtlinien und Bestätigungsanforderungen
4. Tool-Suche und Integration
Die Tool-Suche eliminiert die Notwendigkeit, Tausende von Tool-Definitionen in jede Anfrage zu laden. Das Modell sucht Tool-Definitionen bei Bedarf nach, wodurch die anfänglichen Token-Kosten reduziert und die Arbeit mit Ökosystemen ermöglicht wird, die Zehntausende von Tools enthalten.
Beim Toolathlon-Benchmark erreicht GPT-5.4 eine Genauigkeit von 54,6 % gegenüber 45,7 % bei GPT-5.2, wobei weniger Tool-Ergebnisse (Latenz-Proxy) erforderlich sind.
GPT-5.4 Leistungsbenchmarks
Benchmark-Daten zeigen, wo GPT-5.4 glänzt und wo frühere Modelle weiterhin wettbewerbsfähig sind.
Wissensarbeit (GDPval)
Modell | Erfolgsquote vs. Fachleute |
|---|---|
GPT-5.4 | 83,0% |
GPT-5.4 Pro | 82,0% |
GPT-5.2 Pro | 74,1% |
GPT-5.2 | 70,9% |
GDPval testet klar definierte Wissensarbeit in 44 Berufen aus den Top-9-Branchen, die zum US-BIP beitragen. Aufgaben umfassen Verkaufspräsentationen, Buchhaltungstabellen, Notfallversorgungspläne, Fertigungsdiagramme und kurze Videos.
Tabellenkalkulations- und Dokumenterstellung
Bei internen Modellierungsaufgaben im Investmentbanking:
- GPT-5.4: 87,3 % Durchschnittswert
- GPT-5.2: 68,4 % Durchschnittswert
Bei der Präsentationsbewertung bevorzugten menschliche Gutachter die Ausgaben von GPT-5.4 in 68 % der Fälle aufgrund stärkerer Ästhetik, größerer visueller Vielfalt und effektiverer Nutzung der Bilderzeugung.
Codierungsleistung (SWE-Bench Pro)
Modell | Genauigkeit | Geschätzte Latenz |
|---|---|---|
GPT-5.4 | 57,7% | ~1000s |
GPT-5.3-Codex | 56,8% | ~1200s |
GPT-5.2 | 55,6% | ~1500s |

GPT-5.4 erreicht oder übertrifft GPT-5.3-Codex auf SWE-Bench Pro und bietet gleichzeitig geringere Latenz bei Denkprozessen. Der /fast-Modus in Codex ermöglicht mit GPT-5.4 eine bis zu 1,5-fach höhere Token-Geschwindigkeit.
Computernutzung (OSWorld-Verified)
OSWorld-Verified misst den Erfolg beim Navigieren in Desktop-Umgebungen mithilfe von Screenshots und Tastatur-/Mausaktionen:
- GPT-5.4: 75,0 %
- GPT-5.3-Codex: 74,0 % (mit API-Parameter zur Beibehaltung der ursprünglichen Bildauflösung)
- GPT-5.2: 47,3 %
- Menschliche Leistung: 72,4 %
Dieser Benchmark testet reale Desktop-Workflows: E-Mail- und Kalenderverwaltung, Massendateneingabe, Dateivorgänge und anwendungsübergreifende Aufgaben.
Web-Browsing (BrowseComp)
BrowseComp testet hartnäckige Web-Recherchen, um schwer auffindbare Informationen zu finden:
- GPT-5.4 Pro: 89,3 %
- GPT-5.4: 82,7 %
- GPT-5.2 Pro: 77,9 %
- GPT-5.2: 65,8 %
Die absolute Verbesserung von 17 % gegenüber GPT-5.2 spiegelt eine bessere Synthese von Informationen aus mehreren Quellen und hartnäckigere Suchstrategien wider.
Visuelles Verständnis
MMMU Pro (ohne Tools) – Testet visuelles Verständnis und Argumentation:
- GPT-5.4: 81,2 %
- GPT-5.2: 79,5 %
OmniDocBench – Dokumenten-Parsing-Genauigkeit (geringerer Fehler = besser):
- GPT-5.4: 0,109 normalisierter Editierabstand
- GPT-5.2: 0,140 normalisierter Editierabstand
Computernutzung und Visionsfähigkeiten
Die Computernutzungsfähigkeiten von GPT-5.4 verdienen eine detaillierte Untersuchung. Dies ist das erste Allzweckmodell von OpenAI, das Computer nativ bedienen kann.
Wie die Computernutzung funktioniert
Das Modell interpretiert Screenshots von Browser- oder Desktop-Oberflächen und reagiert mit:
- Koordinatenbasiertes Klicken auf UI-Elemente
- Tastatureingabe für Texteingaben
- Playwright-Befehle für die Browser-Automatisierung
- Mausbewegungen und Drag-Operationen
Entwickler konfigurieren das Verhalten über Systemnachrichten und passen Sicherheitsrichtlinien und Bestätigungsanforderungen basierend auf der Risikotoleranz an.
Beispiel für Computernutzung in der Praxis
Mainstay testete GPT-5.4 auf etwa 30.000 HOA- und Grundsteuerportalen:
- GPT-5.4: 95 % Erfolg beim ersten Versuch, 100 % innerhalb von drei Versuchen
- Bisherige CUA-Modelle: 73–79 % Erfolgsquote
- Sitzungsabschluss: 3x schneller mit GPT-5.4
- Token-Verbrauch: 70 % weniger Tokens pro Sitzung
Das Modell navigiert durch Portaloberflächen, extrahiert Daten aus verschiedenen UI-Layouts, handhabt Authentifizierungsabläufe und verwaltet Randfälle wie Captchas oder mehrstufige Formulare.
Verbesserte visuelle Wahrnehmung
GPT-5.4 führte eine detaillierte Eingabeebene für Originalbilder ein, die Folgendes unterstützt:
- Bis zu 10,24 Mio. Gesamtpixel
- 6000 Pixel maximale Abmessung
- Wahrnehmung in voller Wiedergabetreue für dichte, hochauflösende Bilder
Die hohe Detailstufe unterstützt bis zu 2,56 Mio. Gesamtpixel oder eine maximale Abmessung von 2048 Pixeln. Frühe API-Benutzertests zeigten starke Verbesserungen bei der Lokalisierungsfähigkeit, dem Bildverständnis und der Klickgenauigkeit mit ursprünglichen oder hohen Detaileinstellungen.
Verbesserungen beim Dokumenten-Parsing
Bessere visuelle Wahrnehmung führt zu verbesserter Dokumentenverarbeitung. GPT-5.4 parst:
- Mehrseitige PDFs mit Tabellen und Abbildungen
- Gescanntes Dokumente mit unterschiedlichen Layouts
- Screenshots mit Text- und UI-Elementen
- Technische Diagramme und Grafiken
Die Verbesserung um 22 % auf OmniDocBench (Fehlerrate von 0,140 auf 0,109) spiegelt diese Fähigkeit wider.
Codierungs- und Entwicklungsfunktionen
GPT-5.4 erbt die hervorragende Codierungsleistung von GPT-5.3-Codex und fügt gleichzeitig die Computernutzung für integrierte Entwicklungs-Workflows hinzu.
Frontend-Entwicklung
Interne Evaluierungen zeigten, dass GPT-5.4 bei komplexen Frontend-Aufgaben mit merklich ästhetischeren und funktionaleren Ergebnissen als frühere Modelle glänzt. Die experimentelle Playwright Interactive-Fähigkeit in Codex demonstriert dies:
Beispiel: Freizeitpark-Simulation Ein einziger Prompt generierte eine isometrische Freizeitpark-Simulation mit:
- Kachelbasiertes Wegplatzierung
- Fahrgeschäft- und Landschaftsbau
- Gästewegefindung und Warteschlangenbildung
- Parkmetriken (Geld, Gäste, Glück, Sauberkeit)
- Browser-Playtesting über Playwright-Automatisierung
- Bilderzeugung für isometrische Assets
Das Modell erstellte das Spiel und nutzte dann Playwright, um Playtests zu automatisieren, wobei Platzierung, Navigation, Gästereaktionen und UI-Stabilität über mehrere Runden hinweg überprüft wurden.
Fast-Modus für Entwickler
GPT-5.4 in Codex unterstützt den /fast-Modus und liefert eine bis zu 1,5-mal schnellere Token-Geschwindigkeit. API-Entwickler greifen über die Prioritätsverarbeitung auf gleichwertige Geschwindigkeiten zu. Dies erhält die gleiche Intelligenz bei gleichzeitiger Reduzierung der Iterationszeit während des Debuggings und der Entwicklung.
Unterstützung des Kontextfensters
GPT-5.4 Codex enthält experimentelle Unterstützung für Kontextfenster mit 1 Million Tokens. Konfigurieren Sie über:
model_context_windowparametermodel_auto_compact_token_limitparameter
Anfragen, die den Standardkontext von 272K überschreiten, werden mit der doppelten normalen Rate auf die Nutzungslimits angerechnet. Dies ermöglicht die Analyse ganzer Codebasen, großer Dokumentationssätze oder Multi-Datei-Projekte in einer einzigen Anfrage.
Apidog für API-Dokumentation:API-Dokumentation

Tool-Integration und Suche
Die Tool-Suche stellt einen grundlegenden Wandel in der Interaktion von Modellen mit externen Tools und MCP-Servern dar.
Wie die Tool-Suche funktioniert
Bisheriger Ansatz: Alle Tool-Definitionen wurden im Voraus in jede Anfrage geladen. Bei Systemen mit vielen Tools führte dies zu Tausenden bis Zehntausenden zusätzlichen Tokens, was die Kosten erhöhte und die Antworten verlangsamte.
Ansatz der Tool-Suche: Das Modell erhält eine leichte Liste verfügbarer Tools. Bei Bedarf sucht es spezifische Tool-Definitionen nach und hängt sie in diesem Moment an die Konversation an.
Beispiel für Token-Einsparungen
Der MCP-Atlas-Benchmark von Scale testete 250 Aufgaben mit allen 36 aktivierten MCP-Servern:

Token-Aufschlüsselung ohne Tool-Suche:
- 65.320 anfängliche Eingabetoken (Tool-Definitionen)
- Zusätzliche Tokens aus Tool-Ausgaben
- Ausgabe-Tokens
Die Tool-Suche eliminiert die anfänglichen Kosten und bewahrt gleichzeitig die Cache-Effizienz.
MCP Atlas Leistung
Beim MCP-Atlas-Benchmark (250 Aufgaben, 36 MCP-Server):
- GPT-5.4: 67,2 % Genauigkeit
- GPT-5.2: 60,6 % Genauigkeit
Das Modell arbeitet mit größeren Tool-Ökosystemen, ohne die Genauigkeit zu beeinträchtigen oder Kontextfenster zu überladen.
Agentic Tool-Aufrufe
Der Toolathlon-Benchmark testet mehrstufige Tool-Workflows (E-Mails lesen, Anhänge extrahieren, Dateien hochladen, bewerten, Ergebnisse aufzeichnen):

Tool-Ergebnisse (Warten auf Tool-Antworten) spiegeln die Latenz besser wider als die Anzahl der Tool-Aufrufe, da sie die Vorteile der Parallelisierung erfassen. GPT-5.4 erledigt Aufgaben in weniger Runden.
GPT-5.4 vs. GPT-5.3-Codex vs. GPT-5.2
Die Wahl zwischen Modellen hängt von Ihren spezifischen Anforderungen ab.
Wann GPT-5.4 verwendet werden sollte
- Computernutzung erforderlich – Native Computerbedienung, Browser-Automatisierung
- Wissensarbeit – Tabellenkalkulationen, Präsentationen, Dokumente
- Tool-intensive Workflows – MCP-Server, externe APIs, mehrstufige Automatisierung
- Kostensensibel bei Skalierung – Token-Effizienz reduziert Gesamtkosten trotz höherer Token-Preise
- Lange Kontextanforderungen – Bis zu 1 Mio. Tokens für komplexe Codebasen
Wann GPT-5.3-Codex wettbewerbsfähig bleibt
- Reine Codierungsaufgaben – Ähnliche SWE-Bench Pro Leistung (56,8 % vs. 57,7 %)
- Etablierte Codex-Workflows – Bestehende Integrationen benötigen möglicherweise keine Computernutzung
- Kostenoptimierung – Wenn die Preise für GPT-5.3-Codex niedriger bleiben
Wann GPT-5.2 ausreicht
- Einfache Abfragen – Grundlegende Fragen und Antworten, Zusammenfassungen, einfache Generierung
- Budgetbeschränkungen – Geringere Kosten pro Token (1,75 $/14 $ vs. 2,50 $/15 $)
- Nicht-Agenten-Workflows – Einzelanfragen ohne Tool-Nutzung
Preisvergleich
Modell | Eingabepreis | Zwischengespeicherte Eingabe | Ausgabepreis |
|---|---|---|---|
GPT-5.2 | $1.75/M | $0.175/M | $14/M |
GPT-5.4 | $2.50/M | $0.25/M | $15/M |
GPT-5.2 Pro | $21/M | - | $168/M |
GPT-5.4 Pro | $30/M | - | $180/M |
Batch- und Flex-Preise sind mit 50 % der Standardtarife erhältlich. Prioritätsverarbeitung zu 200 % der Standardtarife.
Verfügbarkeit und Zugriffsoptionen
GPT-5.4 wurde ab dem 5. März 2026 schrittweise über ChatGPT, Codex und API eingeführt.
ChatGPT-Zugriff
GPT-5.4 Thinking verfügbar für:
- ChatGPT Plus-Abonnenten
- ChatGPT Team-Abonnenten
- ChatGPT Pro-Abonnenten
GPT-5.4 Pro verfügbar für:
- ChatGPT Pro-Abonnenten
- ChatGPT Enterprise-Abonnenten
Legacy-Zugriff: GPT-5.2 Thinking bleibt drei Monate lang im Abschnitt „Legacy Models“ verfügbar und wird am 5. Juni 2026 eingestellt.
Enterprise und Bildung: Früher Zugang über die Admin-Einstellungen verfügbar.
Codex-Zugriff
GPT-5.4 ist das Standardmodell in Codex mit:
- Experimentelle Unterstützung für 1 Mio. Token-Kontextfenster
- Playwright Interactive-Fähigkeit für Browser-Playtesting
- /fast-Modus für 1,5-fache Token-Geschwindigkeit
API-Zugriff
Modellnamen:
gpt-5.4– Standardmodellgpt-5.4-pro– Pro-Modell für komplexe Aufgaben
Kontextfenster:
- Standard: 272K Tokens
- Erweitert: Bis zu 1 Mio. Tokens (experimentell, 2x Nutzungsrate)
Preise:
- Standard: 2,50 $/M Eingabe, 0,25 $/M zwischengespeicherte Eingabe, 15 $/M Ausgabe
- Pro: 30 $/M Eingabe, 180 $/M Ausgabe
- Batch/Flex: 50 % Rabatt
- Priorität: 2x Standardrate
Zeitplan für die Einstellung
GPT-5.2 Thinking wird am 5. Juni 2026 eingestellt. Migrieren Sie Workflows vor diesem Datum, um Unterbrechungen zu vermeiden.
Fazit
GPT-5.4 liefert messbare Verbesserungen bei Wissensarbeit, Computernutzung und Codierungsaufgaben. Die 83 % GDPval-Erfolgsquote, der 75 % OSWorld-Verified-Score und die 57,7 % SWE-Bench Pro-Genauigkeit etablieren es als den neuen Stand der Technik für professionelle KI-Workflows.
Für Entwickler, die GPT-5.4 in Anwendungen integrieren, werden robuste API-Test- und Debugging-Tools unerlässlich. Apidog optimiert den Integrationsprozess mit vereinheitlichten API-Design-, Debugging-, Test- und Dokumentationsfunktionen. Egal, ob Sie KI-Agenten erstellen, Workflows automatisieren oder kundenorientierte Funktionen mit GPT-5.4 entwickeln, Apidog hilft sicherzustellen, dass Ihre API-Integrationen vom ersten Tag an korrekt funktionieren.
Wichtige Erkenntnisse:
- 33 % Reduzierung falscher Behauptungen und 18 % weniger Antwortfehler
- 47 % Token-Reduzierung in toolintensiven Workflows
- 75 % Erfolgsquote bei der Computernutzung, übertrifft den menschlichen Grundwert
- Native Computerbedienung über Maus-/Tastaturbefehle
- Die Tool-Suche ermöglicht die Arbeit mit Zehntausenden von Tools
- 1 Mio. Token-Kontextfenster für komplexe Codebasen
- Verfügbar für 2,50 $/15 $ pro Million Tokens (Standardvariante)
Wann zu übernehmen:
- Sie benötigen Computernutzung oder Browser-Automatisierung
- Token-Effizienz ist wichtig für Workflows mit hohem Volumen
- Faktische Genauigkeit ist entscheidend (juristisch, finanziell, technisch)
- Sie arbeiten mit großen Tool-Ökosystemen oder MCP-Servern
- Langkontextanalyse von Codebasen oder Dokumenten
Wann zu warten ist:
- Einfache Fragen-Antworten-Workflows profitieren nicht von neuen Funktionen
- Budgetbeschränkungen priorisieren die niedrigsten Kosten pro Token
- Bestehende GPT-5.2- oder GPT-5.3-Codex-Workflows funktionieren ausreichend
GPT-5.4 stellt OpenAIs effizientestes Denkmodell bis heute dar. Die Kombination aus reduzierten Halluzinationen, verbesserter Token-Effizienz und nativen Computernutzungsfähigkeiten rechtfertigt die höhere Preisgestaltung pro Token für professionelle Anwendungen.
FAQ
Was ist der Unterschied zwischen GPT-5.4 und GPT-5.2?
GPT-5.4 erreicht eine Erfolgsquote von 83 % bei Wissensarbeit gegenüber 70,9 % bei GPT-5.2, verwendet deutlich weniger Tokens, verfügt über native Computernutzungsfähigkeiten und reduziert Sachfehler um 33 %. Die Preise sind höher (2,50 $/15 $ vs. 1,75 $/14 $), aber die Gesamtkosten können aufgrund von Effizienzgewinnen niedriger sein.
Wie viel kostet die GPT-5.4 API?
GPT-5.4 kostet 2,50 $ pro Million Eingabe-Tokens, 0,25 $ pro Million zwischengespeicherter Eingabe-Tokens und 15 $ pro Million Ausgabe-Tokens. GPT-5.4 Pro kostet 30 $/M Eingabe und 180 $/M Ausgabe. Batch- und Flex-Preise bieten 50 % Rabatt.
Hat GPT-5.4 ein Kontextfenster-Limit?
Das Standard-Kontextfenster beträgt 272K Tokens. Eine experimentelle Unterstützung für 1 Million Token-Kontextfenster ist in Codex verfügbar, indem die Parameter model_context_window und model_auto_compact_token_limit konfiguriert werden. Anfragen, die 272K überschreiten, werden mit der doppelten Nutzungsrate berechnet.
Wofür wird GPT-5.4 Pro verwendet?
GPT-5.4 Pro zielt auf maximale Leistung bei komplexen Denkaufgaben ab. Es erzielt höhere Werte bei Benchmarks wie BrowseComp (89,3 % vs. 82,7 %) und GDPval (82,0 % vs. 83,0 % Standard), kostet aber 12-mal mehr (30 $/180 $ vs. 2,50 $/15 $).
Wann wurde GPT-5.4 veröffentlicht?
GPT-5.4 wurde am 5. März 2026 veröffentlicht und schrittweise über ChatGPT, Codex und API ausgerollt. GPT-5.2 Thinking bleibt bis zum 5. Juni 2026 für die Migration verfügbar.
Kann GPT-5.4 Computer und Browser nutzen?
Ja. GPT-5.4 ist das erste Allzweckmodell von OpenAI mit nativen Computernutzungsfähigkeiten. Es erteilt Maus-/Tastaturbefehle, automatisiert Browser über Playwright und navigiert in Desktop-Umgebungen durch Screenshot-Interpretation.
Was ist die Tool-Suche in GPT-5.4?
Die Tool-Suche ermöglicht es dem Modell, Tool-Definitionen bei Bedarf nachzuschlagen, anstatt alle Definitionen im Voraus zu laden. Dies reduziert den Token-Verbrauch in toolintensiven Workflows um 47 % und ermöglicht die Arbeit mit Ökosystemen, die Zehntausende von Tools enthalten.
Wie vergleicht sich GPT-5.4 mit GPT-5.3-Codex beim Codieren?
GPT-5.4 erreicht oder übertrifft GPT-5.3-Codex auf SWE-Bench Pro (57,7 % vs. 56,8 %) und bietet gleichzeitig geringere Latenz und zusätzliche Computernutzungsfunktionen. Es ist die empfohlene Wahl für neue Entwicklungs-Workflows.
Ist GPT-5.4 in ChatGPT verfügbar?
Ja. GPT-5.4 Thinking ist für Plus-, Team- und Pro-Abonnenten verfügbar. GPT-5.4 Pro ist für Pro- und Enterprise-Pläne verfügbar. GPT-5.2 Thinking bleibt unter Legacy-Modellen bis zum 5. Juni 2026 verfügbar.
Welche Sicherheitsaspekte gibt es bei GPT-5.4 zu beachten?
GPT-5.4 wird im Rahmen von OpenAIs Preparedness Framework als Modell mit hoher Cyber-Fähigkeit eingestuft. Schutzmaßnahmen umfassen einen erweiterten Cyber-Sicherheits-Stack, Überwachungssysteme, vertrauenswürdige Zugangskontrollen und asynchrones Blockieren für Anfragen mit höherem Risiko auf Oberflächen ohne Datenaufbewahrung (Zero Data Retention). Einige Fehlalarme können auftreten, wenn sich die Klassifikatoren verbessern.
