TL;DR / Réponse rapide
GPT-5.4 est le modèle de pointe le plus avancé d'OpenAI pour le travail professionnel, lancé le 5 mars 2026. Il combine les capacités de codage de pointe de GPT-5.3-Codex avec une raisonnement amélioré, l'utilisation d'ordinateurs et l'intégration d'outils. Le modèle atteint un taux de réussite de 83 % sur les tâches de travail intellectuel, 75 % sur les benchmarks d'utilisation d'ordinateurs, et utilise significativement moins de jetons que GPT-5.2. Disponible via API à 2,50 $/M jetons d'entrée et 15 $/M jetons de sortie, avec une version Pro (30 $/180 $) pour les tâches complexes.
Introduction
OpenAI vient de rehausser les standards du travail professionnel assisté par l'IA. Le 5 mars 2026, ils ont lancé GPT-5.4, un modèle qui atteint un taux de réussite de 83 % face à des professionnels de l'industrie sur des tâches de travail intellectuel réelles, tout en utilisant significativement moins de jetons que son prédécesseur.
Si vous avez déjà travaillé avec des modèles d'IA qui inventent des faits, peinent avec des workflows complexes ou consomment des jetons pour des tâches simples, GPT-5.4 aborde directement ces problèmes. Il est 33 % moins susceptible de faire des erreurs factuelles et accomplit les tâches d'utilisation d'ordinateur 3 fois plus rapidement que les modèles précédents.
Ce guide détaille ce que fait réellement GPT-5.4, comment il se compare aux versions précédentes, et si les gains de performance justifient les coûts de jetons plus élevés. Vous obtiendrez des données de benchmark spécifiques, des comparaisons de performances réelles et des conseils clairs sur la variante de GPT-5.4 qui convient à votre cas d'utilisation.
Ce que vous apprendrez :
- Améliorations exactes des performances par rapport à GPT-5.2 et GPT-5.3-Codex
- Scores de benchmark pour le codage, l'utilisation d'ordinateurs et le travail intellectuel
- Nouvelles capacités d'utilisation d'ordinateurs et de vision avec des exemples réels
- Répartition des prix et quand utiliser la version Pro ou standard
- Considérations d'intégration pour les développeurs d'API
Qu'est-ce que GPT-5.4 ?
GPT-5.4 représente le premier modèle polyvalent d'OpenAI doté de capacités natives d'utilisation d'ordinateurs. Il fusionne l'excellence de codage de GPT-5.3-Codex avec une raisonnement amélioré, une perception visuelle et une intégration d'outils, le tout en un seul modèle de pointe.

Le modèle cible trois scénarios professionnels principaux :
Travail intellectuel - Création de feuilles de calcul, présentations, documents et analyses pour 44 professions. GPT-5.4 égale ou dépasse les professionnels de l'industrie dans 83 % des comparaisons sur GDPval, contre 70,9 % pour GPT-5.2.
Utilisation d'ordinateurs et agents - Opération d'ordinateurs via des commandes de souris/clavier, automatisation de navigateurs et workflows multi-étapes à travers les applications. Atteint un taux de réussite de 75 % sur OSWorld-Verified, surpassant les performances humaines de 72,4 %.
Codage et développement - Écriture, débogage et itération de code avec des performances de pointe sur SWE-Bench Pro (57,7 %) tout en supportant des fenêtres contextuelles allant jusqu'à 1 million de jetons pour les bases de code complexes.
GPT-5.4 est disponible en deux variantes :
- GPT-5.4 - Modèle standard pour la plupart des tâches professionnelles
- GPT-5.4 Pro - Performances maximales pour les tâches de raisonnement complexes (30 $/M d'entrée, 180 $/M de sortie)
Améliorations Clés par Rapport à GPT-5.2
GPT-5.4 n'est pas une mise à jour incrémentale. OpenAI a réalisé des gains substantiels dans quatre domaines critiques.
1. Précision Factuelle et Réduction des Hallucinations
Les fausses affirmations ont diminué de 33 % au niveau de l'affirmation individuelle. Les réponses complètes contiennent 18 % moins d'erreurs au total. Cela est important lorsque vous générez des documents juridiques, des modèles financiers ou de la documentation technique, où un seul fait inventé peut faire dérailler un projet entier.
2. Efficacité des Jetons
GPT-5.4 utilise significativement moins de jetons pour résoudre les problèmes par rapport à GPT-5.2. Dans les workflows intensifs en outils avec les benchmarks MCP Atlas, l'utilisation de jetons a chuté de 47 % tout en maintenant la précision. Pour les utilisateurs d'API à fort volume, ce gain d'efficacité compense le prix plus élevé par jeton.
3. Capacités d'Utilisation d'Ordinateurs
Les modèles précédents nécessitaient des modèles spécialisés distincts pour l'utilisation d'ordinateurs. GPT-5.4 gère cela nativement :
- Émet des commandes de souris et de clavier à partir de captures d'écran
- Automatise les navigateurs via Playwright
- Navigue dans les environnements de bureau grâce à des interactions basées sur des coordonnées
- Prend en charge des politiques de sécurité personnalisées et des exigences de confirmation
4. Recherche et Intégration d'Outils
La recherche d'outils élimine le besoin de charger des milliers de définitions d'outils dans chaque requête. Le modèle recherche les définitions d'outils à la demande, réduisant les coûts de jetons initiaux et permettant de travailler avec des écosystèmes contenant des dizaines de milliers d'outils.
Sur le benchmark Toolathlon, GPT-5.4 atteint une précision de 54,6 % contre 45,7 % pour GPT-5.2, avec moins de rendements d'outils (proxy de latence) requis.
Benchmarks de Performance de GPT-5.4
Les données de benchmark montrent où GPT-5.4 excelle et où les modèles antérieurs restent compétitifs.
Travail Intellectuel (GDPval)
Modèle | Taux de Victoire vs Professionnels |
|---|---|
GPT-5.4 | 83,0 % |
GPT-5.4 Pro | 82,0 % |
GPT-5.2 Pro | 74,1 % |
GPT-5.2 | 70,9 % |
GDPval teste le travail intellectuel bien spécifié dans 44 professions des 9 principales industries contribuant au PIB américain. Les tâches incluent des présentations commerciales, des feuilles de calcul comptables, des plannings de soins urgents, des diagrammes de fabrication et des courtes vidéos.
Création de Feuilles de Calcul et de Documents
Sur les tâches internes de modélisation en banque d'investissement :
- GPT-5.4 : score moyen de 87,3 %
- GPT-5.2 : score moyen de 68,4 %
Pour l'évaluation de présentations, les évaluateurs humains ont préféré les sorties de GPT-5.4 dans 68 % des cas en raison d'une esthétique plus forte, d'une plus grande variété visuelle et d'une utilisation plus efficace de la génération d'images.
Performance de Codage (SWE-Bench Pro)
Modèle | Précision | Latence Estimée |
|---|---|---|
GPT-5.4 | 57,7 % | ~1000s |
GPT-5.3-Codex | 56,8 % | ~1200s |
GPT-5.2 | 55,6 % | ~1500s |

GPT-5.4 égale ou dépasse GPT-5.3-Codex sur SWE-Bench Pro tout en offrant une latence plus faible pour les efforts de raisonnement. Le mode /fast de Codex offre une vitesse de jetons jusqu'à 1,5 fois plus rapide avec GPT-5.4.
Utilisation d'ordinateurs (OSWorld-Verified)
OSWorld-Verified mesure le succès de la navigation dans les environnements de bureau via des captures d'écran et des actions clavier/souris :
- GPT-5.4 : 75,0 %
- GPT-5.3-Codex : 74,0 % (avec paramètre API préservant la résolution d'image originale)
- GPT-5.2 : 47,3 %
- Performance humaine : 72,4 %
Ce benchmark teste des workflows de bureau réels : gestion d'e-mails et de calendriers, saisie de données en masse, opérations de fichiers et tâches inter-applications.
Navigation Web (BrowseComp)
BrowseComp teste la recherche web persistante pour trouver des informations difficiles à localiser :
- GPT-5.4 Pro : 89,3 %
- GPT-5.4 : 82,7 %
- GPT-5.2 Pro : 77,9 %
- GPT-5.2 : 65,8 %
L'amélioration absolue de 17 % par rapport à GPT-5.2 reflète une meilleure synthèse des informations multi-sources et des stratégies de recherche plus persistantes.
Compréhension Visuelle
MMMU Pro (sans outils) - Teste la compréhension et le raisonnement visuels :
- GPT-5.4 : 81,2 %
- GPT-5.2 : 79,5 %
OmniDocBench - Précision de l'analyse de documents (erreur plus faible = meilleure) :
- GPT-5.4 : 0,109 distance d'édition normalisée
- GPT-5.2 : 0,140 distance d'édition normalisée
Capacités d'Utilisation d'Ordinateurs et de Vision
Les capacités d'utilisation d'ordinateurs de GPT-5.4 méritent un examen détaillé. C'est le premier modèle polyvalent d'OpenAI capable d'opérer des ordinateurs nativement.
Comment Fonctionne l'Utilisation d'Ordinateurs
Le modèle interprète les captures d'écran d'interfaces de navigateur ou de bureau et répond avec :
- Des clics basés sur des coordonnées sur les éléments de l'interface utilisateur
- Des entrées clavier pour la saisie de texte
- Des commandes Playwright pour l'automatisation de navigateurs
- Des mouvements de souris et des opérations de glisser-déposer
Les développeurs configurent le comportement via des messages système, ajustant les politiques de sécurité et les exigences de confirmation en fonction de la tolérance au risque.
Exemple Réel d'Utilisation d'Ordinateurs
Mainstay a testé GPT-5.4 sur environ 30 000 portails de syndics de copropriété et de taxes foncières :
- GPT-5.4 : 95 % de succès au premier essai, 100 % en trois tentatives
- Modèles CUA précédents : taux de réussite de 73-79 %
- Achèvement de session : 3 fois plus rapide avec GPT-5.4
- Utilisation de jetons : 70 % moins de jetons par session
Le modèle navigue dans les interfaces de portail, extrait des données de différentes mises en page d'interface utilisateur, gère les flux d'authentification et les cas limites comme les captchas ou les formulaires multi-étapes.
Perception Visuelle Améliorée
GPT-5.4 a introduit un niveau de détail d'entrée d'image original prenant en charge :
- Jusqu'à 10,24 millions de pixels au total
- Dimension maximale de 6000 pixels
- Perception pleine fidélité pour les images denses et haute résolution
Le niveau de détail élevé prend en charge jusqu'à 2,56 millions de pixels au total ou une dimension maximale de 2048 pixels. Les tests utilisateurs API précoces ont montré de forts gains en capacité de localisation, compréhension d'images et précision de clics avec les réglages originaux ou à haute détail.
Améliorations de l'Analyse Documentaire
Une meilleure perception visuelle se traduit par une meilleure gestion des documents. GPT-5.4 analyse :
- Des PDF de plusieurs pages avec des tableaux et des figures
- Des documents scannés avec des mises en page variées
- Des captures d'écran contenant du texte et des éléments d'interface utilisateur
- Des diagrammes et graphiques techniques
L'amélioration de 22 % sur OmniDocBench (taux d'erreur de 0,140 à 0,109) reflète cette capacité.
Fonctionnalités de Codage et de Développement
GPT-5.4 hérite de l'excellence de codage de GPT-5.3-Codex tout en ajoutant l'utilisation d'ordinateurs pour des workflows de développement intégrés.
Développement Frontend
Des évaluations internes ont révélé que GPT-5.4 excelle dans les tâches frontend complexes avec des résultats nettement plus esthétiques et fonctionnels que les modèles précédents. La compétence expérimentale Playwright Interactive de Codex en témoigne :
Exemple : Simulation de Parc Thématique Une seule invite a généré une simulation de parc thématique isométrique avec :
- Placement de chemins basé sur des tuiles
- Construction de manèges et de décors
- Recherche de chemin et mise en file d'attente des visiteurs
- Métriques du parc (argent, visiteurs, bonheur, propreté)
- Test de jeu sur navigateur via l'automatisation Playwright
- Génération d'images pour les éléments isométriques
Le modèle a construit le jeu, puis a utilisé Playwright pour automatiser les tests de jeu, vérifiant le placement, la navigation, les réactions des visiteurs et la stabilité de l'interface utilisateur sur plusieurs tours.
Mode Rapide pour les Développeurs
GPT-5.4 dans Codex prend en charge le mode /fast offrant une vitesse de jetons jusqu'à 1,5 fois plus rapide. Les développeurs d'API accèdent à des vitesses équivalentes via le traitement prioritaire. Cela maintient la même intelligence tout en réduisant le temps d'itération pendant le débogage et le développement.
Prise en Charge de la Fenêtre Contextuelle
GPT-5.4 Codex inclut un support expérimental de fenêtre contextuelle de 1 million de jetons. Configurez via :
- Paramètre
model_context_window - Paramètre
model_auto_compact_token_limit
Les requêtes dépassant le contexte standard de 272K sont comptées par rapport aux limites d'utilisation à 2 fois le taux normal. Cela permet l'analyse de bases de code entières, de grands ensembles de documentation ou de projets multi-fichiers en une seule requête.
Apidog pour la documentation API :documentation API

Intégration et Recherche d'Outils
La recherche d'outils représente un changement fondamental dans la manière dont les modèles interagissent avec les outils externes et les serveurs MCP.
Comment Fonctionne la Recherche d'Outils
Approche précédente : Toutes les définitions d'outils étaient chargées dans chaque requête dès le départ. Pour les systèmes avec de nombreux outils, cela ajoutait des milliers, voire des dizaines de milliers de jetons, augmentant les coûts et ralentissant les réponses.
Approche de recherche d'outils : Le modèle reçoit une liste légère des outils disponibles. Lorsque nécessaire, il recherche les définitions d'outils spécifiques et les ajoute à la conversation à ce moment-là.
Exemple d'Économie de Jetons
Le benchmark MCP Atlas de Scale a testé 250 tâches avec les 36 serveurs MCP activés :

Répartition des jetons sans recherche d'outils :
- 65 320 jetons d'entrée initiaux (définitions d'outils)
- Jetons supplémentaires provenant des sorties d'outils
- Jetons de sortie
La recherche d'outils élimine le coût initial tout en préservant l'efficacité du cache.
Performances MCP Atlas
Sur le benchmark MCP Atlas (250 tâches, 36 serveurs MCP) :
- GPT-5.4 : 67,2 % de précision
- GPT-5.2 : 60,6 % de précision
Le modèle fonctionne avec des écosystèmes d'outils plus vastes sans sacrifier la précision ni surcharger les fenêtres contextuelles.
Appel d'Outils Agentique
Le benchmark Toolathlon teste les workflows d'outils multi-étapes (lire des e-mails, extraire des pièces jointes, télécharger des fichiers, noter, enregistrer des résultats) :

Les rendements d'outils (attente des réponses des outils) reflètent mieux la latence que le nombre d'appels d'outils car ils capturent les avantages de la parallélisation. GPT-5.4 complète les tâches en moins de tours.
GPT-5.4 vs GPT-5.3-Codex vs GPT-5.2
Le choix entre les modèles dépend de vos exigences spécifiques.
Quand Utiliser GPT-5.4
- Utilisation d'ordinateurs requise - Opération native d'ordinateurs, automatisation de navigateurs
- Travail intellectuel - Feuilles de calcul, présentations, documents
- Workflows gourmands en outils - Serveurs MCP, API externes, automatisation multi-étapes
- Sensible aux coûts à grande échelle - L'efficacité des jetons réduit les coûts totaux malgré un prix par jeton plus élevé
- Besoins de contexte long - Jusqu'à 1 million de jetons pour les bases de code complexes
Quand GPT-5.3-Codex Reste Compétitif
- Tâches de codage pures - Performances SWE-Bench Pro similaires (56,8 % vs 57,7 %)
- Workflows Codex établis - Les intégrations existantes pourraient ne pas nécessiter l'utilisation d'ordinateurs
- Optimisation des coûts - Si le prix de GPT-5.3-Codex reste inférieur
Quand GPT-5.2 Suffit
- Requêtes simples - Questions-réponses de base, résumé, génération simple
- Contraintes budgétaires - Coûts par jeton inférieurs (1,75 $/14 $ vs 2,50 $/15 $)
- Workflows non-agentiques - Requêtes à un seul tour sans utilisation d'outils
Comparaison des Prix
Modèle | Prix d'Entrée | Entrée en Cache | Prix de Sortie |
|---|---|---|---|
GPT-5.2 | 1,75 $/M | 0,175 $/M | 14 $/M |
GPT-5.4 | 2,50 $/M | 0,25 $/M | 15 $/M |
GPT-5.2 Pro | 21 $/M | - | 168 $/M |
GPT-5.4 Pro | 30 $/M | - | 180 $/M |
Des tarifs "Batch" et "Flex" sont disponibles à 50 % des taux standard. Le traitement prioritaire est à 200 % des taux standard.
Disponibilité et Options d'Accès
GPT-5.4 a été déployé progressivement à partir du 5 mars 2026 sur ChatGPT, Codex et l'API.
Accès ChatGPT
GPT-5.4 Thinking disponible pour :
- Les abonnés ChatGPT Plus
- Les abonnés ChatGPT Team
- Les abonnés ChatGPT Pro
GPT-5.4 Pro disponible pour :
- Les abonnés ChatGPT Pro
- Les abonnés ChatGPT Enterprise
Accès hérité : GPT-5.2 Thinking reste disponible pendant trois mois dans la section Modèles Hérités, et sera retiré le 5 juin 2026.
Entreprise et Éducation : Accès anticipé disponible via les paramètres d'administration.
Accès Codex
GPT-5.4 est le modèle par défaut dans Codex avec :
- Support expérimental de fenêtre contextuelle de 1 million de jetons
- Compétence Playwright Interactive pour les tests de jeu sur navigateur
- Mode /fast pour une vitesse de jetons 1,5 fois plus rapide
Accès API
Noms des modèles :
gpt-5.4- Modèle standardgpt-5.4-pro- Modèle Pro pour les tâches complexes
Fenêtres contextuelles :
- Standard : 272K jetons
- Étendu : Jusqu'à 1M jetons (expérimental, taux d'utilisation 2x)
Tarification :
- Standard : 2,50 $/M d'entrée, 0,25 $/M d'entrée en cache, 15 $/M de sortie
- Pro : 30 $/M d'entrée, 180 $/M de sortie
- Batch/Flex : 50 % de réduction
- Priorité : 2x le taux standard
Calendrier de Dépréciation
GPT-5.2 Thinking sera retiré le 5 juin 2026. Migrez les workflows avant cette date pour éviter toute interruption.
Conclusion
GPT-5.4 apporte des améliorations mesurables dans le travail intellectuel, l'utilisation d'ordinateurs et les tâches de codage. Le taux de réussite de 83 % sur GDPval, le score de 75 % sur OSWorld-Verified et la précision de 57,7 % sur SWE-Bench Pro l'établissent comme le nouvel état de l'art pour les workflows professionnels d'IA.
Pour les développeurs intégrant GPT-5.4 dans leurs applications, disposer d'outils robustes de test et de débogage d'API devient essentiel. Apidog simplifie le processus d'intégration grâce à des capacités unifiées de conception, de débogage, de test et de documentation d'API. Que vous construisiez des agents IA, automatisiez des workflows ou créiez des fonctionnalités orientées client alimentées par GPT-5.4, Apidog vous aide à garantir que vos intégrations API fonctionnent correctement dès le premier jour.
Points clés à retenir :
- Réduction de 33 % des fausses affirmations et 18 % moins d'erreurs de réponse
- Réduction de 47 % des jetons dans les workflows gourmands en outils
- Taux de succès de 75 % pour l'utilisation d'ordinateurs, dépassant le niveau humain
- Opération native d'ordinateurs via des commandes de souris/clavier
- La recherche d'outils permet de travailler avec des dizaines de milliers d'outils
- Fenêtre contextuelle de 1 million de jetons pour les bases de code complexes
- Disponible à 2,50 $/15 $ par million de jetons (variante standard)
Quand l'adopter :
- Vous avez besoin d'utiliser des ordinateurs ou d'automatiser des navigateurs
- L'efficacité des jetons est importante pour les workflows à volume élevé
- La précision factuelle est critique (juridique, financière, technique)
- Vous travaillez avec de vastes écosystèmes d'outils ou des serveurs MCP
- Analyse de contexte long de bases de code ou de documents
Quand attendre :
- Les workflows simples de questions-réponses ne bénéficient pas des nouvelles capacités
- Les contraintes budgétaires privilégient les coûts par jeton les plus bas
- Les workflows existants GPT-5.2 ou GPT-5.3-Codex fonctionnent de manière adéquate
GPT-5.4 représente le modèle de raisonnement le plus efficace d'OpenAI à ce jour. La combinaison d'une réduction des hallucinations, d'une efficacité améliorée des jetons et de capacités natives d'utilisation d'ordinateurs justifie le prix plus élevé par jeton pour les applications professionnelles.
FAQ
Quelle est la différence entre GPT-5.4 et GPT-5.2 ?
GPT-5.4 atteint un taux de réussite de 83 % sur les tâches de travail intellectuel contre 70,9 % pour GPT-5.2, utilise significativement moins de jetons, possède des capacités natives d'utilisation d'ordinateurs et réduit les erreurs factuelles de 33 %. La tarification est plus élevée (2,50 $/15 $ contre 1,75 $/14 $) mais les coûts totaux peuvent être inférieurs grâce aux gains d'efficacité.
Combien coûte l'API GPT-5.4 ?
GPT-5.4 coûte 2,50 $ par million de jetons d'entrée, 0,25 $ par million de jetons d'entrée en cache et 15 $ par million de jetons de sortie. GPT-5.4 Pro coûte 30 $/M d'entrée et 180 $/M de sortie. Les tarifs Batch et Flex offrent des réductions de 50 %.
GPT-5.4 a-t-il une limite de fenêtre contextuelle ?
La fenêtre contextuelle standard est de 272K jetons. Un support expérimental de fenêtre contextuelle de 1M de jetons est disponible dans Codex en configurant les paramètres model_context_window et model_auto_compact_token_limit. Les requêtes dépassant 272K sont comptées à 2 fois le taux d'utilisation.
À quoi sert GPT-5.4 Pro ?
GPT-5.4 Pro vise une performance maximale sur les tâches de raisonnement complexes. Il obtient des scores plus élevés sur des benchmarks comme BrowseComp (89,3 % vs 82,7 %) et GDPval (82,0 % vs 83,0 % standard) mais coûte 12 fois plus cher (30 $/180 $ vs 2,50 $/15 $).
Quand GPT-5.4 a-t-il été lancé ?
GPT-5.4 a été lancé le 5 mars 2026, déployé progressivement sur ChatGPT, Codex et l'API. GPT-5.2 Thinking reste disponible jusqu'au 5 juin 2026 pour la migration.
GPT-5.4 peut-il utiliser des ordinateurs et des navigateurs ?
Oui. GPT-5.4 est le premier modèle polyvalent d'OpenAI doté de capacités natives d'utilisation d'ordinateurs. Il émet des commandes de souris/clavier, automatise les navigateurs via Playwright et navigue dans les environnements de bureau grâce à l'interprétation de captures d'écran.
Qu'est-ce que la recherche d'outils dans GPT-5.4 ?
La recherche d'outils permet au modèle de rechercher des définitions d'outils à la demande au lieu de charger toutes les définitions dès le départ. Cela réduit l'utilisation des jetons de 47 % dans les workflows gourmands en outils et permet de travailler avec des écosystèmes contenant des dizaines de milliers d'outils.
Comment GPT-5.4 se compare-t-il à GPT-5.3-Codex pour le codage ?
GPT-5.4 égale ou dépasse GPT-5.3-Codex sur SWE-Bench Pro (57,7 % vs 56,8 %) tout en offrant une latence plus faible et en ajoutant des capacités d'utilisation d'ordinateurs. C'est le choix recommandé pour les nouveaux workflows de développement.
GPT-5.4 est-il disponible dans ChatGPT ?
Oui. GPT-5.4 Thinking est disponible pour les abonnés Plus, Team et Pro. GPT-5.4 Pro est disponible pour les plans Pro et Enterprise. GPT-5.2 Thinking reste disponible dans la section Modèles Hérités jusqu'au 5 juin 2026.
Quelles sont les considérations de sécurité pour GPT-5.4 ?
GPT-5.4 est traité comme une capacité cyber de haut niveau dans le cadre du Preparedness Framework d'OpenAI. Les protections incluent une pile de sécurité cyber étendue, des systèmes de surveillance, des contrôles d'accès fiables et un blocage asynchrone pour les requêtes à risque plus élevé sur les surfaces de rétention de données zéro. Certaines fausses alertes peuvent survenir à mesure que les classificateurs s'améliorent.
