Comment utiliser l'API GPT-5.5

Ashley Innocent

Ashley Innocent

24 April 2026

Comment utiliser l'API GPT-5.5

Apidog pour les entreprises

Déploiement sur site

SSO & RBAC

Conforme SOC 2

Explorer Apidog Enterprise

GPT-5.5 a été lancé le 23 avril 2026, et la nouvelle pour les développeurs est simple : OpenAI a ouvert le modèle au sein de ChatGPT et Codex le même jour, et s'est engagé à rendre disponibles les API Responses et Chat Completions « très bientôt ». Ce guide couvre les deux aspects : comment appeler GPT-5.5 dès que les clés fonctionnent, et comment les premiers testeurs l'utilisent aujourd'hui via le chemin de connexion Codex.

Vous obtiendrez les structures d'endpoints, l'authentification, des exemples Python et Node, le tableau complet des paramètres, le calcul des prix en mode de réflexion, la gestion des erreurs, et un flux de travail de test dans Apidog qui économise des crédits lorsque vous itérez.

bouton

Pour une vue d'ensemble du modèle au niveau produit, consultez Qu'est-ce que GPT-5.5. Pour un chemin purement gratuit, consultez Comment utiliser l'API GPT-5.5 gratuitement.

En bref

Prérequis

Avant d'envoyer la première requête, préparez quatre éléments :

Exportez votre clé une fois :

export OPENAI_API_KEY="sk-proj-..."

Endpoint et authentification

GPT-5.5 utilise les deux mêmes endpoints que le reste de la famille GPT-5.

POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions

L'API Responses est la surface plus récente d'OpenAI, consciente des outils, et c'est là que le mode de réflexion, la recherche web et l'utilisation de l'ordinateur s'intègrent proprement. Chat Completions fonctionne toujours et prend en charge la plupart des intégrations héritées.

L'authentification se fait par un jeton bearer. Chaque requête prend un corps JSON avec l'ID du modèle, le prompt ou le tableau de messages, et les paramètres que vous souhaitez.

curl https://api.openai.com/v1/responses \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
    "reasoning": { "effort": "medium" }
  }'

Si l'appel réussit, vous obtenez un objet JSON avec un tableau output de messages et un bloc usage décomposé en tokens d'entrée, de sortie et de raisonnement. Les échecs renvoient l'enveloppe OpenAI standard avec un code et un message lisible par l'homme ; le tableau d'erreurs à la fin de ce guide couvre ceux que vous rencontrerez en premier.

Paramètres de requête

Chaque champ dans le corps correspond soit à un coût, soit à un comportement. Voici la carte complète pour gpt-5.5.

Paramètre Type Valeurs Notes
model string gpt-5.5, gpt-5.5-pro Obligatoire. La version Pro coûte 6× en entrée et 6× en sortie.
input / messages string ou tableau Prompt ou tableau de chat Obligatoire. input pour les Réponses, messages pour les Complétions de Chat.
reasoning.effort string none, low, medium, high, xhigh La valeur par défaut est low. xhigh débloque une profondeur de type "Réflexion" à un coût en tokens.
max_output_tokens entier 1 – 128000 Limite stricte pour la sortie, hors tokens de raisonnement.
tools tableau Function, web_search, file_search, computer_use, code_interpreter Définitions d'outils ; le modèle les choisit et les enchaîne.
tool_choice string ou objet auto, none, ou un outil nommé Force l'appel d'un outil spécifique lorsque vous savez que vous en avez besoin.
response_format objet { "type": "json_schema", "schema": {...} } Sortie structurée ; le mode strict est désormais la valeur par défaut.
stream booléen true / false Événements envoyés par le serveur. Les tokens de raisonnement arrivent sous forme d'événements séparés.
user string Format libre Utilisé pour la détection des abus ; passez un ID utilisateur haché.
metadata objet Jusqu'à 16 paires clé-valeur Apparaît dans le tableau de bord et les journaux d'OpenAI.
seed entier Tout entier 32 bits Déterminisme doux ; la même graine avec le même prompt est proche, pas identique.
temperature nombre 0 – 2 Ignoré si reasoning.effort >= medium.

Les trois champs qui influencent le plus le coût sont reasoning.effort, max_output_tokens et tools. Les exécutions de style "Réflexion" avec reasoning.effort: "high" ou "xhigh" peuvent facilement multiplier par 3 à 8 le nombre de tokens de sortie d'une exécution low.

Exemple Python

La structure du SDK pour GPT-5.5 suit l'API Responses 5.4 ; la seule différence est l'ID du modèle et la plage plus étendue de reasoning.effort.

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input=[
        {
            "role": "system",
            "content": "You are a senior Go engineer. Answer in terse, runnable code.",
        },
        {
            "role": "user",
            "content": (
                "Write a worker pool with bounded concurrency and a context "
                "cancellation path. No third-party deps."
            ),
        },
    ],
    reasoning={"effort": "medium"},
    max_output_tokens=4000,
)

print(response.output_text)
print(response.usage.model_dump())

Deux points à noter :

Exemple Node

import OpenAI from "openai";

const client = new OpenAI();

const response = await client.responses.create({
  model: "gpt-5.5",
  input: [
    { role: "system", content: "You are a careful reviewer." },
    {
      role: "user",
      content:
        "Review this migration and flag any operation that would lock a write-heavy table for more than 200 ms.",
    },
  ],
  reasoning: { effort: "high" },
  tools: [{ type: "file_search" }],
  max_output_tokens: 6000,
});

console.log(response.output_text);
console.log(response.usage);

Définissez reasoning.effort sur high lorsque la tâche est de type révision et que le coût d'un problème manqué est supérieur au coût de quelques centimes supplémentaires en tokens de raisonnement.

Mode de réflexion

Le mode de réflexion de GPT-5.5 n'est pas un ID de modèle différent ; il s'agit du modèle standard gpt-5.5 exécuté avec reasoning.effort défini sur high ou xhigh, associé à un budget max_output_tokens plus long. L'interface utilisateur de ChatGPT d'OpenAI l'expose comme un interrupteur ; sur l'API, vous le contrôlez par requête.

Deux règles empiriques :

Si votre requête implique computer_use ou de longues chaînes de recherche web, l'effort de niveau "Réflexion" vaut l'investissement ; la réduction des hallucinations citée par OpenAI dans le billet de lancement se manifeste principalement dans ces flux de travail.

Sortie structurée

La sortie JSON stricte est la valeur par défaut sur GPT-5.5. Passez un schéma et le SDK refusera de renvoyer du JSON mal formé.

response = client.responses.create(
    model="gpt-5.5",
    input="Extract the title, speaker, and start time from this transcript chunk.",
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "session_extract",
            "strict": True,
            "schema": {
                "type": "object",
                "required": ["title", "speaker", "start_time"],
                "properties": {
                    "title": {"type": "string"},
                    "speaker": {"type": "string"},
                    "start_time": {"type": "string", "format": "date-time"},
                },
            },
        },
    },
)

Pour toute pipeline qui alimente du code en aval, définissez toujours un schéma. Cela ne coûte rien au niveau des tokens et supprime la boucle de réessai que vous écririez autrement autour d'une sortie mal formée.

Utilisation d'outils et agents

L'API Responses expose cinq types d'outils propriétaires :

L'amélioration de GPT-5.5 par rapport à la version 5.4 ici ne réside pas dans la liste des outils ; c'est la propension du modèle à les enchaîner sans supervision. Lors des tests effectués avec la suite de reproduction de The Decoder, GPT-5.5 a complété 11 % de chaînes d'outils multi-étapes supplémentaires sans intervention de l'utilisateur par rapport à la version 5.4 avec le même prompt.

Gestion des erreurs et réessais

Attendez-vous à rencontrer quatre codes d'erreur suffisamment souvent pour les gérer par leur nom.

Code Signification Réessayer ?
429 rate_limit_exceeded Limite par minute ou par jour atteinte. Oui, avec un délai d'attente exponentiel + jitter.
400 context_length_exceeded Entrée + sortie + raisonnement > 1 M de tokens. Non, raccourcir l'entrée.
500 server_error Erreur transitoire côté OpenAI. Oui, jusqu'à 3 tentatives.
403 policy_violation Refus pour violation de politique. Non, réécrire le prompt.

Les tokens de raisonnement sont comptabilisés dans la fenêtre contextuelle. Un appel avec reasoning.effort: "xhigh" sur une entrée de 900 K tokens atteindra 400 pour un dépassement de contexte même si votre message utilisateur est court.

Flux de travail de test avec Apidog

Les appels GPT-5.5 sont suffisamment coûteux pour que vous ne vouliez pas découvrir un bug de schéma en relançant le prompt 20 fois. Le flux de travail qui gaspille le moins de tokens :

  1. Construisez la requête une fois dans Apidog, enregistrez-la comme entrée de collection, et étiquetez l'environnement (clé dev, staging, prod).
  2. Utilisez le serveur de maquette intégré pour rejouer la dernière réponse réelle pendant que vous itérez sur le code en aval.
  3. Passez à la clé en direct uniquement lorsque le schéma est stable.

Apidog propose également une intégration Claude Code et Cursor, de sorte que la même collection est accessible depuis n'importe quel agent de niveau éditeur que vous utilisez. Consultez notre guide pratique Apidog dans VS Code et la comparaison Apidog vs. Postman pour la configuration complète.

Appeler GPT-5.5 avant que l'API ne soit générale

Jusqu'à ce qu'OpenAI termine le déploiement de l'API Responses, le chemin pratique pour les développeurs qui souhaitent tester GPT-5.5 est le flux de connexion Codex. Le guide gratuit Codex explique comment installer l'interface CLI, s'authentifier avec un compte ChatGPT et sélectionner le modèle.

FAQ

Existe-t-il un gpt-5.5-mini ? Pas au lancement. OpenAI a conservé gpt-5.4-mini comme SKU optimisé en termes de coût.

Quelle est la fenêtre contextuelle ? 1 M de tokens dans l'API. 400 K dans l'interface CLI Codex. Les deux incluent les tokens de raisonnement.

Dois-je réécrire mon code GPT-5.4 ? Non. Échangez l'ID du modèle, élargissez max_output_tokens si vous souhaitez une sortie de niveau "Réflexion", et réajustez reasoning.effort pour votre charge de travail.

Comment réduire les coûts ? Trois leviers : Batch (50 % de réduction), Flex (50 % de réduction, file d'attente plus lente) et des schémas stricts pour éliminer les boucles de réessai. Le calcul complet des coûts se trouve dans la répartition des prix de GPT-5.5.

Où puis-je surveiller l'annonce de la disponibilité générale de l'API ? La communauté des développeurs OpenAI et la page de tarification de l'API OpenAI sont les signaux publics les plus rapides.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API