GPT-5.5 API の使い方

GPT-5.5は2026年4月23日にリリースされ、開発者向けのニュースはシンプルです。OpenAIは同日、ChatGPTとCodex内でモデルを公開し、ResponsesおよびChat Completions APIについては「近日中に」対応すると表明しました。このガイドでは、その両面について説明します。つまり、キーが機能し始めたらすぐにGPT-5.5を呼び出す方法と、初期テスターがCodexサインインパスを通じて現在どのように利用しているかです。

このガイドでは、エンドポイントの形式、認証、PythonおよびNodeの例、全パラメーター表、思考モードの料金計算、エラー処理、そしてイテレーション時にクレジットを節約できるApidogでのテストワークフローについて説明します。

ボタン

モデルの製品レベルの概要については、GPT-5.5とはを参照してください。完全なフリーティアパスについては、GPT-5.5 APIを無料で使う方法を参照してください。

TL;DR

GPT-5.5は、ResponsesおよびChat Completionsエンドポイントで提供されます。モデルIDはgpt-5.5です。Pro版はgpt-5.5-proです。
APIの料金は、入力100万トークンあたり$5、出力100万トークンあたり$30です。Pro版は入力100万トークンあたり$30、出力100万トークンあたり$180です。
コンテキストウィンドウは、APIでは100万トークン、Codex CLI内では40万トークンです。
APIの一般公開が完了するまでは、開発者はChatGPTサインインを使用してCodex経由でGPT-5.5を利用できます。
コレクションを事前に構築するにはApidogを使用してください。リクエスト形式はGPT-5.4と一致し、新しいモデルIDと拡張されたreasoningブロックが追加されています。

前提条件

最初のリクエストを発行する前に、以下の4つの項目を準備してください。

課金可能なティアを持つOpenAI開発者アカウント。ChatGPT PlusまたはProのサブスクリプションはAPI課金とは別です。UIアクセスとプログラムによるアクセスの両方が必要な場合は、両方必要です。
GPT-5モデルファミリーへのアクセス権を持つAPIキー。本番ワークロードでは、ユーザーキーよりもプロジェクトスコープのキーを強く推奨します。
gpt-5.5をサポートするSDKバージョン。Pythonではopenai>=2.1.0、Nodeではopenai@5.1.0以降です。
ターミナルを乱雑にすることなくリクエストをリプレイできるAPIクライアント。curlは1回の呼び出しには機能しますが、その後はApidogなどに切り替えてください。

キーを一度エクスポートします。

export OPENAI_API_KEY="sk-proj-..."

エンドポイントと認証

GPT-5.5は、他のGPT-5ファミリーと同じ2つのエンドポイントで利用できます。

POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions

Responses APIはOpenAIの新しいツール対応インターフェースであり、思考モード、ウェブ検索、コンピューター利用がすべてきれいに組み込まれます。Chat Completionsも依然として機能し、ほとんどのレガシー統合を引き継いでいます。

認証はベアラー（Bearer）トークンです。すべてのリクエストは、モデルID、プロンプトまたはメッセージ配列、および任意のパラメーターを含むJSONボディを受け取ります。

curl https://api.openai.com/v1/responses \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
    "reasoning": { "effort": "medium" }
  }'

呼び出しが成功した場合、メッセージのoutput配列と、入力、出力、推論トークンに分けられたusageブロックを含むJSONオブジェクトが返されます。失敗した場合は、codeと人間が読めるmessageを含む標準のOpenAIエンベロープが返されます。このガイドの最後にあるエラーテーブルには、最初に出くわす可能性のあるエラーが網羅されています。

リクエストパラメーター

ボディ内のすべてのフィールドは、コストまたは動作のいずれかにマッピングされます。以下にgpt-5.5の完全なマッピングを示します。

パラメーター	型	値	備考
`model`	string	`gpt-5.5`、`gpt-5.5-pro`	必須。Pro版は入力と出力がそれぞれ6倍のコストがかかります。
`input` / `messages`	stringまたは配列	プロンプトまたはチャット配列	必須。Responsesでは`input`、Chat Completionsでは`messages`。
`reasoning.effort`	string	`none`、`low`、`medium`、`high`、`xhigh`	デフォルトは`low`。`xhigh`はトークンコストを伴う思考スタイルの深度を解除します。
`max_output_tokens`	integer	1 – 128000	推論トークンを除く出力の厳密な上限。
`tools`	配列	Function、web_search、file_search、computer_use、code_interpreter	ツールの定義。モデルがそれらを選択し、連結します。
`tool_choice`	stringまたはオブジェクト	`auto`、`none`、または指定されたツール	特定のツールが必要だと分かっている場合に強制的に呼び出します。
`response_format`	オブジェクト	`{ "type": "json_schema", "schema": {...} }`	構造化された出力。厳密モードがデフォルトになりました。
`stream`	boolean	true / false	サーバー送信イベント。推論トークンは個別のイベントとして到着します。
`user`	string	自由形式	不正検出に使用されます。ハッシュ化されたユーザーIDを渡します。
`metadata`	オブジェクト	最大16組のキーと値のペア	OpenAIダッシュボードとログに表示されます。
`seed`	integer	任意のint32	ソフトな決定論。同じプロンプトと同じシードは近い結果になりますが、同一ではありません。
`temperature`	number	0 – 2	`reasoning.effort >= medium`の場合、無視されます。

最もコストに影響を与える3つのフィールドは、reasoning.effort、max_output_tokens、およびtoolsです。reasoning.effort: "high"または"xhigh"での思考スタイルの実行は、lowでの実行に比べて出力トークン数を簡単に3〜8倍増やすことができます。

Pythonの例

GPT-5.5のSDK形式はGPT-5.4 Responses APIに準拠しています。唯一の違いは、モデルIDと拡張されたreasoning.effortの範囲です。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input=[
        {
            "role": "system",
            "content": "あなたはシニアGoエンジニアです。簡潔で実行可能なコードで回答してください。",
        },
        {
            "role": "user",
            "content": (
                "並行処理が制限され、コンテキストキャンセルパスを持つワーカープールを記述してください。サードパーティの依存関係は不要です。"
            ),
        },
    ],
    reasoning={"effort": "medium"},
    max_output_tokens=4000,
)

print(response.output_text)
print(response.usage.model_dump())

注目すべき2点：

response.output_textはoutput配列を平坦化します。構造化されたイベント（ツール呼び出し、推論トレース、引用）が必要な場合は、response.outputを直接読み取ってください。
usageは現在、input_tokens、output_tokens、reasoning_tokensを個別のカウンターとして返します。これら3つすべてに対して課金されます。

Nodeの例

import OpenAI from "openai";

const client = new OpenAI();

const response = await client.responses.create({
  model: "gpt-5.5",
  input: [
    { role: "system", content: "あなたは慎重なレビュアーです。" },
    {
      role: "user",
      content:
        "このマイグレーションをレビューし、書き込み負荷の高いテーブルを200ms以上ロックする可能性のある操作をすべて指摘してください。",
    },
  ],
  reasoning: { effort: "high" },
  tools: [{ type: "file_search" }],
  max_output_tokens: 6000,
});

console.log(response.output_text);
console.log(response.usage);

タスクがレビュー形式で、見落としのコストが推論トークンの数セントの追加コストよりも大きい場合は、reasoning.effortをhighに設定してください。

思考モード

GPT-5.5の思考モードは異なるモデルIDではありません。reasoning.effortをhighまたはxhighに設定し、より長いmax_output_tokensバジェットと組み合わせた標準のgpt-5.5モデルの実行です。OpenAIのChatGPT UIではトグルとして公開されていますが、APIではリクエストごとに制御します。

2つの経験則：

mediumをデフォルトとして使用してください。これはほとんどのエージェント的な作業、複数ファイルのデバッグ、ドキュメント生成をカバーします。GPT-5.4と比較してコストはほぼ横ばいです。
highとxhighは、研究、正確性が重要なレビュー、および長いツールチェーンのために確保してください。出力トークン数の3〜8倍の予算を見込み、30秒以内に返されると仮定するのではなく、応答時間を計測してください。

リクエストがcomputer_useや長いウェブ検索チェーンに触れる場合、思考レベルの労力は費用をかける価値があります。OpenAIが発表記事で言及した幻覚の減少は、主にこれらのワークフローで現れます。

構造化出力

GPT-5.5では厳密なJSON出力がデフォルトです。スキーマを渡すと、SDKは不正な形式のJSONを返さなくなります。

response = client.responses.create(
    model="gpt-5.5",
    input="このトランスクリプトのチャンクから、タイトル、話者、開始時刻を抽出してください。",
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "session_extract",
            "strict": True,
            "schema": {
                "type": "object",
                "required": ["title", "speaker", "start_time"],
                "properties": {
                    "title": {"type": "string"},
                    "speaker": {"type": "string"},
                    "start_time": {"type": "string", "format": "date-time"},
                },
            },
        },
    },
)

ダウンストリームコードに供給するあらゆるパイプラインでは、常にスキーマを設定してください。トークンレベルでのコストはかからず、不正な形式の出力に対して書くことになるであろうリトライループを不要にします。

ツール利用とエージェント

Responses APIは、5つのファーストパーティツールタイプを公開しています。

web_search — リアルタイム検索。結果ごとの引用付き。
file_search — アップロードされたファイルのベクター検索。
code_interpreter — サンドボックス化されたPython。
computer_use — Operatorスタックを介したマウス、キーボード、ブラウザ。
function — 独自のコールバック。

ここでのGPT-5.5の5.4に対する改善点はツールリストではなく、モデルが監視なしにそれらをどれだけ喜んで連携させるかです。The Decoderの再現スイートに対するテストでは、同じプロンプトでGPT-5.5は5.4よりもユーザー介入なしに11%多くの多段階ツールチェーンを完了しました。

エラー処理とリトライ

名前で処理するのに十分な頻度で発生する4つのエラーコードを想定してください。

コード	意味	リトライ？
`429 rate_limit_exceeded`	1分あたりまたは1日あたりの上限に達しました。	はい、指数関数的バックオフ+ジッターで。
`400 context_length_exceeded`	入力+出力+推論 > 100万トークン。	いいえ、入力を短くしてください。
`500 server_error`	OpenAI側の一時的なエラー。	はい、最大3回まで。
`403 policy_violation`	安全ポリシーによる拒否。	いいえ、プロンプトを書き換えてください。

推論トークンはコンテキストウィンドウに対してカウントされます。90万トークンの入力に対するreasoning.effort: "xhigh"の呼び出しは、ユーザーメッセージが短くても、コンテキストオーバーフローのため400エラーになります。

Apidogでのテストワークフロー

GPT-5.5の呼び出しは非常に高価であるため、プロンプトを20回再実行してスキーマのバグを発見したくはないでしょう。最もトークンを無駄にしないワークフローは次のとおりです。

リクエストをApidogで一度構築し、コレクションエントリとして保存し、環境（開発、ステージング、本番キー）にタグを付けます。
内蔵のモックサーバーを使用して、ダウンストリームコードを反復処理しながら、最後の実際のリクエストをリプレイします。
スキーマが安定している場合にのみ、ライブキーに切り替えます。

ApidogはClaude CodeおよびCursor統合も提供しているため、使用するエディターレベルのエージェントから同じコレクションにアクセスできます。詳細な設定については、VS CodeでのApidogウォークスルーとApidog vs. Postmanの比較を参照してください。

APIの一般公開前のGPT-5.5の呼び出し方

OpenAIがResponses APIのロールアウトを完了するまで、GPT-5.5を実際に試したい開発者にとって現実的なパスは、Codexのサインインフローです。Codex無料ガイドでは、CLIのインストール、ChatGPTアカウントでの認証、およびモデルの選択について説明しています。

FAQ

gpt-5.5-miniはありますか？
ローンチ時点ではありません。OpenAIはgpt-5.4-miniをコスト最適化されたSKUとして維持しました。
コンテキストウィンドウはどれくらいですか？
APIでは100万トークン。Codex CLIでは40万トークン。両方とも推論トークンを含みます。
GPT-5.4のコードを書き直す必要がありますか？
いいえ。モデルIDを交換し、思考レベルの出力が必要な場合はmax_output_tokensを広げ、ワークロードに合わせてreasoning.effortを再調整してください。
コストを削減するにはどうすればよいですか？
3つの方法があります：バッチ（50%オフ）、フレックス（50%オフ、キューイングが遅い）、そしてリトライループをなくすための厳密なスキーマ。料金の詳細については、GPT-5.5の料金内訳を参照してください。
APIのGA発表はどこで確認できますか？
OpenAI開発者コミュニティとOpenAI API料金ページが、最も速い公開情報源です。