GPT-5.5 API の使い方

Ashley Innocent

Ashley Innocent

24 4月 2026

GPT-5.5 API の使い方

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

GPT-5.5は2026年4月23日にリリースされ、開発者向けのニュースはシンプルです。OpenAIは同日、ChatGPTとCodex内でモデルを公開し、ResponsesおよびChat Completions APIについては「近日中に」対応すると表明しました。このガイドでは、その両面について説明します。つまり、キーが機能し始めたらすぐにGPT-5.5を呼び出す方法と、初期テスターがCodexサインインパスを通じて現在どのように利用しているかです。

このガイドでは、エンドポイントの形式、認証、PythonおよびNodeの例、全パラメーター表、思考モードの料金計算、エラー処理、そしてイテレーション時にクレジットを節約できるApidogでのテストワークフローについて説明します。

ボタン

モデルの製品レベルの概要については、GPT-5.5とはを参照してください。完全なフリーティアパスについては、GPT-5.5 APIを無料で使う方法を参照してください。

TL;DR

前提条件

最初のリクエストを発行する前に、以下の4つの項目を準備してください。

キーを一度エクスポートします。

export OPENAI_API_KEY="sk-proj-..."

エンドポイントと認証

GPT-5.5は、他のGPT-5ファミリーと同じ2つのエンドポイントで利用できます。

POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions

Responses APIはOpenAIの新しいツール対応インターフェースであり、思考モード、ウェブ検索、コンピューター利用がすべてきれいに組み込まれます。Chat Completionsも依然として機能し、ほとんどのレガシー統合を引き継いでいます。

認証はベアラー(Bearer)トークンです。すべてのリクエストは、モデルID、プロンプトまたはメッセージ配列、および任意のパラメーターを含むJSONボディを受け取ります。

curl https://api.openai.com/v1/responses \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
    "reasoning": { "effort": "medium" }
  }'

呼び出しが成功した場合、メッセージのoutput配列と、入力、出力、推論トークンに分けられたusageブロックを含むJSONオブジェクトが返されます。失敗した場合は、codeと人間が読めるmessageを含む標準のOpenAIエンベロープが返されます。このガイドの最後にあるエラーテーブルには、最初に出くわす可能性のあるエラーが網羅されています。

リクエストパラメーター

ボディ内のすべてのフィールドは、コストまたは動作のいずれかにマッピングされます。以下にgpt-5.5の完全なマッピングを示します。

パラメーター 備考
model string gpt-5.5gpt-5.5-pro 必須。Pro版は入力と出力がそれぞれ6倍のコストがかかります。
input / messages stringまたは配列 プロンプトまたはチャット配列 必須。Responsesではinput、Chat Completionsではmessages
reasoning.effort string nonelowmediumhighxhigh デフォルトはlowxhighはトークンコストを伴う思考スタイルの深度を解除します。
max_output_tokens integer 1 – 128000 推論トークンを除く出力の厳密な上限。
tools 配列 Function、web_search、file_search、computer_use、code_interpreter ツールの定義。モデルがそれらを選択し、連結します。
tool_choice stringまたはオブジェクト autonone、または指定されたツール 特定のツールが必要だと分かっている場合に強制的に呼び出します。
response_format オブジェクト { "type": "json_schema", "schema": {...} } 構造化された出力。厳密モードがデフォルトになりました。
stream boolean true / false サーバー送信イベント。推論トークンは個別のイベントとして到着します。
user string 自由形式 不正検出に使用されます。ハッシュ化されたユーザーIDを渡します。
metadata オブジェクト 最大16組のキーと値のペア OpenAIダッシュボードとログに表示されます。
seed integer 任意のint32 ソフトな決定論。同じプロンプトと同じシードは近い結果になりますが、同一ではありません。
temperature number 0 – 2 reasoning.effort >= mediumの場合、無視されます。

最もコストに影響を与える3つのフィールドは、reasoning.effortmax_output_tokens、およびtoolsです。reasoning.effort: "high"または"xhigh"での思考スタイルの実行は、lowでの実行に比べて出力トークン数を簡単に3〜8倍増やすことができます。

Pythonの例

GPT-5.5のSDK形式はGPT-5.4 Responses APIに準拠しています。唯一の違いは、モデルIDと拡張されたreasoning.effortの範囲です。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input=[
        {
            "role": "system",
            "content": "あなたはシニアGoエンジニアです。簡潔で実行可能なコードで回答してください。",
        },
        {
            "role": "user",
            "content": (
                "並行処理が制限され、コンテキストキャンセルパスを持つワーカープールを記述してください。サードパーティの依存関係は不要です。"
            ),
        },
    ],
    reasoning={"effort": "medium"},
    max_output_tokens=4000,
)

print(response.output_text)
print(response.usage.model_dump())

注目すべき2点:

Nodeの例

import OpenAI from "openai";

const client = new OpenAI();

const response = await client.responses.create({
  model: "gpt-5.5",
  input: [
    { role: "system", content: "あなたは慎重なレビュアーです。" },
    {
      role: "user",
      content:
        "このマイグレーションをレビューし、書き込み負荷の高いテーブルを200ms以上ロックする可能性のある操作をすべて指摘してください。",
    },
  ],
  reasoning: { effort: "high" },
  tools: [{ type: "file_search" }],
  max_output_tokens: 6000,
});

console.log(response.output_text);
console.log(response.usage);

タスクがレビュー形式で、見落としのコストが推論トークンの数セントの追加コストよりも大きい場合は、reasoning.efforthighに設定してください。

思考モード

GPT-5.5の思考モードは異なるモデルIDではありません。reasoning.efforthighまたはxhighに設定し、より長いmax_output_tokensバジェットと組み合わせた標準のgpt-5.5モデルの実行です。OpenAIのChatGPT UIではトグルとして公開されていますが、APIではリクエストごとに制御します。

2つの経験則:

リクエストがcomputer_useや長いウェブ検索チェーンに触れる場合、思考レベルの労力は費用をかける価値があります。OpenAIが発表記事で言及した幻覚の減少は、主にこれらのワークフローで現れます。

構造化出力

GPT-5.5では厳密なJSON出力がデフォルトです。スキーマを渡すと、SDKは不正な形式のJSONを返さなくなります。

response = client.responses.create(
    model="gpt-5.5",
    input="このトランスクリプトのチャンクから、タイトル、話者、開始時刻を抽出してください。",
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "session_extract",
            "strict": True,
            "schema": {
                "type": "object",
                "required": ["title", "speaker", "start_time"],
                "properties": {
                    "title": {"type": "string"},
                    "speaker": {"type": "string"},
                    "start_time": {"type": "string", "format": "date-time"},
                },
            },
        },
    },
)

ダウンストリームコードに供給するあらゆるパイプラインでは、常にスキーマを設定してください。トークンレベルでのコストはかからず、不正な形式の出力に対して書くことになるであろうリトライループを不要にします。

ツール利用とエージェント

Responses APIは、5つのファーストパーティツールタイプを公開しています。

ここでのGPT-5.5の5.4に対する改善点はツールリストではなく、モデルが監視なしにそれらをどれだけ喜んで連携させるかです。The Decoderの再現スイートに対するテストでは、同じプロンプトでGPT-5.5は5.4よりもユーザー介入なしに11%多くの多段階ツールチェーンを完了しました。

エラー処理とリトライ

名前で処理するのに十分な頻度で発生する4つのエラーコードを想定してください。

コード 意味 リトライ?
429 rate_limit_exceeded 1分あたりまたは1日あたりの上限に達しました。 はい、指数関数的バックオフ+ジッターで。
400 context_length_exceeded 入力+出力+推論 > 100万トークン。 いいえ、入力を短くしてください。
500 server_error OpenAI側の一時的なエラー。 はい、最大3回まで。
403 policy_violation 安全ポリシーによる拒否。 いいえ、プロンプトを書き換えてください。

推論トークンはコンテキストウィンドウに対してカウントされます。90万トークンの入力に対するreasoning.effort: "xhigh"の呼び出しは、ユーザーメッセージが短くても、コンテキストオーバーフローのため400エラーになります。

Apidogでのテストワークフロー

GPT-5.5の呼び出しは非常に高価であるため、プロンプトを20回再実行してスキーマのバグを発見したくはないでしょう。最もトークンを無駄にしないワークフローは次のとおりです。

  1. リクエストをApidogで一度構築し、コレクションエントリとして保存し、環境(開発、ステージング、本番キー)にタグを付けます。
  2. 内蔵のモックサーバーを使用して、ダウンストリームコードを反復処理しながら、最後の実際のリクエストをリプレイします。
  3. スキーマが安定している場合にのみ、ライブキーに切り替えます。

ApidogはClaude CodeおよびCursor統合も提供しているため、使用するエディターレベルのエージェントから同じコレクションにアクセスできます。詳細な設定については、VS CodeでのApidogウォークスルーApidog vs. Postmanの比較を参照してください。

APIの一般公開前のGPT-5.5の呼び出し方

OpenAIがResponses APIのロールアウトを完了するまで、GPT-5.5を実際に試したい開発者にとって現実的なパスは、Codexのサインインフローです。Codex無料ガイドでは、CLIのインストール、ChatGPTアカウントでの認証、およびモデルの選択について説明しています。

FAQ

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる