GPT-5.5は2026年4月23日にリリースされ、開発者向けのニュースはシンプルです。OpenAIは同日、ChatGPTとCodex内でモデルを公開し、ResponsesおよびChat Completions APIについては「近日中に」対応すると表明しました。このガイドでは、その両面について説明します。つまり、キーが機能し始めたらすぐにGPT-5.5を呼び出す方法と、初期テスターがCodexサインインパスを通じて現在どのように利用しているかです。
このガイドでは、エンドポイントの形式、認証、PythonおよびNodeの例、全パラメーター表、思考モードの料金計算、エラー処理、そしてイテレーション時にクレジットを節約できるApidogでのテストワークフローについて説明します。
モデルの製品レベルの概要については、GPT-5.5とはを参照してください。完全なフリーティアパスについては、GPT-5.5 APIを無料で使う方法を参照してください。
TL;DR
- GPT-5.5は、ResponsesおよびChat Completionsエンドポイントで提供されます。モデルIDは
gpt-5.5です。Pro版はgpt-5.5-proです。 - APIの料金は、入力100万トークンあたり$5、出力100万トークンあたり$30です。Pro版は入力100万トークンあたり$30、出力100万トークンあたり$180です。
- コンテキストウィンドウは、APIでは100万トークン、Codex CLI内では40万トークンです。
- APIの一般公開が完了するまでは、開発者はChatGPTサインインを使用してCodex経由でGPT-5.5を利用できます。
- コレクションを事前に構築するにはApidogを使用してください。リクエスト形式はGPT-5.4と一致し、新しいモデルIDと拡張された
reasoningブロックが追加されています。
前提条件
最初のリクエストを発行する前に、以下の4つの項目を準備してください。
- 課金可能なティアを持つOpenAI開発者アカウント。ChatGPT PlusまたはProのサブスクリプションはAPI課金とは別です。UIアクセスとプログラムによるアクセスの両方が必要な場合は、両方必要です。
- GPT-5モデルファミリーへのアクセス権を持つAPIキー。本番ワークロードでは、ユーザーキーよりもプロジェクトスコープのキーを強く推奨します。
gpt-5.5をサポートするSDKバージョン。Pythonではopenai>=2.1.0、Nodeではopenai@5.1.0以降です。- ターミナルを乱雑にすることなくリクエストをリプレイできるAPIクライアント。curlは1回の呼び出しには機能しますが、その後はApidogなどに切り替えてください。
キーを一度エクスポートします。
export OPENAI_API_KEY="sk-proj-..."
エンドポイントと認証
GPT-5.5は、他のGPT-5ファミリーと同じ2つのエンドポイントで利用できます。
POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions
Responses APIはOpenAIの新しいツール対応インターフェースであり、思考モード、ウェブ検索、コンピューター利用がすべてきれいに組み込まれます。Chat Completionsも依然として機能し、ほとんどのレガシー統合を引き継いでいます。
認証はベアラー(Bearer)トークンです。すべてのリクエストは、モデルID、プロンプトまたはメッセージ配列、および任意のパラメーターを含むJSONボディを受け取ります。
curl https://api.openai.com/v1/responses \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
"reasoning": { "effort": "medium" }
}'
呼び出しが成功した場合、メッセージのoutput配列と、入力、出力、推論トークンに分けられたusageブロックを含むJSONオブジェクトが返されます。失敗した場合は、codeと人間が読めるmessageを含む標準のOpenAIエンベロープが返されます。このガイドの最後にあるエラーテーブルには、最初に出くわす可能性のあるエラーが網羅されています。
リクエストパラメーター
ボディ内のすべてのフィールドは、コストまたは動作のいずれかにマッピングされます。以下にgpt-5.5の完全なマッピングを示します。
| パラメーター | 型 | 値 | 備考 |
|---|---|---|---|
model |
string | gpt-5.5、gpt-5.5-pro |
必須。Pro版は入力と出力がそれぞれ6倍のコストがかかります。 |
input / messages |
stringまたは配列 | プロンプトまたはチャット配列 | 必須。Responsesではinput、Chat Completionsではmessages。 |
reasoning.effort |
string | none、low、medium、high、xhigh |
デフォルトはlow。xhighはトークンコストを伴う思考スタイルの深度を解除します。 |
max_output_tokens |
integer | 1 – 128000 | 推論トークンを除く出力の厳密な上限。 |
tools |
配列 | Function、web_search、file_search、computer_use、code_interpreter | ツールの定義。モデルがそれらを選択し、連結します。 |
tool_choice |
stringまたはオブジェクト | auto、none、または指定されたツール |
特定のツールが必要だと分かっている場合に強制的に呼び出します。 |
response_format |
オブジェクト | { "type": "json_schema", "schema": {...} } |
構造化された出力。厳密モードがデフォルトになりました。 |
stream |
boolean | true / false | サーバー送信イベント。推論トークンは個別のイベントとして到着します。 |
user |
string | 自由形式 | 不正検出に使用されます。ハッシュ化されたユーザーIDを渡します。 |
metadata |
オブジェクト | 最大16組のキーと値のペア | OpenAIダッシュボードとログに表示されます。 |
seed |
integer | 任意のint32 | ソフトな決定論。同じプロンプトと同じシードは近い結果になりますが、同一ではありません。 |
temperature |
number | 0 – 2 | reasoning.effort >= mediumの場合、無視されます。 |
最もコストに影響を与える3つのフィールドは、reasoning.effort、max_output_tokens、およびtoolsです。reasoning.effort: "high"または"xhigh"での思考スタイルの実行は、lowでの実行に比べて出力トークン数を簡単に3〜8倍増やすことができます。
Pythonの例
GPT-5.5のSDK形式はGPT-5.4 Responses APIに準拠しています。唯一の違いは、モデルIDと拡張されたreasoning.effortの範囲です。
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
input=[
{
"role": "system",
"content": "あなたはシニアGoエンジニアです。簡潔で実行可能なコードで回答してください。",
},
{
"role": "user",
"content": (
"並行処理が制限され、コンテキストキャンセルパスを持つワーカープールを記述してください。サードパーティの依存関係は不要です。"
),
},
],
reasoning={"effort": "medium"},
max_output_tokens=4000,
)
print(response.output_text)
print(response.usage.model_dump())
注目すべき2点:
response.output_textはoutput配列を平坦化します。構造化されたイベント(ツール呼び出し、推論トレース、引用)が必要な場合は、response.outputを直接読み取ってください。usageは現在、input_tokens、output_tokens、reasoning_tokensを個別のカウンターとして返します。これら3つすべてに対して課金されます。
Nodeの例
import OpenAI from "openai";
const client = new OpenAI();
const response = await client.responses.create({
model: "gpt-5.5",
input: [
{ role: "system", content: "あなたは慎重なレビュアーです。" },
{
role: "user",
content:
"このマイグレーションをレビューし、書き込み負荷の高いテーブルを200ms以上ロックする可能性のある操作をすべて指摘してください。",
},
],
reasoning: { effort: "high" },
tools: [{ type: "file_search" }],
max_output_tokens: 6000,
});
console.log(response.output_text);
console.log(response.usage);
タスクがレビュー形式で、見落としのコストが推論トークンの数セントの追加コストよりも大きい場合は、reasoning.effortをhighに設定してください。
思考モード
GPT-5.5の思考モードは異なるモデルIDではありません。reasoning.effortをhighまたはxhighに設定し、より長いmax_output_tokensバジェットと組み合わせた標準のgpt-5.5モデルの実行です。OpenAIのChatGPT UIではトグルとして公開されていますが、APIではリクエストごとに制御します。
2つの経験則:
mediumをデフォルトとして使用してください。これはほとんどのエージェント的な作業、複数ファイルのデバッグ、ドキュメント生成をカバーします。GPT-5.4と比較してコストはほぼ横ばいです。highとxhighは、研究、正確性が重要なレビュー、および長いツールチェーンのために確保してください。出力トークン数の3〜8倍の予算を見込み、30秒以内に返されると仮定するのではなく、応答時間を計測してください。
リクエストがcomputer_useや長いウェブ検索チェーンに触れる場合、思考レベルの労力は費用をかける価値があります。OpenAIが発表記事で言及した幻覚の減少は、主にこれらのワークフローで現れます。
構造化出力
GPT-5.5では厳密なJSON出力がデフォルトです。スキーマを渡すと、SDKは不正な形式のJSONを返さなくなります。
response = client.responses.create(
model="gpt-5.5",
input="このトランスクリプトのチャンクから、タイトル、話者、開始時刻を抽出してください。",
response_format={
"type": "json_schema",
"json_schema": {
"name": "session_extract",
"strict": True,
"schema": {
"type": "object",
"required": ["title", "speaker", "start_time"],
"properties": {
"title": {"type": "string"},
"speaker": {"type": "string"},
"start_time": {"type": "string", "format": "date-time"},
},
},
},
},
)
ダウンストリームコードに供給するあらゆるパイプラインでは、常にスキーマを設定してください。トークンレベルでのコストはかからず、不正な形式の出力に対して書くことになるであろうリトライループを不要にします。
ツール利用とエージェント
Responses APIは、5つのファーストパーティツールタイプを公開しています。
web_search— リアルタイム検索。結果ごとの引用付き。file_search— アップロードされたファイルのベクター検索。code_interpreter— サンドボックス化されたPython。computer_use— Operatorスタックを介したマウス、キーボード、ブラウザ。function— 独自のコールバック。
ここでのGPT-5.5の5.4に対する改善点はツールリストではなく、モデルが監視なしにそれらをどれだけ喜んで連携させるかです。The Decoderの再現スイートに対するテストでは、同じプロンプトでGPT-5.5は5.4よりもユーザー介入なしに11%多くの多段階ツールチェーンを完了しました。
エラー処理とリトライ
名前で処理するのに十分な頻度で発生する4つのエラーコードを想定してください。
| コード | 意味 | リトライ? |
|---|---|---|
429 rate_limit_exceeded |
1分あたりまたは1日あたりの上限に達しました。 | はい、指数関数的バックオフ+ジッターで。 |
400 context_length_exceeded |
入力+出力+推論 > 100万トークン。 | いいえ、入力を短くしてください。 |
500 server_error |
OpenAI側の一時的なエラー。 | はい、最大3回まで。 |
403 policy_violation |
安全ポリシーによる拒否。 | いいえ、プロンプトを書き換えてください。 |
推論トークンはコンテキストウィンドウに対してカウントされます。90万トークンの入力に対するreasoning.effort: "xhigh"の呼び出しは、ユーザーメッセージが短くても、コンテキストオーバーフローのため400エラーになります。
Apidogでのテストワークフロー
GPT-5.5の呼び出しは非常に高価であるため、プロンプトを20回再実行してスキーマのバグを発見したくはないでしょう。最もトークンを無駄にしないワークフローは次のとおりです。
- リクエストをApidogで一度構築し、コレクションエントリとして保存し、環境(開発、ステージング、本番キー)にタグを付けます。
- 内蔵のモックサーバーを使用して、ダウンストリームコードを反復処理しながら、最後の実際のリクエストをリプレイします。
- スキーマが安定している場合にのみ、ライブキーに切り替えます。
ApidogはClaude CodeおよびCursor統合も提供しているため、使用するエディターレベルのエージェントから同じコレクションにアクセスできます。詳細な設定については、VS CodeでのApidogウォークスルーとApidog vs. Postmanの比較を参照してください。
APIの一般公開前のGPT-5.5の呼び出し方
OpenAIがResponses APIのロールアウトを完了するまで、GPT-5.5を実際に試したい開発者にとって現実的なパスは、Codexのサインインフローです。Codex無料ガイドでは、CLIのインストール、ChatGPTアカウントでの認証、およびモデルの選択について説明しています。
FAQ
gpt-5.5-miniはありますか?
ローンチ時点ではありません。OpenAIはgpt-5.4-miniをコスト最適化されたSKUとして維持しました。- コンテキストウィンドウはどれくらいですか?
APIでは100万トークン。Codex CLIでは40万トークン。両方とも推論トークンを含みます。 - GPT-5.4のコードを書き直す必要がありますか?
いいえ。モデルIDを交換し、思考レベルの出力が必要な場合はmax_output_tokensを広げ、ワークロードに合わせてreasoning.effortを再調整してください。 - コストを削減するにはどうすればよいですか?
3つの方法があります:バッチ(50%オフ)、フレックス(50%オフ、キューイングが遅い)、そしてリトライループをなくすための厳密なスキーマ。料金の詳細については、GPT-5.5の料金内訳を参照してください。 - APIのGA発表はどこで確認できますか?
OpenAI開発者コミュニティとOpenAI API料金ページが、最も速い公開情報源です。
