ChatGPT画像2.0の新機能とは?

Ashley Innocent

Ashley Innocent

22 4月 2026

ChatGPT画像2.0の新機能とは?

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

OpenAIは2026年4月21日に、新しいモデル**gpt-image-2**を搭載したChatGPT Images 2.0を出荷しました。これはプロンプトを読み取り、レイアウトを計画し、鮮明な多言語テキストをレンダリングし、最大10枚の画像を一度に生成できます。これらはすべて、最大2,000ピクセル幅で、古い画像モデルではサポートされていなかったアスペクト比に対応しています。

開発者にとっての目玉は、ChatGPT UIのリフレッシュではありません。それは、gpt-image-2がOpenAI APIを通じて、推論を考慮した「思考」モード、トークンごとの課金、そして既に本番環境に組み込んでいるものと同じエンドポイントパターンで公開されていることです。

このガイドでは、何が変わったのか、APIの費用、エンドツーエンドでの呼び出し方法、そして使い捨てスクリプトを書かずにApidogでテストする方法について説明します。以前の画像APIを評価し、テキストが歪んでいたり解像度が1024に制限されていたために諦めた方は、ここから始めてください。

ボタン

gpt-image-2とは?

gpt-image-2は、2026年4月21日にChatGPT Images 2.0製品と同時にリリースされた、OpenAIの第2世代画像生成モデルのIDです。API側では以前のgpt-image-1ファミリーを置き換え、ウェブおよびモバイルのChatGPT内で画像生成を担います。

2024年または2025年にOpenAIの画像生成を最後にテストした方にとって、再検討する価値がある3つの点があります。

OpenAI自身の説明では、これを「クリエイティブなおもちゃ」から「視覚的なワークフローツール」への飛躍と位置付けています。雑誌のレイアウト、インフォグラフィックス、スライドテンプレート、さらには漫画のコマまで対応します。

gpt-image-1からの変更点

以前のOpenAI画像エンドポイントを基に開発していた場合、コードレベルで重要な違いは以下の通りです。

機能 gpt-image-1 gpt-image-2
最大解像度 1024ピクセル 長辺2,000ピクセル
アスペクト比 1:1, 3:2, 2:3 1:1, 3:2, 2:3, 16:9, 9:16, 3:1, 1:3
リクエストあたりの画像数 1 スタイルの一貫性を保ちつつ最大10枚
テキストレンダリング 英語のみ、しばしば文字化け CJKおよびインド系スクリプトを含む多言語対応
推論モード なし あり(thinkingフラグ)
生成中のウェブ検索 なし あり(思考モード時)

バッチモードは最も目立たないものの、最も有用な変更点です。単一のプロンプトから、構図と配色を共有する10種類のバリエーションを返すことができ、これはデザイナーが反復作業を行う方法であり、製品チームがページセット全体で一貫したヒーロー画像を生成する方法でもあります。

提供状況と料金

ロールアウトは段階的に行われます。

料金は、OpenAI APIの料金ページによると、トークンベースです。入力テキストトークン100万あたり5ドル、出力テキストトークン100万あたり10ドル、入力画像トークン100万あたり8ドル、出力画像トークン100万あたり30ドルです。標準的な1024×1024の高品質レンダリングでは、1枚あたり約0.21ドルになります。これは前世代よりも約60%高く、より大きなキャンバスと推論ステップのコストに相当します。

特筆すべき点として、思考モードは追加の推論トークンに対して課金されるため、厳密なレイアウト指示を含む図の生成は、大まかなイラストのプロンプトよりも費用がかかります。画像あたりの一律料金を想定するのではなく、この点も予算に含めてください。

APIの呼び出し

エンドポイントは、以前のモデルと同じimages/generationsパターンに従います。最小限のリクエストは次のようになります。

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A clean product hero for an API testing platform, dark background, soft cyan lighting, a laptop showing a JSON response, sharp small-text UI labels readable",
    "size": "1536x1024",
    "n": 4,
    "quality": "high"
  }'

推論パスを有効にするには、thinkingパラメータを渡します。

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A four-panel infographic explaining OAuth 2.1 authorization code flow with PKCE. Label every arrow in English and Japanese.",
    "size": "2000x1000",
    "n": 1,
    "quality": "high",
    "thinking": "medium"
  }'

応答は、response_formatに応じてbase64画像データまたはURLを返します。スキーマはgpt-image-1から変更されていないため、モデルIDを交換した後も既存のSDKラッパーは引き続き機能します。

公式SDKを使用したPython版:

from openai import OpenAI

client = OpenAI()

result = client.images.generate(
    model="gpt-image-2",
    prompt="Minimalist dashboard UI mockup for a REST client, sentence-case labels, a latency chart in the corner.",
    size="1536x1024",
    n=4,
    quality="high",
)

for i, image in enumerate(result.data):
    with open(f"out_{i}.png", "wb") as f:
        f.write(image.b64_json.encode())  # decode() in practice

テストからの2つの実用的な注意点:

  1. 思考モードには3つの段階(lowmediumhigh)があり、レイテンシとレイアウトの正確性のバランスを取ります。チャート、表、そして数値が正確である必要がある画像の場合、mediumが便利なデフォルトです。
  2. バッチ出力(n > 1)は1回の呼び出し内でスタイルの一貫性を保ちますが、個別の呼び出し間では一貫性が失われます。一致する10枚のセットが必要な場合は、1つのリクエストで10枚を要求してください。

Apidogでgpt-image-2をテストする

コマンドラインから画像モデルを反復処理するのは苦痛です。結果をプレビューしたり、プロンプトを交換したり、バージョン管理したりすることはできません。専用のAPIクライアントが適切なツールであり、すでにPostmanやターミナルのRESTツールを使用している場合は、画像応答をネイティブに処理できる専用の代替ツールを検討してください。

画像応答がインラインで表示されているApidogのインターフェース。

Apidogは、OpenAI画像エンドポイントをファーストクラスのリクエストとして扱います。OpenAI OpenAPI仕様をインポートし、OPENAI_API_KEYを環境変数として設定し、プロンプトを本文に貼り付けて送信を押します。画像応答はbase64またはURL形式でインラインにレンダリングされ、リクエストをバリアントにフォークして、アスペクト比、品質ティア、思考モードを並べて比較できます。

便利なワークフロー:

  1. Apidogコレクションにgpt-image-2リクエストを作成します。
  2. 2つの環境を保存します。1つはthinking: "off"、もう1つはthinking: "medium"に設定します。
  3. 同じプロンプトを両方で実行し、出力を比較し、最適なものをプロンプトライブラリに保存します。
  4. 各アセットタイプ(バナー、スライドカバー、インフォグラフィック)ごとにコレクションをフォークし、それぞれが独自の調整されたパラメータセットを持つようにします。

呼び出しを連鎖させることもできます。画像を生成した後、同じApidogテスト実行内でそのURLをCDNアップロードエンドポイントに投稿します。これはcurlスクリプトではうまくできない部分です。

汎用HTTPクライアントで画像生成の実験を行ってきたのであれば、ここで真のAPIプラットフォームがその価値を発揮します。Apidogをダウンロードし、OpenAIキーを指し示してください。セットアップは5分もかかりません。

gpt-image-2が依然として苦手とする点

発表は力強いものですが、正直なところ限界も存在します。

The DecoderとPetaPixelはどちらも、実践的な記事で同様の限界を指摘しています。より詳細な分析については、The Decoderのレビューをご覧ください。

2026年の他の画像生成分野との比較

OpenAIは、推論と画像を組み合わせた分野で唯一ではありません。GoogleのNano Banana 2は数週間前にリリースされ、いくつかのオープンウェイトマルチモーダルモデルがテキストレンダリングのギャップを縮めています。

API側で代替案を評価しているのであれば、以下の関連する詳細記事が参考になります。

テキストの正確性、構図に対する推論、およびOpenAIスタックの他の部分との統合がコストよりも重要である場合は、gpt-image-2を選択してください。自己ホスティング、画像あたりのコスト削減、または商用出力向けの寛容なライセンスが必要な場合は、オープンウェイトのマルチモーダルモデルを選択してください。

よくある質問

gpt-image-2はChatGPTの無料ティアで利用できますか?はい。標準モードはすべてのChatGPTユーザーが利用できます。思考モード、拡張された推論、生成中のウェブ検索は、Plus、Pro、Businessに限定されています。APIアクセスは別個のもので、OpenAI開発者アカウントに紐付けられます。すでに使用しているレート制限ティアが適用されます。

gpt-image-2は画像編集やインペインティングをサポートしていますか?このリリースは、バッチおよび思考モードによるテキストから画像への生成に焦点を当てています。編集スタイルのエンドポイント(画像 + マスク)は、前世代と同じパターンに従いつつ、新しいモデルIDの下で提供されると予想されます。インペインティングを前提に開発する前に、gpt-image-2モデルページを確認してください。

どの解像度とアスペクト比をサポートしていますか?長辺最大2,000ピクセルで、1:1、3:2、2:3、16:9、9:16、3:1、1:3のアスペクト比に対応しています。これにより、アップスケーリングなしでヒーローバナー、縦型ショート動画、スクエアソーシャル、LinkedInスタイルの横長クロップがカバーされます。

gpt-image-2のリクエストを迅速にテストする方法は?専用のAPIクライアントを使用してください。Apidogは、画像応答をインラインでレンダリングし、プロンプトをコレクション変数として保存し、思考モードを並べて比較できます。コマンドラインワークフローから移行するチームは、しばしば当社のPostmanなしでのAPIテストガイドと組み合わせて利用します。

APIを通じて画像を1枚生成するのにどのくらい費用がかかりますか?標準モードの1024×1024高品質で、およそ0.21ドルです。思考モードでは追加の推論トークンが加算されるため、レイアウトが複雑なプロンプトでは画像あたりの費用が変動することを考慮に入れてください。正確なトークン料金については、OpenAI料金ページをご覧ください。

モデルは生成中にウェブ検索できますか?はい、思考モードで可能です。モデルは生成中に参照画像や事実を引き出すことができ、これにより図の正確性(正しい数値を含むチャート、正しいラベルを含む地図)が向上します。標準モードでは検索しません。

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる