OpenAI AgentKitとは？

OpenAI AgentKit は、OpenAI プラットフォーム上で AI エージェントを構築、デプロイ、測定するためのツール群です。オーケストレーションコード、コネクタ、評価スクリプトを手動でやりくりしてエージェントを構築したことがあるなら、AgentKit はその断片化に対する OpenAI の答えでした。2026 年には知っておくべき重要な変更点があるので、このガイドでは AgentKit に含まれるもの、対象者、高レベルの構築フロー、そしてエージェントが外部サービスを呼び出し始めたときに Apidog のような API テストツールがどのように役立つかを説明します。

ボタン

AgentKitとは

OpenAI は 2025 年 10 月 6 日の DevDay で AgentKit を発表しました。これは単一の製品ではなく、既存の OpenAI API と OpenAI Agents SDK の上に構築された一連のコンポーネントであり、「エージェントのアイデアがある」と「ユーザーの前でエージェントが動作している」の間のギャップを縮めることを目的としていました。

AgentKit 以前は、エージェントの構築は通常、バージョン管理のないオーケストレーションロジック、データソースごとのカスタムコネクタ、手作りの評価パイプライン、手動のプロンプトチューニング、そして何かをリリースする前にかなりの量のフロントエンド作業を寄せ集めることを意味していました。AgentKit は、これらの問題に対するソリューションをひとつの傘の下にまとめました。

まず、この情報の扱い方を変えることになる重要な点として、2026年6月3日、OpenAI は AgentKit のコンポーネントのうち Agent Builder と Evals の2つを段階的に廃止すると発表しました。詳細については以下で説明します。重要なのは、AgentKit を通じた永続的なコード優先のパスは Agents SDK であり、長続きするものを構築したいのであれば、それに依存すべきだということです。

AgentKitの構成要素

AgentKit は4つの主要コンポーネントとしてリリースされました。それぞれの役割と現在の状況を説明します。

Agent Builder

Agent Builder は、多段階のエージェントワークフローを設計するためのビジュアルキャンバスです。各ステップのノードをドラッグ＆ドロップで接続し、フローを作成し、実際の入力に対して実行をプレビューし、ワークフローのバージョン管理されたスナップショットを公開します。「空白ページがない」エントリーポイントであり、テンプレートから始めることができます。

開発者にとって便利な詳細：Agent Builder はコードから離れた行き止まりではありません。ワークフローを実行可能な Python または TypeScript としてエクスポートする Agents SDK タブがあり、視覚的なデザインを自分の環境で拡張できます。

ここでのステータスが重要です。OpenAI は Agent Builder を非推奨とし、その非推奨ページによると、プラットフォームのシャットダウン日は2026年11月30日です。今日から新たに始めるのであれば、ビジュアルキャンバスはプロトタイピングの補助として扱い、最終的には SDK コードに移行する計画を立ててください。

ChatKit

ChatKit は、ユーザーにエージェントを提供するための埋め込み可能なチャットインターフェースです。チャット UI をゼロから構築する代わりに、ウェブコンポーネントを組み込み、公開されたワークフロー ID を指定し、テーマと動作をカスタマイズします。ストリーミング応答、スレッド、および一般的なチャットの機能を処理します。

ChatKit は引き続き利用可能であり、チャットベースのエージェント体験をデプロイするための推奨される方法です。2026 年の変更による影響が最も少ない AgentKit のコンポーネントです。

Connector Registry

Connector Registry は、ChatGPT と API を含む OpenAI 製品全体でデータとツールがどのように接続されるかを管理するための管理者向けの場所です。事前構築済みのコネクタ（Dropbox、Google Drive、SharePoint、Microsoft Teams など）とサードパーティの MCP サーバーを1つのパネルに統合するため、管理者はエージェントがアクセスできるものを制御できます。

その図の MCP 側面を理解したい場合は、MCP サーバーと OpenAI Agents SDK に関する当社のガイドが、エージェントがモデルコンテキストプロトコルを介してツールを呼び出す方法を説明しています。

Evalsと最適化

Evals の機能には、データセットの追加、トレースグレーディング（多段階エージェント実行の各ステップのスコアリング）、自動プロンプト最適化、そして OpenAI のモデルだけでなくサードパーティモデルに対しても評価を行う機能が含まれていました。目標は、独自の評価ハーネスを構築することなく、エージェントの品質を測定し、プロンプトを調整することでした。

Agent Builder と同様に、Evals も段階的に廃止されます。既存ユーザーに対しては2026年10月31日に読み取り専用になり、2026年11月30日にシャットダウンされます。

AgentKitとAgents SDKの関係

これは、何を基盤に構築するかを決定するため、正しく理解しておくべき部分です。

Agents SDK はコードレベルのフレームワークです。Python または TypeScript でエージェント、ツール、ハンドオフ、およびガードレールを定義する場所です。AgentKit の Agent Builder は、SDK コードを生成する視覚レイヤーとしてその上に位置します。ChatKit は、デプロイメントサーフェスとしてその横に位置します。

レイヤー	内容	2026年時点での状況
Agents SDK	エージェント、ツール、ガードレールを定義するためのコードフレームワーク	アクティブ、推奨される長期的なパス
Agent Builder	Agents SDK コードをエクスポートするビジュアルキャンバス	非推奨、2026年11月30日にシャットダウン
ChatKit	ワークフローIDに紐付けられた埋め込み可能なチャットUI	利用可能
Connector Registry	コネクタとMCPサーバーの管理パネル	利用可能
Evals	トレースグレーディングとプロンプト最適化	2026年10月31日に読み取り専用、2026年11月30日にシャットダウン

OpenAI の移行ガイダンスは明確です。コードとして存在するべきワークフローは Agents SDK に移行し、コードを必要としない自然言語のユースケースには ChatGPT の Workspace Agents を使用してください。どこに投資すべきか判断するためにこれを読んでいるなら、エンジニアリングチームにとって Agents SDK がその答えです。

AgentKitの対象者

AgentKit はいくつかのグループをターゲットとしていました。オーケストレーションコードを書かずにエージェントを迅速にリリースしたいプロダクトチームは Agent Builder と ChatKit を利用しました。内部データへの統制されたアクセスが必要な企業は Connector Registry を使用しました。完全な制御を望むエンジニアリングチームは Agents SDK を直接利用し、Evals を使用して品質を測定しました。

非推奨化を考慮すると、2026年に向けた最も明確な解釈は次のとおりです。保守するものを構築するエンジニアであれば、Agents SDK から始めるべきです。プロトタイピングを行っており、キャンバスがなくなる前に視覚的な優位性を得たいのであれば、Agent Builder は依然として使用可能なコードをエクスポートします。

高レベルな構築フロー

視覚的に開始するかコードで開始するかに関わらず、エージェントを構築する形状は似ています。ほとんどのチームが従うフローは次のとおりです。

エージェントのジョブを定義します。どのような目標を追求し、どのようなツールが必要ですか？ツールは通常、外部 API 呼び出しです。検索エンドポイント、CRM 参照、内部マイクロサービスなどです。
ワークフローを構成します。Agent Builder ではノードをドラッグしますが、Agents SDK ではコードでエージェントを定義し、ツールとハンドオフをアタッチします。
ガードレールを追加します。OpenAI は、PII をマスクまたはフラグ付けし、ジェイルブレイクの試みを検出し、その他のチェックを適用できるオープンソースのモジュラーガードレールレイヤーを提供しています。これをワークフローノードとして、またはスタンドアロンライブラリとして使用できます。
データとツールを接続します。Connector Registry を通じて、またはエージェントが呼び出せる MCP サーバーと機能ツールを登録することによって行います。
テストと評価を行います。実際の入力に対してエージェントを実行し、トレースを評価し、プロンプトを調整します。
デプロイします。公開されたワークフロー ID を使用して ChatKit を介して埋め込むか、エクスポートされた Agents SDK コードを独自のインフラストラクチャで実行します。

ステップ4とステップ5は、実際の困難のほとんどが存在し、API テストがその価値を発揮する場所です。

現実的な例：エージェントが呼び出すツール

エージェントは、呼び出すことができるツールと同じくらい優れており、それらのツールはほとんどの場合 HTTP API です。Agents SDK に関数ツールを登録するときは、モデルがいつどのように呼び出すかを知るために JSON スキーマで記述します。顧客の最近の注文を取得するツールは、次のように定義できます。

{
  "type": "function",
  "name": "get_recent_orders",
  "description": "Look up a customer's recent orders by customer ID.",
  "parameters": {
    "type": "object",
    "properties": {
      "customer_id": {
        "type": "string",
        "description": "The customer's unique identifier"
      },
      "limit": {
        "type": "integer",
        "description": "How many orders to return",
        "default": 5
      }
    },
    "required": ["customer_id"],
    "additionalProperties": false
  }
}

モデルが get_recent_orders を呼び出すことを決定すると、コードは引数を受け取り、注文 API に実際の要求を行い、その結果をエージェントに返します。その要求は次のようになります。

curl https://api.your-company.com/v1/customers/cus_8842/orders?limit=5 \
  -H "Authorization: Bearer $ORDERS_API_KEY" \
  -H "Content-Type: application/json"

ここに落とし穴があります。エージェントの動作は、その API が何を返すかに完全に依存します。注文 API が遅い、ダウンしている、またはモデルが予期しない形式を返す場合、エージェントの推論は頓挫します。また、開発中には、注文 API がまだ存在しないか、テスト実行で本番環境に負荷をかけたくない場合があります。それが Apidog が適合する場所です。

APIテストとモックの役割

Apidog はエージェントフレームワークではなく、エージェントを構築するものではありません。AgentKit と Agents SDK がそれを実行します。Apidog が行うのはその下の層です。つまり、エージェントが呼び出す API とツールをテスト、モック、ドキュメント化します。常に3つの具体的なタスクが発生します。

第一に、外部 API が準備できる前にモックします。バックエンドチームがまだ完成していない注文サービスをエージェントが呼び出す必要がある場合、合意されたスキーマに一致する現実的な応答を返すモック API を立ち上げることができます。エージェントはバックエンドを待つことなく安定した契約に対して開発し、エッジケース、空の結果、エラー、遅い応答をオンデマンドで制御できます。

第二に、各ツールがエージェントの期待どおりのものを返すことを保証します。間違ったフィールド名で 200 を返すツール呼び出しは、完全な失敗よりも悪いものです。なぜなら、モデルはゴミデータで推論しようとするからです。ステータスコード、応答の形状、特定のフィールド値を検証するAPI テストケースを作成することで、エージェントが触れるすべてのエンドポイントで、モデルに到達する前に契約のずれを検出できます。

第三に、開発、ステージング、本番環境全体で環境キーとベース URL を管理します。エージェントツールは `$ORDERS_API_KEY` のようなシークレットを扱います。これらを環境変数に保持し、キーをコードに貼り付けることなく環境ごとに切り替えることは、API プラットフォームがクリーンに処理する種類のものです。Apidog をダウンロードしてツールエンドポイントをプロジェクトにインポートし、エージェントのランタイムから独立してテストできます。

エージェントのツール呼び出しをテスト可能な API として扱う集中的なウォークスルーが必要な場合は、AI エージェントのツール呼び出しをテストする方法にまとめています。要するに、エージェントが呼び出すすべてのツールは API であり、API にはテストが必要です。

よくある質問

OpenAI AgentKitは無料ですか？

AgentKit のツールは OpenAI API の使用の上に構築されているため、基盤となるモデルトークンとエージェントが行うすべてのツール呼び出しに対して料金を支払います。AgentKit の個別のサブスクリプション項目はありません。コストは、エージェントが生成するモデルと API の使用量です。モデル料金は変更されるため、常に OpenAI プラットフォームで現在の料金を確認してください。

AgentKitとAgents SDKの違いは何ですか？

Agents SDK は、エージェント、ツール、ガードレールを定義するためのコードフレームワークです。AgentKit は、その SDK の上にビジュアルな Agent Builder、ChatKit、Connector Registry、および Evals を含むより広範なバンドルでした。2026年後半に Agent Builder と Evals が段階的に廃止されるため、Agents SDK が永続的なコード優先のパスとなります。当社のAgents SDK ガイドで、その全体像を説明しています。

Agent Builderはなくなるのですか？

はい。OpenAI は2026年6月3日に Agent Builder と Evals プラットフォームを非推奨にすると発表しました。両方とも2026年11月30日にシャットダウンされ、Evals は2026年10月31日に読み取り専用になります。ChatKit は引き続き利用可能であり、OpenAI はコード優先のワークフローを Agents SDK に、自然言語のワークフローを ChatGPT の Workspace Agents に移行することを推奨しています。

AgentKitエージェントが呼び出すAPIをテストできますか？

はい、そしてそうすべきです。エージェントが呼び出すすべてのツールは、リクエストとレスポンスを持つ HTTP API です。それらの API がまだ構築中であってもモックし、応答がエージェントの期待するスキーマに一致することを確認し、それぞれの API が必要とするキーを管理できます。Apidog のようなプラットフォームは、これら3つすべてを処理するため、エージェントのツールは実際のユーザーに到達する前に予測可能に動作します。

結論

AgentKit は、OpenAI 開発者にエージェント構築へのより速い導入を提供しました。Agent Builder のビジュアルキャンバス、ChatKit の埋め込み可能な UI、Connector Registry の統制されたコネクタ、および Evals を通じた測定です。2026年後半に向けて Agent Builder と Evals は廃止されるため、エンジニアリングチームにとって長期的な選択肢は Agents SDK であり、ChatKit と Connector Registry がそれに伴います。

どのような道をたどるにしても、エージェントの信頼性は、それが呼び出す API にかかっています。それらを早期にモックし、応答を保証し、キーを整理しておくことが重要です。Apidog は、エージェントが依存するすべてのツールエンドポイントをテストおよびモックできる唯一の場所を提供するため、エージェントが負荷をかけたときに統合が維持されます。

ボタン