Apidog

オールインワン協働API開発プラットフォーム

API設計

APIドキュメント

APIデバッグ

APIモック

API自動テスト

Google Gemini 2.5 ProをOpen Codex CLI(オープンコーデックスCLI)と共に使う方法

中村 拓也

中村 拓也

Updated on 4月 18, 2025

Open Codex CLIは大規模言語モデル(LLM)の力を直接ターミナルのワークフローに持ち込むオープンソースのツールです。このガイドは、GoogleのGemini 2.5 Proのような最も先進的なモデルの1つをOpen Codex CLI環境内で活用することに特に焦点を当てています。

Open Codex CLIは、元のOpenAI Codex CLIのフォークであり、そのコア機能は維持しつつ、Google Geminiを含む複数のAIプロバイダーへのサポートを追加することで、機能を大幅に拡張しています。これにより、開発者は親しみのあるターミナルインターフェース内で作業しながら、タスクに最適なモデルを選択できます。複雑なコーディングの質問を投げかけたり、ボイラープレートコードを生成したり、既存の関数をリファクタリングしたり、複雑なスクリプトを説明したり、ビルドコマンドをオーケストレーションしたりすることを想像してみてください。すべてGeminiの知能によって駆動され、コマンドラインを離れずに実現できます。

この記事では、Open Codex CLIをGoogle Gemini 2.5 Proと特に使用するためのインストール、設定、使用方法についての包括的なステップバイステップガイドを提供します(執筆時点でのOpen Codex CLI設定に記載されているgemini-2.5-pro-preview-03-25モデルバージョンを指します)と、その兄弟モデルであるgemini-2.0-flashも含まれています。ワークフローを最適化しようとする経験豊富な開発者でも、AIコーディングアシスタントに新しいあなたでも、この強力な組み合わせを活用する方法を学ぶことができます。

💡
美しいAPIドキュメントを生成する素晴らしいAPIテストツールを探していますか?

最大の生産性で開発チームが共同作業できる統合のオールインワンプラットフォームを探していますか?

Apidogはあなたの要求をすべて満たし、Postmanをより手頃な価格で置き換えます
ボタン

なぜOpen Codex CLIをGeminiと一緒に使うのか?

Open Codex CLIとGemini 2.5 Proを組み合わせることで魅力的な利点が得られます:

  • ターミナルネイティブワークフロー:コマンドラインを好む開発者にとって、Open Codex CLIはシームレスな統合を提供します。エディタ、ターミナル、AI支援用の別のブラウザウィンドウの間で文脈を切り替える必要がありません。これにより、反復が速くなり、邪魔されることが少なくなります。
  • オープンソースで柔軟:オープンソースであるため(npmのopen-codex)、ツールは透明性を提供し、コミュニティの貢献の可能性があります。複数のプロバイダーへのサポート(Gemini、OpenAI、OpenRouter、Ollama)により、コアツールを変更することなく、必要に応じてモデルやプロバイダーを切り替える柔軟性を持っています。
  • 強力なAI機能:Gemini 2.5 Proは最先端の推論、コード生成、理解機能を提供します。これにより、より複雑なタスク、高品質のコード提案、CLI内でのより深い分析が可能になります。
  • アクション指向:単純なチャットボットとは異なり、Open Codex CLIはアクションのために設計されています。ローカルファイルを読み込むことで文脈を把握し、ファイルの変更(パッチ)を提案し、安全なサンドボックス内でシェルコマンドを実行し、真のチャット駆動の開発を可能にします。
  • セキュリティ重視:CLIは、シェルコマンドなどの潜在的に危険な操作を安全に実行するためのサンドボックスメカニズム(macOSのApple Seatbelt、LinuxではDocker推奨)を取り入れています。特に自動承認モードを使用する際には、デフォルトでネットワークが無効になり、ディレクトリがサンドボックス化された状態でコマンドが実行されます。
  • バージョン管理の統合:ツールはGitと連携して動作するように設計されています。デフォルトでは、ファイルを変更する前に承認を必要とし、作業ディレクトリに影響を及ぼす前に変更をレビューできるようにし、安全ネットを常に持つことが保証されます。

前提条件

始める前に、次のものを確認してください:

  1. オペレーティングシステム:macOS 12以上、最新のLinuxディストリビューション(Ubuntu 20.04以上、Debian 10以上)、またはWindows 10/11でWindows Subsystem for Linux(WSL2)を使用している必要があります。直接のWindowsサポートはありません。
  2. Node.js:バージョン22以上が必要です。LTS(長期サポート)バージョンが一般的に推奨されます。ターミナルでnode -vを実行してバージョンを確認できます。Node.jsはnodejs.orgからダウンロードします。
  3. Google CloudアカウントおよびGemini APIキー:Geminiモデルへのリクエストを認証するためのAPIキーが必要です。このキーは、Google AI StudioまたはGoogle Cloud Consoleを通じて取得できます。このキーはアカウントにリンクされているため、安全に保管してください。
  4. ターミナルの使い方がわかる:システムのコマンドラインインターフェース(ターミナル、iTerm、Bash、Zshなど)を基本的に使用したことがあることが前提です。

ステップ1:Open Codex CLIのインストール

Open Codex CLIをインストールする推奨方法は、Node.jsにバンドルされているnpm(Node Package Manager)を介してグローバルにインストールすることです。ターミナルを開いて次のコマンドを実行します:

npm install -g open-codex

代わりに、Yarnをパッケージマネージャーとして使用している場合は、次のコマンドを実行できます:

yarn global add open-codex

このコマンドはopen-codexパッケージをダウンロードし、ターミナルのどこからでもopen-codexコマンドを使用できるようにします。グローバルnpmインストールにはsudoを使用しないでください;権限の問題が発生した場合は、npmの権限を修正するのが良いです。

インストールされているか確認するには、open-codex --versionまたはopen-codex --helpを実行します。

ステップ2:Geminiアクセスの設定

Geminiモデルを使用するには、Open Codex CLIがあなたのAPIキーを必要とし、geminiプロバイダーを使用することを知っている必要があります。これには主に2つの方法があります:

方法1:環境変数(クイックスタート/テスト向け推奨)

APIキーを提供する最も簡単な方法は、環境変数を使用することです。Open Codex CLIは、geminiプロバイダーが選択されたときに、特にGOOGLE_GENERATIVE_AI_API_KEYを探します。

ターミナルで次のコマンドを実行し、"YOUR_API_KEY_HERE"を実際のGemini APIキーに置き換えます:

export GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE"

重要:このコマンドは現在のターミナルセッションにのみ環境変数を設定します。ターミナルを閉じたり、新しいターミナルを開いたりすると、再度コマンドを実行する必要があります。

APIキーを永続的に利用できるようにするには、export行をシェルの設定ファイルに追加する必要があります。一般的なファイルは以下です:

  • ~/.zshrc(Zshの場合、最近のmacOSのデフォルト)
  • ~/.bashrcまたは~/.bash_profile(Bashの場合)

適切なファイルにexport GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE"の行を追加し、保存してからターミナルを再起動するか、source ~/.zshrc(または関連するファイルパス)を実行して変更を適用します。

その後、--providerフラグを使用して各コマンド呼び出し時にGeminiを指定できます:

open-codex --provider gemini "フランスの首都はどこですか?"

方法2:設定ファイル(永続的な設定向け推奨)

特にGeminiを一貫して使用する予定がある場合は、Open Codex CLI設定ファイルを使用してより永続的な設定が可能です。CLIは~/.codex/config.jsonに設定ファイルがあるかを探します。

ディレクトリが存在しない場合は作成します:mkdir -p ~/.codex

設定ファイルを作成して開きます:nano ~/.codex/config.json(または好きなテキストエディタを使用)

Geminiをデフォルトプロバイダーとして指定するために、次のJSONコンテンツを追加します:

{
  "provider": "gemini"
}

オプションでデフォルトのGeminiモデルを設定することもできます。Open Codex CLIはgemini-2.5-pro-preview-03-25をデフォルトの「あいまいな」モデルとし、gemini-2.0-flashをデフォルトの「フルコンテキスト」モデルとして定義しています。大部分のインタラクションにおいて強力な2.5 Proモデルをデフォルトとして明示的に設定するには、次のようにします:

{
  "provider": "gemini",
  "model": "gemini-2.5-pro-preview-03-25"
}

ファイルを保存してエディタを終了します。

重要なことに、プロバイダーとモデルを設定するために設定ファイルを使用している場合でも、GOOGLE_GENERATIVE_AI_API_KEY環境変数を依然として設定する必要があります。設定ファイルはCLIにどのプロバイダーを使用するかを指示しますが、環境変数はそのプロバイダーに対する資格情報を提供します。

設定ファイルが設定されたので、open-codexを単に実行するだけで、指定されたGeminiプロバイダーを使用することができます:

open-codex "フランスの首都はどこですか?"

ステップ3:Geminiとの基本的な使用法

Open Codex CLIがインストールされ、Gemini用に設定されたので、これを使ってどのようにインタラクトするかを探ってみましょう。

インタラクティブモード(REPL)

チャットのような体験をするには、特定のプロンプトなしでCLIを実行します:

open-codex
# もしconfig.jsonにデフォルトプロバイダーを設定していない場合は:
# open-codex --provider gemini

これにより、リード・エval・プリントループ(REPL)が開始され、プロンプトを入力して応答を得て、Geminiと継続的な会話ができます。

❯ open-codex --provider gemini
Open Codex CLIへようこそ!リクエストを入力し、Enterを2回押して送信してください。
> Gemini 2.5 Proモデルについて教えてください。

プロンプトを送信するには、Enterを2回押します。Geminiはターミナル内で応答します。フォローアップの質問を入力することで会話を続けることができます。

直接のプロンプト

1回限りのリクエストには、プロンプトを直接引数として渡すことができます。config.jsonでデフォルトが設定されていない場合は、プロバイダーフラグが必要です。--modelまたは-mフラグを使用して正確なモデルを指定することもできます:

  • デフォルトのGeminiモデルを使用(設定されている場合):
open-codex "Pythonにおけるクロージャの概念を説明してください。"
  • プロバイダーとモデルを明示的に指定する:
open-codex --provider gemini --model gemini-2.5-pro-preview-03-25 "現在のディレクトリとそのサブディレクトリ内のすべてのファイルを探すbashスクリプトを書いてください。"
  • 他のGeminiモデルを使用(例:Flashによる迅速/安価なタスクのため):
open-codex --provider gemini --model gemini-2.0-flash "フックに関するReactのドキュメントの主要なポイントを要約してください。"

CLIはGeminiを使ってリクエストを処理し、応答を標準出力に直接出力します。

ステップ4:Geminiを使ったOpen Codexの機能の活用

Open Codex CLIの真の力は、Geminiによってガイドされてプロジェクトのローカル開発環境と対話できる能力にあります。

ファイルシステムのインタラクション

GeminiはOpen Codex CLIを通じて、リクエストの文脈を得るために現在のプロジェクトのファイルを読み取ることができます。また、ファイルへの変更(書き込みまたはパッチ)を提案することもできます。

  • ファイルの読み込み:プロンプトにファイル名を含めると、CLIはしばしば自動的にそれらを読み取り、Geminiに文脈を提供します。
# 'calculate.js'というファイルがあると仮定します。
open-codex --provider gemini "「calculate.js」を読み込み、可読性向上の提案をしてください。"
  • ファイルの書き込み/パッチ:ファイルの変更をGeminiに求めると、CLIは差分(提案された変更の概要)を生成し、適用する前に承認を求めます。
open-codex --provider gemini "2つの引数を受け取り、その差を返す「subtract」という名前の新しい関数を「calculate.js」に追加してください。"

CLIは提案された変更を出力し、プロンプトを出します:パッチを適用しますか?[y/N]yを押して承認するか、nを押して拒否します。

コマンドの実行

Open Codex CLIは、Geminiが提案するシェルコマンドを実行することもできます。これは強力ですが、注意が必要です。

  • 承認モード:--approval-mode(あるいは-a)フラグが自律性のレベルを制御します:
  • suggest(デフォルト):すべてのファイル変更とすべてのシェルコマンドに対する明示的な承認が必要です。開始時にお勧めです。
  • auto-edit:ファイル変更を自動的に適用しますが、シェルコマンドに対する承認は求めます。
  • full-auto:ファイル変更を自動的に適用し、シェルコマンドも実行します(サンドボックス内)。信頼できないリポジトリでは特に注意して使用してください。
  • サンドボックス化:auto-editおよびfull-autoモードでは、コマンドはネットワークが無効になり、現在の作業ディレクトリと一時ファイルに制限されて実行されます。
  • 例(デフォルトの'suggest'モード):
open-codex --provider gemini "pipを使用して「requests」ライブラリをインストールしてください。"

Geminiはコマンドpip install requestsを提案するかもしれません。CLIはコマンドを表示し、コマンドを実行しますか?[y/N]と尋ねます。

プロジェクトコンテキスト(codex.md

Geminiにプロジェクトに関する持続的な指示やコンテキストを提供するために、codex.mdファイルを作成できます。CLIはこれらのファイルを次の順序で読み取ります:

  1. ~/.codex/instructions.md(グローバル、個人的な指示)
  2. codex.md(リポジトリのルートにあるプロジェクト全体のノート)
  3. codex.md(現在の作業ディレクトリにあるサブディレクトリ特有のノート)

これにより、Geminiの振る舞いをガイドしたり、プロジェクトの標準、使用されているライブラリに関する情報を提供したりすることができ、毎回のプロンプトで繰り返し記載する手間が省けます。

トラブルシューティングとヒント

  • APIキーのエラー:GOOGLE_GENERATIVE_AI_API_KEYが正しく設定され、エクスポートされており、現在のターミナルセッションでアクセス可能であることを確認してください。タイプミスを再確認してください。
  • モデルが見つからない:gemini-2.5-pro-preview-03-25gemini-2.0-flashなどのモデル名がサポートされているか、構成されているものと一致することを確認してください。~/.codex/config.jsonを確認するか、--modelフラグを正しく使用してください。
  • プロバイダーエラー:config.jsonまたは--provider geminiフラグを介してプロバイダーがgeminiに設定されていることを確認してください。
  • 詳細ログ:デバッグのためにコマンドをDEBUG=true環境変数を前に付けて実行します:DEBUG=true open-codex --provider gemini "私のプロンプト"。これにより、詳細なリクエスト/レスポンス情報が表示されます。
  • シンプルに始める:単純なプロンプトから始め、GeminiとCLIのインタラクションに慣れるにつれて徐々に複雑さを増していくことをお勧めします。
  • 承認を慎重にレビュー:特にファイル変更やコマンドの実行を扱う際には、承認する前に提案された変更やコマンドを常に確認してください(yと応答すること)。

結論

GoogleのGemini 2.5 Proによって強化されたOpen Codex CLIは、あなたのターミナルをインテリジェントなコーディングアシスタントに変換します。このガイドに示された手順に従うことで、コマンドラインから直接先進的なAI機能を日々の開発ワークフローにシームレスに統合することができます。

迅速なコードスニペットや説明から、複雑なリファクタリングやスクリプト実行まで、この組み合わせは生産性を大幅に向上させ、タスクを簡素化する大きな可能性を提供します。このツールのサンドボックス化およびユーザー承認を通じたセキュリティに重点を置いた設計、複数のプロバイダーサポートとオープンソースの特性により、ターミナル内でAIを活用しようとする開発者にとって魅力的な選択肢となります。

さまざまなプロンプトを試し、さまざまな承認モードを探求し(注意深く!)、GeminiとOpen Codex CLIがあなたのコーディング体験をどのように向上させることができるかを発見してください。

💡
美しいAPIドキュメントを生成する素晴らしいAPIテストツールを探していますか?

最大の生産性で開発チームが共同作業できる統合のオールインワンプラットフォームを探していますか?

Apidogはあなたの要求をすべて満たし、Postmanをより手頃な価格で置き換えます
ボタン