開発者や企業は、GoogleのGeminiシリーズのような高度なマルチモーダルモデルを本番アプリケーションに活用する機会が増えています。Googleが2025年11月にGemini 3 Proプレビューモデルをリリースするにあたり、そのAPIコストを理解することは、予算編成と規模拡大にとって不可欠です。Google AI StudioとVertex AIを通じてアクセス可能なこのプレビュー版では、推論能力の向上、より長いコンテキストウィンドウ、およびネイティブなツール利用が導入されています。
Googleは、プレビューアクセス向けにGemini 3 APIの料金を、純粋な従量課金制のトークンベースで設定しています。AI Studioでの限定的な使用を除き、無料の1日あたりのクォータはありませんが、プレビューモデルは初期リリース期間中、料金が割引されたり免除されたりすることがよくあります。この記事では、2025年11月18日時点での公式プレビューバナーからの確定料金を詳述します。
Gemini 3 Proプレビューの主要機能
Googleは、Gemini 3 ProにGemini 2.5を凌駕する画期的な改善を施しています。長文コンテキスト推論(安定版リリースでは100万〜200万トークンを想定)、ネイティブなツール利用、構造化出力、およびマルチモーダルな理解において優れています。開発者は、複雑なエージェントワークフロー、動画分析、実行フィードバックを伴うコード生成、高度な思考連鎖プロンプトにこれを利用します。

このモデルは、ストリーミング応答、関数呼び出し、システム指示をネイティブにサポートしています。さらに、動画入力を直接処理できるため、教育、コンテンツ作成、科学研究におけるアプリケーションに最適です。
プレビューフェーズでは、「New」バッジ付きでGoogle AI Studioでの早期アクセスが可能です。本番環境のワークロードは、Googleがモデルを安定化させると(通常、プレビュー公開から数週間以内)、完全なGemini 3 APIに移行します。
Gemini 3 Pro APIの公式料金内訳(2025年11月)
Googleは、Gemini 3 Proプレビューの料金を、消費されたトークンに基づいて厳密に設定しており、明確なコンテキスト長ブレークポイントがあります。
| コンテキスト長 | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| 20万トークン以下 | $2.00 | $12.00 |
| 20万トークン超 | $4.00 | $18.00 |
これらの料金は、課金が有効になった場合、Gemini APIおよびAI Studioのgemini-3-pro-previewモデルに適用されます。Googleは、プロンプトからの入力トークン(テキスト+マルチモーダルコンテンツ)と、生成されたテキストまたは構造化データからの出力トークンをカウントします。動画および音声入力は、持続時間と解像度に基づいて同等のトークン数に変換されます。
Googleはプレビュー版では、バッチ割引やコンテキストキャッシング割引をまだ提供していません。ただし、Google検索との連携(グラウンディング)は、AI Studioの1日あたりの制限までは引き続き無料です。ファインチューニングはプレビュー版では利用できませんが、安定版のリリース時に導入されます。
Google AI Studioの利用は、合理的な実験のために無料ですが、Cloudプロジェクトをリンクすると、大量のAPI呼び出しやスクリプトによるAPI呼び出しは自動的に従量課金制に移行します。
Gemini 3 Proでのトークンカウントの仕組み
Googleは、以前のGeminiモデルと同じトークナイザーを使用してトークンをカウントします。テキストは平均してトークンあたり約4文字ですが、画像や動画は固定の等価物を使用します(例:1分間の720p動画は約1万〜1万5千トークンに相当し、コンテンツの複雑さによって異なります)。
開発者は、countTokensエンドポイントを事前に呼び出すことで、正確なコストをプレビューできます。
from google.generativeai import GenerativeModel, count_tokens
model = GenerativeModel("gemini-3-pro-preview")
tokens = count_tokens(model, contents=["Your prompt here..."])
print(tokens.total_tokens)
この手順は、特に20万トークンを超える長文コンテキストのプロンプトで料金が2倍になる場合など、予期せぬ事態を防ぎます。
Gemini 3 Pro APIの実際のコスト計算
エンジニアは、以下の例を用いて費用を正確に見積もります。
標準的なチャットクエリ(入力5K + 出力1K、20万未満のコンテキスト)
→ 入力:5K × $2 / 1M = $0.00001
→ 出力:1K × $12 / 1M = $0.000012
→ 合計 ≈ $0.000022(1セント未満)
文書分析(入力150K + 出力8K)
→ 入力:$0.30
→ 出力:$0.096
→ リクエストあたり合計 ≈ $0.40
長文コンテキストの調査タスク(入力350K + 出力15K)
→ 入力:350K × $4 / 1M = $1.40
→ 出力:15K × $18 / 1M = $0.27
→ リクエストあたり合計 ≈ $1.67
1日あたり100件の長文コンテキストリクエストを処理する中程度のトラフィックのアプリケーションは、月に約50〜70ドルかかります。動画を伴う大量のエージェントワークフローは、最適化なしでは簡単に数千ドルに達します。
無料アクセスとプレビューの制限
Googleは、対話的な利用のためにAI StudioでGemini 3 Proプレビューへの無料アクセスを提供しています。レート制限が適用されますが(通常、地域とアカウントの経過日数に応じて10〜50 RPM)、手動セッションでは課金されません。
スクリプトによるAPIアクセスにはGoogle Cloudプロジェクトが必要です。新しいプロジェクトはプレビューモデル向けの十分な制限を持つ無料枠で始まりますが、大量に使用するとすぐに有料課金にアップグレードされます。Googleはプレビューの最初の数週間、料金を完全に免除することがよくあり、多くの開発者が2025年11月に数千件のリクエスト後でも請求額が0ドルだったと報告しています。
モデルが安定すると(2025年12月〜2026年第1四半期に予定)、例外なく全額料金が適用されます。
ApidogによるGemini 3 APIの統合と監視
ApidogはGemini 3 APIとの連携を簡素化します。Googleから公式のOpenAPI仕様をインポートし、APIキーを環境変数として設定し、リクエストを直接送信できます。
主な利点は以下の通りです。
- 応答でのリアルタイムトークン数表示
- リクエストごとの自動コスト見積もり(カスタムスクリプトまたはプラグイン)
- チームコラボレーションのためのコレクション共有
- トークンを消費せずにロジックをテストするためのモックサーバー
- 高価なプロンプトを特定するための詳細なログ
https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent への新しいリクエストを作成し、JSONペイロードを貼り付けて送信します。Apidogは使用量メタデータ(入力/出力トークン)を即座に解析し、予算内での運用を支援します。
Gemini 3 Proのコスト最適化戦略
エンジニアは、これらの実証済みの手法により費用を大幅に削減します。
- 可能な限りプロンプトを20万トークン未満に保つ → 2倍の料金上昇を回避
- 構造化出力(JSONモード)を使用する → より短く、予測可能な応答
- プロンプトキャッシングを実装する(プレビュー後利用可能になった場合) → システム指示の再利用
- 動画を前処理する → キーフレームを抽出するか、音声を個別に書き起こす
- Google Cloud BillingアラートとApidogダッシュボードを通じて監視する
- より短いコンテキストから始める → 必要に応じてのみ上にイテレーションする
これらの実践を組み合わせることで、定期的に請求額を40〜70%削減できます。
他の主要モデルとの比較(2025年11月)
| モデル | 入力 20万以下 | 出力 20万以下 | 入力 20万超 | 出力 20万超 | 備考 |
|---|---|---|---|---|---|
| Gemini 3 Pro Preview | $2.00 | $12.00 | $4.00 | $18.00 | 最高の推論能力 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $2.50 | $15.00 | 以前の主力モデル |
| Claude 3.5 Sonnet | $3.00 | $15.00 | 同じ | 同じ | 長文コンテキストの割増なし |
Gemini 3 Proは、その優れた推論能力と今後の100万以上のコンテキストに対しプレミアム価格が設定されていますが、出力は他の主力モデルと同等の競争力を持っています。
将来の料金見通し
Googleは通常、プレビューモデルが安定し、効率が向上すると20〜50%料金を削減します。Gemini 3 Proの安定版料金は2026年初頭に、1.50ドル/10ドル(20万以下)と3ドル/15ドル(20万超)程度に落ち着き、同時にキャッシングおよびバッチ割引が導入されると予想されます。
結論
Gemini 3 Pro APIは、透明性のあるコンテキスト階層型料金で提供されます。100万トークンあたり2.00ドル/12.00ドル(20万トークンまでのコンテキスト)および4.00ドル/18.00ドル(それを超える場合)です。プレビューアクセスはAI Studioでのテストには実質無料であり、本番環境での利用は従量課金制に従います。
Apidogのようなツールを活用して、初日からすべてのトークンを監視し、プロンプトを最適化しましょう。このアプローチにより、開発者は予算の予期せぬ事態なくGoogleの最もインテリジェントなモデルを活用できます。モデルが安定するにつれて、推論重視のマルチモーダルワークロードにとってさらに費用対効果が高くなるような改良が期待されます。
