Googleは2026年5月19日にGemini 3.5 Flashを出荷しました。これは新しい3.5ファミリーの高速・低コスト版であり、現在利用できる唯一のモデルです。Gemini 3.5 Proは2026年6月に発表される予定ですが、Flashが最初に登場し、現在のほとんどの商用ワークロードにとって重要なモデルです。
Flashは、Googleが2026年に実際に稼働するワークロードのために構築したモデルです。具体的には、長時間のAIエージェントループ、端末自動化、複数ファイルにわたるコーディング、マルチモーダル文書分析、ストリーミングチャットなどが挙げられます。出力トークンでは他の最先端モデルより約4倍高速に動作し、タスクあたりのコストは半分以下です。
このガイドでは、Gemini 3.5 Flashがどのようなものか、実際に何が新しいのか、ベンチマークの数値、アクセス方法、そしてAIエンドポイントのテスト用Apidogを含む残りのスタックにどのように適合するかを解説します。
Gemini 3.5 Flashの概要
- リリース日: 2026年5月19日
- バリアント: Gemini 3.5 Flash(Proは2026年6月に登場)
- コンテキストウィンドウ: 入力100万トークン、出力6.4万トークン
- モダリティ: テキスト、画像、コード、グラフィック生成
- 主要ベンチマーク: Terminal-Bench 2.1で76.2%、CharXiv Reasoningで84.2%、MCP Atlasで83.6%、GDPval-AAで1656 Elo
- 速度: 他の最先端モデルより出力トークン/秒が約4倍高速
- コスト: エージェントタスクにおける同等の最先端モデルの半分以下のコスト
- API名:
gemini-3.5-flash - アクセス: Geminiアプリ、検索のAIモード、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise
無料利用枠の制限や実際のコストシナリオを含む完全な料金の内訳については、弊社のGemini 3.5 Flash料金ガイドをご覧ください。

3.5 Flashと3および3.1との違い
Gemini 3.5 Flashは、Gemini 3 FlashおよびGemini 3.1 Proのラインを基盤として、5つの具体的なアップグレードを施しています。
- エージェント実行がよりシャープに。 Flashは、処理の流れを失うことなく、より長いタスクチェーンを処理できます。ツール呼び出しは正しい順序で実行されます。サブエージェントのディスパッチは、回避策ではなく、ファーストクラスの機能として機能します。
- コーディング出力がより高密度に。 複数ファイルのコードリファクタリング、長期的なリファクタリング作業、CLI駆動のワークフローにおいて、Flashは3.xラインよりも明確な改善が見られます。
- グラフィック生成が現実的に。 インタラクティブなWeb UI、リッチなSVG、インライン図がモデルから直接出力されます。インライングラフィックのために別途画像モデルを経由する必要がなくなりました。
- 出力速度が向上。 Googleは、他の最先端モデルの約4倍のトークン/秒の速度を主張しています。これにより、ストリーミングUXの構築方法が変わります。
- 安全性ガードレールが強化。 サイバーおよびCBRN(化学・生物・放射性物質・核)対策の強化に加え、モデルがリクエストを拒否または再ルーティングした理由を説明する解釈可能性ツールが提供されます。
この傾向は一貫しています。GoogleはFlashを単なるチャットではなく、本番環境のエージェントワークロード向けに最適化しています。これはOpenAIとAnthropicがGPT-5.5やClaude Opus 4.7で採用したのと同じ方向性です。

Gemini 3.5 Flashベンチマーク
Flashは、そのクラスをはるかに超える性能を発揮します。Googleが公開した表の数値は以下の通りです。
| ベンチマーク | テスト内容 | Gemini 3.5 Flash |
|---|---|---|
| Terminal-Bench 2.1 | 長期的CLIワークフロー | 76.2% |
| MCP Atlas | マルチツール連携 | 83.6% |
| CharXiv Reasoning | チャートと図の解釈 | 84.2% |
| GDPval-AA | 一般的なエージェント性能 | 1656 Elo |
| MRCR v2 (1M context) | 長文コンテキスト検索 | Googleの表でトップ |
Flashが明確に優れている点:チャートの推論、エージェントによるマルチツール作業、長文コンテキスト検索。
優位ではない点:純粋なSWE-Bench Verifiedでは、依然としてOpus 4.7とGPT-5.5が接戦です。もし単一のバグ修正が唯一の指標であるならば、これらのフラッグシップモデルがまだ一歩リードしています。しかし、低コストでの長時間のAIエージェント実行を重視するなら、Flashが先行します。
より詳細な3者比較については、Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7をご覧ください。
Gemini 3.5モデルファミリー
Gemini 3.5 Flash(現在利用可能)
Flashは主力となるバリアントです。AI Studio、Gemini API、Geminiアプリ、検索のAIモード、Antigravity、Android Studio、Gemini Enterpriseを通じてすぐに利用できます。
リリース日の報告された価格は、入力トークン100万あたり1.50ドル、出力トークン100万あたり9.00ドルです。これは昨年の3.1 Flash-Liteよりも明らかに高価ですが、Proティアの競合モデルよりはるかに安価です。バッチモード、キャッシュされた入力、Vertexの料金については、完全な料金ガイドをご覧ください。
Flashが活躍する場面:
- 高スループットのエージェントループ
- 視覚情報が重要なチャートや文書の理解
- レイテンシが重要なApidogテストスクリプト内での組み込み利用
- 出力速度がユーザーに視覚的に伝わるストリーミングチャットUI
- チャンキングなしでの100万トークン文書分析
Gemini 3.5 Pro(2026年6月に展開予定)
Proは発表済みですが、まだ出荷されていません。Googleはこれをエージェント機能のフラッグシップとして位置付けています。数時間の自律作業、綿密な調査、あるいはリーダーボードのトップを目指すタスク予算がある場合に実行するバリアントです。Proの価格は、GPT-5.5やOpus 4.7の定価に近づくと予想されます。
Proが出荷されるまでは、Flashがその役割を担います。良いニュースは、Flashは既にエージェント機能のベンチマークで信頼できる性能を発揮しているため、開発を開始するのに待つ必要がないことです。
Nanoについては?
Googleは3.5 Nanoバリアントを出荷しませんでした。オンデバイス推論は引き続き3.1 Flash-Liteラインが担います。次のPixelサイクルに合わせて3.5 Nanoの発表が期待されます。
Gemini 3.5 Flashの利用場所
リリース日には6つのサービスで利用可能になりました。
- Geminiアプリ: グローバル展開、無料および有料ティアの両方
- Google検索のAIモード: 回答と追加の質問
- Google Antigravity: エンドユーザー自動化のためのGoogleのエージェントプラットフォーム
- Gemini API: AI Studio経由の開発者向けエントリーポイント
- Android Studio: Android開発者向けのIDEレベルのコーディング支援
- Gemini Enterprise + Agent Platform: 組織全体で使用するためのマネージドエージェントランタイム
最新のサービスはGemini Sparkで、アカウント上で24時間年中無休で稼働するパーソナルエージェントです。Sparkは内部でFlashを使用し、Gmail、カレンダー、ドライブのコンテキストに接続します。

検索内の情報エージェントも新機能で、再クエリすることなく、フォローしているトピックに関する更新情報を集めてくれる小さな自律型ヘルパーです。
Gemini 3.5 Flashの始め方
利用には4つの主要な方法があります。それぞれ異なるユースケースに対応しています。
1. Geminiアプリ(チャット経路)
gemini.google.comを開き、モデルセレクターから「3.5 Flash」を選択すれば完了です。このアプリインターフェースは、リサーチ、執筆、コーディングのスケッチ、画像分析など、ほとんどのカジュアルなワークロードに対応します。
2. Google AI Studio(無料開発経路)
ai.google.devにアクセスしてサインインすると、無料の1日あたりのクォータが付与されたAPIキーを取得できます。Flashはリリース時に、1日あたり約1,500リクエストの無料利用枠に含まれています。
以前にGoogle Gemini APIを使用したことがあるなら、パターンは同じです。GEMINI_API_KEYを設定し、SDKをgemini-3.5-flashに向け、リクエストを送信します。手順については無料Gemini APIキーガイドを、5つの無料利用パスすべてについてはFlash専用無料ガイドをご覧ください。
3. 本番環境でのGemini API
本番環境のワークロードは、課金アカウントと同じエンドポイントを経由します。Flashのトークンあたりの料金は、標準的な入出力モデルに準拠しており、フラッグシップ競合製品をはるかに下回ります。Gemini 3.5 Flash APIの使用方法で、Python、Node、curlでの完全なコードサンプル、さらにストリーミング、ツール使用、マルチモーダルパターンについてご覧ください。
これをスタックに組み込む際は、エンドポイントを適切にテストしてください。Apidogは、Flash RESTおよびストリーミングエンドポイントの完全なリクエスト/レスポンスサイクルを単一のワークスペースで処理するため、ツール呼び出しやマルチモーダルペイロードをエンドツーエンドで検証する必要がある場合に便利です。
4. Gemini Enterprise(マネージド経路)
組織向けには、Gemini Enterprise Agent Platformが、監査ログ、データレジデンシー、およびAgent PlatformのランタイムとともにFlashをパッケージ化して提供します。これは、開発者APIでプロトタイプ作成を終えた大規模なチームのほとんどが選択する道です。
Gemini 3.5 Flashが実際に得意なこと
一般公開テストから一日が経ち、そのパターンは明確です。
- 低コストで長時間のエージェントループ。 ツール呼び出しを伴う複数ステップのウェブ調査は、逸脱することなくより長く実行されます。MCP Atlasスコアの83.6%は、その実践的な証拠です。Flashはより頻繁に適切なツールを選択し、ツールエラーからより良く回復し、同じステップでループすることはありません。
- チャートと文書の推論。 CharXivの84.2%というスコアは、実際のレポートやPDFが扱いやすくなることを意味します。これまで手作業でチャート抽出パイプラインを構築してきた場合、Flashはそれらを単一の呼び出しに集約します。
- インタラクティブUIの生成。 ダッシュボードを要求すると、機能するHTMLとインタラクティブなウィジェットが一度で生成されます。3.1 Flash-Liteからのグラフィック品質の向上は、最も顕著なアップグレードです。
- コストに敏感な本番ワークロード。 「他の最先端モデルの半分以下のコスト」は、エージェントタスクにおけるGoogleの表現です。マーケティング的な計算を考慮しても、長時間のAIエージェント実行におけるFlashのタスクあたりのコストは、Opus 4.7やGPT-5.5よりも著しく低いです。その数値は、弊社の料金内訳に記載されています。
Flashがまだ得意ではないこと
万能なモデルはありません。初日の3つの正直な弱点です。
- 純粋なSWE-Bench Verified: Opus 4.7の87.6%は、単一のバグ修正ベンチマークで依然としてリードしています。単一の問題解決が唯一のKPIである場合、Flashとの差は実在します。
- 音声: Geminiの音声スタックは別個です。そのワークロードについては、Grok Voice vs GPT-Realtimeと比較してください。
- ツールエコシステムの成熟度: OpenAIとAnthropicは、サードパーティ製アダプターにおいて先行しています。GoogleはAntigravityで急速に追いついていますが、エコシステムはまだ新しいです。
Gemini 3.5 Flashを適切にテストする方法
新しいモデルを本番環境のスタックに導入する際に重要な点が2つあります。それは応答形式の安定性とツール呼び出しの正確性です。
小さな評価ハーネスを構築します。
- 代表的なプロンプトのセットを固定する
- それらを
gemini-3.5-flashと現在のモデルに対して実行する - レイテンシ、トークンコスト、および下流タスクの成功に基づいて採点する
- マイナーバージョン間のツール呼び出しスキーマの変更に注意する
ステップ1と3については、Apidogがストリーミングを含むFlash APIエンドポイントの記録されたテストスイートを提供します。モデルバージョン間で同じプロンプトをリプレイし、出力を比較することができます。ローカルでこれを設定したい場合は、Apidogをダウンロードしてください。
Gemini 3.1から3.5 Flashへの移行のヒント
既に3.1を使用している場合、ほとんどのSDKでは、モデル文字列を1行変更するだけで移行できます。いくつかの注意すべき詳細事項を挙げます。
- トークン予算は安定。 入力100万 / 出力6.4万は変わりません。
- ツールスキーマは安定。 既存の関数定義は変更なしで引き継がれます。
- 出力速度が約4倍高速に。 ストリーミングUIがその速度でレンダリングできない場合、スロットリングが必要になる場合があります。
- 料金は異なります。 大量のトラフィックを移行する前に、Flash料金ガイドを使用してコスト予測を再設定してください。
- 安全性応答はより厳格に。 異なる拒否パターンが予想されるため、レッドチーム評価を再実行してください。
より詳細な移行に関する注意点については、Google Gemini 3 APIガイドでSDKのパターンが詳しく解説されています。
よくある質問
- Gemini 3.5 Proはいつ利用可能になりますか? Googleは2026年5月19日に「来月展開」と発表しました。AI Studio、Gemini API、Gemini Enterprise全体で2026年6月に一般提供されると予想されます。それまでは、Flashが利用できる唯一の3.5バリアントです。
- Gemini 3.5 Flashは無料で利用できますか? はい、日次クォータ付きで利用できます。Geminiアプリの標準ティアとAPIキーを使用したAI Studioの両方で、支払いなしでFlashにアクセスできます。5つの無料利用パスについては、弊社のFlash無料ガイドと無料の無制限Gemini APIを取得をご覧ください。
- Gemini 3.5 Flashは関数呼び出しをサポートしていますか? はい。ツール呼び出しとサブエージェントのディスパッチは、ファーストクラスの機能です。MCP Atlasスコア83.6%がその主要な証拠です。
- FlashはOpus 4.7やGPT-5.5と比較してどうですか? Flashはコスト、出力速度、チャート推論で優位に立っています。Opus 4.7はSWE-Bench Proと長文作成で依然としてわずかにリードしています。GPT-5.5はトークン効率で優れています。ワークロードごとの内訳については、3者比較をご覧ください。
- Gemini 3.5 Flashをローカルで実行できますか? いいえ。オープンウェイト版はリリースされていません。ローカル推論については、代わりに2026年の最高のローカルLLMをご覧ください。
- Gemini 3.5 FlashはCursorで動作しますか? はい、標準のGemini APIを通じて動作します。パターンはCursorでのGemini 3.0 Proと同じです。
- FlashのAPIモデル名は何ですか?
gemini-3.5-flashです。この文字列をSDKまたはRESTエンドポイントで使用してください。
これがあなたのスタックにとって何を意味するか
もし今日、AI機能を本番環境で運用しているなら、以下に要点をまとめます。
- 既に3.1 Flashをお使いですか? 今週中に3.5 Flashを並行してテストしてください。ストリーミングUIでは、出力速度の向上だけでも切り替える価値があります。
- 既にOpus 4.7またはGPT-5.5をお使いですか? Flashに対してコストと品質の評価を実行してください。エージェント中心のワークロードでは、コスト差がFlashへのトラフィックの一部をルーティングする正当な理由となるかもしれません。
- 新しいエージェントループを構築していますか? Flashから始めてください。信頼できるエージェント性能を備えつつ、最も安価な方法です。
- 重いマルチモーダルワークロードですか? 今すぐ移行してください。CharXiv Reasoningで84.2%という結果は大きな意味を持ちます。
どのパスを選択するにしても、モデルをエンドツーエンドのテストが必要なパイプラインのコンポーネントの1つとして扱ってください。ApidogはGemini APIのテスト側面を具体的にカバーします。ループの残りの部分、プロンプト設計、ツール連携、評価スクリプトはあなた自身で担当することになります。
