Gemini 3.5 Flashとは?グーグルの最新高速モデルを解説

Ashley Innocent

Ashley Innocent

20 5月 2026

Gemini 3.5 Flashとは?グーグルの最新高速モデルを解説

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

Googleは2026年5月19日にGemini 3.5 Flashを出荷しました。これは新しい3.5ファミリーの高速・低コスト版であり、現在利用できる唯一のモデルです。Gemini 3.5 Proは2026年6月に発表される予定ですが、Flashが最初に登場し、現在のほとんどの商用ワークロードにとって重要なモデルです。

Flashは、Googleが2026年に実際に稼働するワークロードのために構築したモデルです。具体的には、長時間のAIエージェントループ、端末自動化、複数ファイルにわたるコーディング、マルチモーダル文書分析、ストリーミングチャットなどが挙げられます。出力トークンでは他の最先端モデルより約4倍高速に動作し、タスクあたりのコストは半分以下です。

このガイドでは、Gemini 3.5 Flashがどのようなものか、実際に何が新しいのか、ベンチマークの数値、アクセス方法、そしてAIエンドポイントのテスト用Apidogを含む残りのスタックにどのように適合するかを解説します。

Gemini 3.5 Flashの概要

無料利用枠の制限や実際のコストシナリオを含む完全な料金の内訳については、弊社のGemini 3.5 Flash料金ガイドをご覧ください。

3.5 Flashと3および3.1との違い

Gemini 3.5 Flashは、Gemini 3 FlashおよびGemini 3.1 Proのラインを基盤として、5つの具体的なアップグレードを施しています。

  1. エージェント実行がよりシャープに。 Flashは、処理の流れを失うことなく、より長いタスクチェーンを処理できます。ツール呼び出しは正しい順序で実行されます。サブエージェントのディスパッチは、回避策ではなく、ファーストクラスの機能として機能します。
  2. コーディング出力がより高密度に。 複数ファイルのコードリファクタリング、長期的なリファクタリング作業、CLI駆動のワークフローにおいて、Flashは3.xラインよりも明確な改善が見られます。
  3. グラフィック生成が現実的に。 インタラクティブなWeb UI、リッチなSVG、インライン図がモデルから直接出力されます。インライングラフィックのために別途画像モデルを経由する必要がなくなりました。
  4. 出力速度が向上。 Googleは、他の最先端モデルの約4倍のトークン/秒の速度を主張しています。これにより、ストリーミングUXの構築方法が変わります。
  5. 安全性ガードレールが強化。 サイバーおよびCBRN(化学・生物・放射性物質・核)対策の強化に加え、モデルがリクエストを拒否または再ルーティングした理由を説明する解釈可能性ツールが提供されます。

この傾向は一貫しています。GoogleはFlashを単なるチャットではなく、本番環境のエージェントワークロード向けに最適化しています。これはOpenAIとAnthropicがGPT-5.5Claude Opus 4.7で採用したのと同じ方向性です。

Gemini 3.5 Flashベンチマーク

Flashは、そのクラスをはるかに超える性能を発揮します。Googleが公開した表の数値は以下の通りです。

ベンチマーク テスト内容 Gemini 3.5 Flash
Terminal-Bench 2.1 長期的CLIワークフロー 76.2%
MCP Atlas マルチツール連携 83.6%
CharXiv Reasoning チャートと図の解釈 84.2%
GDPval-AA 一般的なエージェント性能 1656 Elo
MRCR v2 (1M context) 長文コンテキスト検索 Googleの表でトップ

Flashが明確に優れている点:チャートの推論、エージェントによるマルチツール作業、長文コンテキスト検索。

優位ではない点:純粋なSWE-Bench Verifiedでは、依然としてOpus 4.7GPT-5.5が接戦です。もし単一のバグ修正が唯一の指標であるならば、これらのフラッグシップモデルがまだ一歩リードしています。しかし、低コストでの長時間のAIエージェント実行を重視するなら、Flashが先行します。

より詳細な3者比較については、Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7をご覧ください。

Gemini 3.5モデルファミリー

Gemini 3.5 Flash(現在利用可能)

Flashは主力となるバリアントです。AI Studio、Gemini API、Geminiアプリ、検索のAIモード、Antigravity、Android Studio、Gemini Enterpriseを通じてすぐに利用できます。

リリース日の報告された価格は、入力トークン100万あたり1.50ドル、出力トークン100万あたり9.00ドルです。これは昨年の3.1 Flash-Liteよりも明らかに高価ですが、Proティアの競合モデルよりはるかに安価です。バッチモード、キャッシュされた入力、Vertexの料金については、完全な料金ガイドをご覧ください。

Flashが活躍する場面:

Gemini 3.5 Pro(2026年6月に展開予定)

Proは発表済みですが、まだ出荷されていません。Googleはこれをエージェント機能のフラッグシップとして位置付けています。数時間の自律作業、綿密な調査、あるいはリーダーボードのトップを目指すタスク予算がある場合に実行するバリアントです。Proの価格は、GPT-5.5やOpus 4.7の定価に近づくと予想されます。

Proが出荷されるまでは、Flashがその役割を担います。良いニュースは、Flashは既にエージェント機能のベンチマークで信頼できる性能を発揮しているため、開発を開始するのに待つ必要がないことです。

Nanoについては?

Googleは3.5 Nanoバリアントを出荷しませんでした。オンデバイス推論は引き続き3.1 Flash-Liteラインが担います。次のPixelサイクルに合わせて3.5 Nanoの発表が期待されます。

Gemini 3.5 Flashの利用場所

リリース日には6つのサービスで利用可能になりました。

  1. Geminiアプリ: グローバル展開、無料および有料ティアの両方
  2. Google検索のAIモード: 回答と追加の質問
  3. Google Antigravity: エンドユーザー自動化のためのGoogleのエージェントプラットフォーム
  4. Gemini API: AI Studio経由の開発者向けエントリーポイント
  5. Android Studio: Android開発者向けのIDEレベルのコーディング支援
  6. Gemini Enterprise + Agent Platform: 組織全体で使用するためのマネージドエージェントランタイム

最新のサービスはGemini Sparkで、アカウント上で24時間年中無休で稼働するパーソナルエージェントです。Sparkは内部でFlashを使用し、Gmail、カレンダー、ドライブのコンテキストに接続します。

検索内の情報エージェントも新機能で、再クエリすることなく、フォローしているトピックに関する更新情報を集めてくれる小さな自律型ヘルパーです。

Gemini 3.5 Flashの始め方

利用には4つの主要な方法があります。それぞれ異なるユースケースに対応しています。

1. Geminiアプリ(チャット経路)

gemini.google.comを開き、モデルセレクターから「3.5 Flash」を選択すれば完了です。このアプリインターフェースは、リサーチ、執筆、コーディングのスケッチ、画像分析など、ほとんどのカジュアルなワークロードに対応します。

2. Google AI Studio(無料開発経路)

ai.google.devにアクセスしてサインインすると、無料の1日あたりのクォータが付与されたAPIキーを取得できます。Flashはリリース時に、1日あたり約1,500リクエストの無料利用枠に含まれています。

以前にGoogle Gemini APIを使用したことがあるなら、パターンは同じです。GEMINI_API_KEYを設定し、SDKをgemini-3.5-flashに向け、リクエストを送信します。手順については無料Gemini APIキーガイドを、5つの無料利用パスすべてについてはFlash専用無料ガイドをご覧ください。

3. 本番環境でのGemini API

本番環境のワークロードは、課金アカウントと同じエンドポイントを経由します。Flashのトークンあたりの料金は、標準的な入出力モデルに準拠しており、フラッグシップ競合製品をはるかに下回ります。Gemini 3.5 Flash APIの使用方法で、Python、Node、curlでの完全なコードサンプル、さらにストリーミング、ツール使用、マルチモーダルパターンについてご覧ください。

これをスタックに組み込む際は、エンドポイントを適切にテストしてください。Apidogは、Flash RESTおよびストリーミングエンドポイントの完全なリクエスト/レスポンスサイクルを単一のワークスペースで処理するため、ツール呼び出しやマルチモーダルペイロードをエンドツーエンドで検証する必要がある場合に便利です。

4. Gemini Enterprise(マネージド経路)

組織向けには、Gemini Enterprise Agent Platformが、監査ログ、データレジデンシー、およびAgent PlatformのランタイムとともにFlashをパッケージ化して提供します。これは、開発者APIでプロトタイプ作成を終えた大規模なチームのほとんどが選択する道です。

Gemini 3.5 Flashが実際に得意なこと

一般公開テストから一日が経ち、そのパターンは明確です。

Flashがまだ得意ではないこと

万能なモデルはありません。初日の3つの正直な弱点です。

Gemini 3.5 Flashを適切にテストする方法

新しいモデルを本番環境のスタックに導入する際に重要な点が2つあります。それは応答形式の安定性とツール呼び出しの正確性です。

小さな評価ハーネスを構築します。

  1. 代表的なプロンプトのセットを固定する
  2. それらをgemini-3.5-flashと現在のモデルに対して実行する
  3. レイテンシ、トークンコスト、および下流タスクの成功に基づいて採点する
  4. マイナーバージョン間のツール呼び出しスキーマの変更に注意する

ステップ1と3については、Apidogがストリーミングを含むFlash APIエンドポイントの記録されたテストスイートを提供します。モデルバージョン間で同じプロンプトをリプレイし、出力を比較することができます。ローカルでこれを設定したい場合は、Apidogをダウンロードしてください。

Gemini 3.1から3.5 Flashへの移行のヒント

既に3.1を使用している場合、ほとんどのSDKでは、モデル文字列を1行変更するだけで移行できます。いくつかの注意すべき詳細事項を挙げます。

より詳細な移行に関する注意点については、Google Gemini 3 APIガイドでSDKのパターンが詳しく解説されています。

よくある質問

これがあなたのスタックにとって何を意味するか

もし今日、AI機能を本番環境で運用しているなら、以下に要点をまとめます。

どのパスを選択するにしても、モデルをエンドツーエンドのテストが必要なパイプラインのコンポーネントの1つとして扱ってください。ApidogはGemini APIのテスト側面を具体的にカバーします。ループの残りの部分、プロンプト設計、ツール連携、評価スクリプトはあなた自身で担当することになります。

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる