GoogleのGeminiモデルファミリーの最新版は、2025年6月5日にプレビューとしてリリースされ、開発者に卓越した機能をもたらします。このAPIを使用すると、テキスト、画像、動画などを処理する高度なマルチモーダルアプリケーションを構築できるだけでなく、推論やコーディングのタスクにも優れています。インタラクティブなウェブアプリを作成する場合でも、複雑なデータセットを分析する場合でも、ワークフローを自動化する場合でも、このガイドではそのプロセスを正確に説明します。
次に、この強力なAPIの可能性を最大限に引き出すためのセットアップ、設定、および実践的なユースケースを探求しましょう。
Gemini 2.5 06-05 Pro APIとは?
Google DeepMindによって開発されたGemini 2.5 06-05 Pro APIは、マルチモーダルAI技術の頂点を表しています。2025年6月5日にアップグレードされたプレビューとしてリリースされたこのモデルは、以前のバージョンに基づいて構築されており、コーディング、推論、およびクリエイティブなタスクで優れたパフォーマンスを発揮します。100万トークンのコンテキストウィンドウ(将来的には200万)を誇り、広範なコードベース、ドキュメント、および画像や動画などのマルチメディア入力を処理できます。

さらに、このAPIはベンチマークで優れており、WebDev ArenaリーダーボードでEloスコアを24ポイント上昇させて1470とし、動画理解のためのVideoMMEで84.8%のスコアを獲得しています。その推論能力は数学、科学、コーディングで際立っており、洗練されたアプリケーションを構築する開発者にとって理想的です。次に、このAPIを効果的に使用を開始するための環境をセットアップします。
Gemini 2.5 06-05 Pro APIを使用するための前提条件
開始する前に、開発環境が以下の要件を満たしていることを確認してください。
- Googleアカウント: accounts.google.comでサインアップまたはログインして、Google AI Studioにアクセスします。
- APIキー: Google AI Studio経由で認証用のキーを生成します。
- Python 3.7+: まだインストールされていない場合は、python.orgからPythonをインストールします。
- 仮想環境: クリーンなプロジェクト管理のために依存関係を分離します。
- ライブラリ: APIとやり取りするために
google-generativeai
パッケージをインストールします。 - Apidog: オプションですが、APIリクエストのテストとデバッグに推奨されます。
まず、Pythonをインストールし、仮想環境をセットアップします。ターミナルで以下のコマンドを実行します。
python -m venv gemini_env
source gemini_env/bin/activate # On Windows: gemini_env\Scripts\activate
次に、必要なライブラリをインストールします。
pip install google-generativeai
これらの手順が完了したら、APIを設定する準備が整いました。次に、認証とセットアップに進みましょう。
Gemini 2.5 06-05 Pro APIの認証設定
Gemini 2.5 06-05 Pro APIを使用するには、APIキーでリクエストを認証します。開始するには、以下の手順に従ってください。
- Google AI Studioに移動: ブラウザを開き、aistudio.google.comにアクセスします。

サインイン: Googleアカウントの認証情報を使用してログインします。
APIキーを生成: ダッシュボードで「APIキーを取得」オプションを見つけます。それをクリックし、プロンプトに従って生成されたキーをコピーします。安全に保管してください—決して公開しないでください。

それをクリックし、プロンプトに従って生成されたキーをコピーします。安全に保管してください—決して公開しないでください。

環境変数を設定: セキュリティのため、キーを環境変数として設定します。ターミナルで以下を実行します。
export GEMINI_API_KEY='your_api_key_here' # On Windows: set GEMINI_API_KEY=your_api_key_here
次に、Pythonでクライアントを初期化します。基本的なセットアップは以下の通りです。
import os
from google import genai
# Retrieve API key from environment variable
API_KEY = os.environ.get("GEMINI_API_KEY")
client = genai.Client(api_key=API_KEY)
認証が設定されたので、リクエストを送信する準備ができました。次に、Gemini 2.5 06-05モデルを使用した最初API呼び出しについて探求します。
Gemini 2.5 06-05を使用した最初のAPI呼び出し
Gemini 2.5 06-05 Pro APIを簡単なテキストベースのリクエストでテストしましょう。この例では、モデルに基本的な概念を説明するように求めます。以下のPythonコードを使用してください。
from google import genai
from google.genai.types import HttpOptions
# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Send a text request
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents="Explain how a neural network works in simple terms."
)
# Print the response
print(response.text)
このコードは、APIエンドポイントにPOSTリクエストを送信し、Gemini 2.5 06-05モデルをターゲットとします。レスポンスは、ニューラルネットワークを明確で簡潔な言葉で説明します。以下のような出力が期待できます。
ニューラルネットワークは、人間の脳に触発されたコンピューティングモデルです。入力データを処理し、パターンに基づいて重みを調整し、予測や分類などの出力を生成するノード(ニューロン)の層で構成されています。
機能を検証するには、Apidogでこのリクエストをテストします。新しいプロジェクトを作成し、HTTPメソッドをPOSTに設定し、エンドポイントURL(Google AI Studioドキュメントに記載)を入力し、ヘッダーAuthorization: Bearer YOUR_API_KEY
を追加し、以下のJSONペイロードを含めます。
{
"model": "gemini-2.5-pro-preview-06-05",
"contents": "Explain how a neural network works in simple terms."
}
Apidogで「送信」をクリックして、レスポンス、ステータスコード、およびタイミングを確認します。これにより、セットアップが機能していることが確認されます。次に、マルチモーダル機能に進みましょう。

Gemini 2.5 06-05のマルチモーダル機能を活用する
Gemini 2.5 06-05 Pro APIは、テキスト、画像、動画を処理するマルチモーダル機能で際立っています。このセクションでは、これらの機能を効果的に使用する方法を示します。
テキストと画像の処理
画像分析などのタスクのために、テキストプロンプトと画像を組み合わせます。画像をアップロードし(例:スコーンの写真)、モデルに説明を求めます。コードは以下の通りです。
from google import genai
from google.genai.types import HttpOptions, Part
# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Send a text and image request
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents=[
"Describe this image in detail.",
Part.from_uri(
file_uri="gs://cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg"
)
]
)
# Print the response
print(response.text)
モデルは以下のように応答するかもしれません。
画像は、パーチメント紙の上にブルーベリースコーンが平置きされたものです。6つの三角形のスコーンは、きつね色で、円形に配置されており、周りには新鮮なブルーベリーが散らばっています。食感は、よく焼けたスコーンに典型的な、もろいように見えます。
画像がGoogle Cloud Storage URI経由でアクセス可能であるか、サポートされている場合は直接アップロードされていることを確認してください。この機能は、Eコマースやコンテンツ分析などのアプリケーションに適しています。
動画理解
Gemini 2.5 06-05モデルは、動画理解に優れており、VideoMMEベンチマークで84.8%のスコアを獲得しています。YouTube URLまたは動画ファイルをプロンプトと共に送信して、コンテンツを分析します。例:
from google import genai
from google.genai.types import HttpOptions
# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Send a video request
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents=[
"Create a spec for a learning app based on this video.",
"https://www.youtube.com/watch?v=example_video"
]
)
# Print the response
print(response.text)
これにより、動画のコンテンツを活用したインタラクティブな学習アプリの詳細な仕様が生成されます。このAPIは、メディア解像度設定を「低」にすることで、コストとパフォーマンスのバランスを取りながら、最大6時間の動画を200万トークンのコンテキストウィンドウで処理できます。
マルチモーダル機能を習得したら、次にコーディング支援に取り組みましょう。
Gemini 2.5 06-05 Pro APIを使用したコーディング
Gemini 2.5 06-05 Pro APIは、コーディングタスクで優位に立っており、WebDev Arenaリーダーボードで1470のEloスコアを獲得しています。Python、JavaScriptなどの言語でコードを生成、編集、デバッグします。使用方法は以下の通りです。
コード生成
フィボナッチ数列計算機などの関数をリクエストします。これを試してみてください。
from google import genai
from google.genai.types import HttpOptions
# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Send a coding request
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents="Write a Python function to calculate the Fibonacci sequence up to n terms."
)
# Print the response
print(response.text)
出力は以下のようになるかもしれません。
def fibonacci(n):
if n <= 0:
return []
elif n == 1:
return [0]
sequence = [0, 1]
for i in range(2, n):
sequence.append(sequence[i-1] + sequence[i-2])
return sequence
# Example usage
print(fibonacci(10)) # Output: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]
この関数は効率的で正確であり、モデルの推論能力を示しています。
デバッグと最適化
既存のコードを分析のために提出します。例:
from google import genai
from google.genai.types import HttpOptions
# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Send a debugging request
response = client.models.generate_content(
model="gemini-2.5-pro-preview-06-05",
contents="Debug this code for errors and suggest improvements: def fib(n): if n == 0: return 0 elif n == 1: return 1 else: return fib(n-1) + fib(n-2)"
)
# Print the response
print(response.text)
モデルは以下のように応答するかもしれません。
n
def fib(n):
if n < 0:
raise ValueError("Input must be non-negative")
if n == 0:
return 0
elif n == 1:
return 1
a, b = 0, 1
for _ in range(2, n + 1):
a, b = b, a + b
return b
改善点:負の入力に対するエラー処理を追加しました。再帰を反復に置き換えてO(n)の時間計算量にしました。タプルアンパックを使用して明確にしました。
これにより、パフォーマンスが大幅に向上します。次に、高度なユースケースを探求しましょう。
Gemini 2.5 06-05 Pro APIの高度なユースケース
Gemini 2.5 06-05 Pro APIは、洗練されたアプリケーションを可能にします。以下のシナリオを検討してください。
- ウェブアプリ開発: インタラクティブなUIのためにHTML、CSS、JavaScriptを生成します。「マイクUIアニメーションとレスポンシブデザインを備えたディクテーションアプリを構築して」とAPIにプロンプトを出します。設計参照からのスタイルに一致する機能的なコードを提供します。
- 動画から学習アプリへ: YouTubeチュートリアルを分析し、インタラクティブなアプリの仕様を作成し、次にコードを生成します。これは教育プラットフォームに適しています。
- コードベース分析: プロジェクトのZIPをアップロードします。APIは、その巨大なコンテキストウィンドウを使用して、依存関係をレビューし、修正を提案し、ロジックを最適化します。
これらをテストするには、Apidogを使用してAPIレスポンスをモックし、機能を検証します。ベストプラクティスに移行することで、最適な結果が保証されます。
Gemini 2.5 06-05 Pro APIのベストプラクティス
これらのヒントを使用して、Gemini 2.5 06-05 Pro APIを最大限に活用してください。
- 明確なプロンプトを作成する: タスクを正確に指定します。例:「リストをソートし、重複を処理するPython関数を生成して」。
- パラメータを調整する: 複雑なタスクには
thinking_budget
を設定します(例:1024トークン)品質とレイテンシのバランスを取るためです。 - 徹底的にテストする: Apidogを使用してリクエストを送信し、ステータスコードを確認し、ペイロードを調整します。
- キーを安全に保管する: APIキーはコードではなく環境変数に保管します。
- 使用状況を監視する: Google AI Studioでレート制限を追跡し、中断を回避します。
これらに従うことで、効率と信頼性が確保されます。まとめましょう。
結論: Gemini 2.5 06-05 Pro APIを活用する
Gemini 2.5 06-05 Pro APIは、開発者が最先端のアプリケーションを構築することを可能にします。セットアップと認証からマルチモーダル処理とコーディングまで、このガイドはあなたにその力を活用するための装備を提供します。WebDev Arenaでのリーダーシップ、強力な動画理解、および推論能力は、ゲームチェンジャーとなります。今日から構築を開始しましょう—Google AI Studioで実験したり、Vertex AIと統合したり、Geminiアプリでテストしたりできます。練習すれば、革新的なソリューションを楽に作成できるようになります。
