GoogleのGeminiファミリーは、大量のワークロードに対応する最も費用対効果の高いフロンティアモデルラインであり、Gemini 2.5 Proは100万トークンあたり1.25ドル/10ドル、Flashバリアントはさらに安価です。無料の公開アプリ、サイドプロジェクト、ハッカソンでの開発では、数千人のユーザーがエンドポイントにアクセスすると、これらの料金もすぐに膨らんでしまいます。Puter.jsはモデルを逆転させます。Google APIキーなしでGeminiの全ラインナップ(2.5 Pro、2.5 Flash、2.0 Flash、3 Flashプレビュー、さらにオープンなGemma 2/3/4ファミリー)を公開し、開発者ではなくエンドユーザーに請求します。開発者にとって、このサービスは無料で無制限です。
要するに
- Puter.jsは、Google APIキー、Google Cloudプロジェクト、サーバーなしで、GeminiおよびGemmaの全カタログへの無料かつ無制限のアクセスを開発者に提供します。
- サポートされているGemini: 2.5 Pro、2.5 Flash、2.5 Flash Lite、2.0 Flash、2.0 Flash Lite、3 Flash Preview、および過去のプレビュー版。
- サポートされているGemma: 複数のサイズ(4B、12B、27B、31B、26B-A4B)のGemma 2、3、4。
- 1つの
<script>タグと1つの関数呼び出しだけで、Geminiと会話できます。 - ストリーミング、視覚入力、温度制御はすべてブラウザで機能します。
- エンドユーザーはPuterアカウントから使用料を支払うため、開発者は永久に無料です。
- 移行計画のために、公式のGemini APIとPuterをベンチマークするにはApidogを使用してください。
「無料無制限」の仕組み
Puter.jsはLLMの課金モデルを逆転させます。開発者がGoogle AI Studioキーを保持し、すべてのトークンコストを負担する代わりに、エンドユーザーがPuterにサインインし(無料アカウント)、そのユーザーの残高から料金が請求されます。新しいPuterアカウントにはスタータークレジットが付与され、ユーザーは必要に応じてチャージできます。
開発者にとって、その結果は明確です。
- Google CloudプロジェクトやAI Studioキーは不要。 クォータ交渉、キーローテーション、課金関係は不要です。
- 開発者側の使用制限なし。 開発者の「制限」はユーザーベースに比例して拡大します。
- Googleの課金へのベンダーロックインなし。 Puterがアップストリームの呼び出しを処理します。
トレードオフとして、これはブラウザファーストです。バックエンドのcronジョブは、ログインしたユーザーセッションなしではPuterを使用できません。
ステップ1: インストール
1つのCDNタグで、ビルドステップは不要です。
<script src="https://js.puter.com/v2/"></script>
これでインストールは完了です。または、バンドルされたアプリの場合:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
ステップ2: モデルを選択する
Puterで利用可能なGeminiのラインナップと、それぞれの用途に適したツールです。
| モデルID | 使用する場面 |
|---|---|
google/gemini-2.5-pro |
最も深い推論。複雑な分析や長文コンテキストタスクに。 |
google/gemini-2.5-flash |
日常的なデフォルトドライバ。コストと品質のバランスが良い。 |
google/gemini-2.5-flash-lite |
最も安価なFlashバリアント。大量の分類タスクに。 |
google/gemini-2.0-flash |
安定したベースライン。挙動がよく理解されている。 |
google/gemini-3-flash-preview |
最新のプレビュー版。最先端の速度。 |
google/gemma-3-27b-it |
オープンGemma。命令チューニング済みで、ファインチューニングのベースラインに適している。 |
google/gemma-4-31b-it |
最大のオープンGemma。クローズドなGeminiの品質に近い。 |
ほとんどのアプリでは、デフォルトでgemini-2.5-flashを使用し、難しいプロンプトの場合にのみProを検討してください。Liteバリアントは桁違いに高速で、タグ付け、分類、簡単なQ&Aには十分です。
ステップ3: Geminiと会話する
最小限の呼び出し:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain machine learning in three sentences",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
ブラウザで開いてください。Puterが呼び出しを処理し、ユーザーがサインイン(または初回実行時に無料のPuterアカウントを作成)すると、応答がページに表示されます。APIキー、環境変数、サーバーは不要です。
ステップ4: 応答をストリーミングする
チャットUIや長い回答の場合、ストリーミングが適切なデフォルト設定です。
const response = await puter.ai.chat(
"Explain photosynthesis in detail",
{
model: 'google/gemini-2.5-flash',
stream: true,
}
);
for await (const part of response) {
if (part?.text) {
outputDiv.innerHTML += part.text;
}
}
各part.textは応答のチャンクです。UIに追加すると、ユーザーはテキストが単語ごとに表示されるのを見ることができます。
ステップ5: ビジョン(画像入力)
Geminiの最も強力な機能はマルチモーダルな根拠付けです。画像URLを2番目の引数として渡します。
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
ユースケース:代替テキスト生成、ビジュアルQA、スクリーンショット分析、OCR、アクセシビリティツール、製品画像タグ付け。Geminiのビジョン品質は、自然な画像や図において一貫して強力ですが、テキストが密集したスクリーンショットでは、GPT-5.xが優位に立つことがあります。
ステップ6: 温度を調整する
オプションオブジェクトで標準パラメータを渡します。
const response = await puter.ai.chat(
'Write a creative short story about a robot chef',
{
model: 'google/gemini-2.5-flash',
temperature: 0.2,
}
);
事実に基づいた出力や構造化された出力には低い温度(0.0~0.3)を、クリエイティブな文章には高い温度(0.7~1.0)を使用します。Gemini Flashのデフォルトは、ほとんどのチャットユースケースで温度0.7でうまく機能します。
ステップ7: マルチターン会話
メッセージの配列を渡します。
const messages = [
{ role: 'user', content: 'I am building a Next.js app with Postgres.' },
{ role: 'assistant', content: 'Got it. What do you need help with?' },
{ role: 'user', content: 'How should I structure migrations?' },
];
const response = await puter.ai.chat(messages, {
model: 'google/gemini-2.5-pro',
});
console.log(response);
次の呼び出しの前に、すべてのユーザーメッセージとアシスタントの応答を配列に追加します。Geminiはトランスクリプト全体を読み取り、ターン全体で一貫性を保ちます。
同じプロンプトでGeminiを他のモデルと比較する
Puterは、すべての主要なLLMを単一のインターフェースで公開しています。ユースケースに最適なモデルを見つける最も速い方法は、同じプロンプトを複数のプロバイダーでスクリプト化することです。
const models = [
'google/gemini-2.5-flash',
'claude-sonnet-4-6',
'gpt-5.5',
'x-ai/grok-4.3',
];
const prompt = "Refactor this React component to use hooks: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response);
console.log('---');
}
一度実行すると、トレードオフのパターンがわかります。Gemini Flashは通常、レイテンシーの勝者であり、Sonnetはコーディングの品質で優れ、GPT-5.5は長文の執筆で優れ、Grok 4.3はコスト面で優位に立ちます。用途に合ったモデルを選択してください。
得られるものと得られないもの
正直な区別:
得られるもの:
- Gemini 2.5/2.0/3 Flashの全カタログと2.5 Pro
- オープンウェイトワークフロー向けのOpen Gemmaファミリー(2/3/4)
- マルチターン会話
- ストリーミング応答
- ビジョン入力(画像URL)
- 温度、最大トークン数、システムプロンプト
- 本番環境に対応したスケール
(Puterのバージョンによっては)得られない可能性のあるもの:
- Geminiでのネイティブ関数呼び出し(最新のPuterドキュメントを確認してください)
- コード実行ツール
- Google検索での根拠付け
- Geminiの最大200万トークンの長いコンテキスト
- ブラウザコンテキストなしでのサーバーサイド使用
- Googleからの直接的なレート制限の可視性
コード実行と根拠付けを必要とするディープなエージェントフローには、公式のGoogle AI Studio APIの方が多くの機能を提供します。一般的なチャット、Q&A、コンテンツ生成、視覚タスクには、Puterで十分です。
Puterと公式Gemini APIの使い分け
区別:
Puterを使用する場合:
- 無料の公開アプリをリリースしており、課金のリスクを避けたい場合。
- プロトタイプを作成しており、Google Cloudプロジェクトをセットアップしたくない場合。
- バックエンドなしで静的サイト、ハッカソンプロジェクト、またはブラウザ拡張機能でGeminiを使用したい場合。
- ユーザーがPuterへのサインインに抵抗がない場合。
公式Gemini APIを使用する場合:
- サーバーサイドの呼び出し(cron、バッチ、Webhook)が必要な場合。
- コード実行、検索による根拠付け、または最大200万トークンまでのフルコンテキストのGemini Proが必要な場合。
- コンプライアンスのためにGoogleとの契約関係が必要な場合。
- 独自のデータセットでファインチューニングが必要な場合。
- ユーザーがPuterへのサインインステップを許容しない場合。
Gemini 3 Flashの単独ウォークスルーについては、Gemini 3 Flash Preview APIの利用方法を参照してください。
Apidogでの統合テスト
Puterの呼び出しはブラウザで行われるため、バックエンドのテストランナーからスクリプト化することはできません。機能するパターンは次のとおりです。
- Puterスクリプトとプロンプト用のクエリパラメータを含む小さな静的ページを作成します。
- (最終的に移行する際に)Apidogを使用して、上流のGoogle Gemini APIサーフェスを検証します。
- 両方を同じApidogコレクション内で別々の環境として保持し、ワンクリックで切り替えられるようにします。
Apidogをダウンロードし、2つの環境を設定します。puter-prototype(Puterページをホストするlocalhost URL)とgemini-prod(https://generativelanguage.googleapis.com/v1)です。移行時にコレクションはきれいに移植されます。より広範なAPIテストパターンについては、QAエンジニア向けAPIテストツールを参照してください。
Puter経由での他の無料LLMパス
同じユーザー課金モデルは、すべての主要なLLMに適用されます。
- 無料無制限のClaude APIを入手(Anthropic Opus、Sonnet、Haiku)
- 無料無制限のGPT-5.5 APIを入手(OpenAIの全カタログ)
- Grok 4.3を無料で使う方法(xAI)
- 無料無制限のDeepSeek APIを入手
単一のPuterスクリプトですべてを処理します。model文字列を切り替えるだけで、プロバイダーも切り替わります。
FAQ
これは本当に無制限ですか、それとも隠れた上限がありますか?開発者側からは無制限です。エンドユーザーはPuterアカウントの残高に応じて利用できます。新規アカウントにはスタータークレジットが付与され、ユーザーは必要に応じてチャージできます。
GoogleアカウントやGoogle Cloudプロジェクトは必要ですか?いいえ。PuterがGoogleとの関係を処理します。Google APIキーを目にすることはありません。
これを本番環境で使用できますか?ブラウザベースのアプリであれば可能です。Puterは本番環境のインフラを実行しています。重要なのは、ユーザーがPuterへのサインインステップを許容するかどうかです。
Puter経由のGeminiは公式APIと全く同じ性能を発揮しますか?モデルの出力は同じです。Puterはユーザーの代わりにGoogleのAPIを呼び出します。余分なホップがあるため、レイテンシーがわずかに高くなる可能性がありますが、モデルの動作は変わりません。
Geminiの massiveな200万トークンコンテキストウィンドウについてはどうですか?Puterは現在、すべてのモデルバリアントで200万トークンの上限を完全に公開しているわけではありません。非常に長いコンテキストが必要な場合は、公式のGoogle AI Studio APIが適切な選択肢です。ほとんどのユースケースは20万トークンをはるかに下回っており、その範囲ではPuterで問題ありません。
DiscordボットやバックエンドサービスでPuter経由のGeminiを使用できますか?クリーンではありません。Puterはブラウザファーストであり、ユーザーセッションを前提としています。バックエンドサービスは公式のGemini APIを直接使用すべきです。
どのモデルをデフォルトにすべきですか?google/gemini-2.5-flashです。これはほとんどのプロンプトにおいて、コスト、速度、品質の適切なバランスを持っています。難しい推論タスクにはgoogle/gemini-2.5-proを、大量の分類にはgoogle/gemini-2.5-flash-liteを使用してください。
画像生成はサポートされていますか(Imagen)?Puterは現在、OpenAIのgpt-image-2およびDALL-Eバリアントを介して画像生成を公開しており、Imagenではありません。画像生成パスについては、無料無制限のGPT-5.5 APIを入手を参照してください。
まとめ
Puter.jsを介した無料無制限のGeminiは、Google CloudのセットアップなしでGoogle品質のマルチモーダル出力を求めるあらゆるブラウザベースのアプリにとって最もクリーンな方法です。スクリプトをドロップインし、gemini-2.5-flashを選択し、プロンプトを記述します。エンドユーザーが使用料を負担するため、キーなしでリリースできます。
サーバーサイドのGemini、ファインチューニング、コード実行ツール、またはフル200万トークンのコンテキストが必要な場合は、依然として公式のGoogle AI Studio APIが適切な選択肢です。プロトタイプ、ハッカソンビルド、無料の公開アプリ、静的サイトには、Puterが答えです。
Apidogでリクエストを一度構築し、公式APIとPuterをベンチマークし、あなたの形に合ったパスを選択してください。
