OpenAIのGPT-5.5は有料APIとして提供されており、入力トークン100万件あたり5ドル、出力トークン100万件あたり30ドルがかかります。サイドプロジェクト、ハッカソンでの開発、無料の公開アプリの場合、この費用によって作業が始まる前に停止してしまうことがあります。構造的な回避策が1つあります。それはPuter.jsです。Puter.jsはOpenAIの全カタログ(GPT-5.5、GPT-5.5 Pro、あらゆるGPT-5.xバリアント、GPT-Image-2、DALL-E、OpenAI TTS)をOpenAIキーなしで公開し、あなたではなくエンドユーザーに課金します。開発者にとっては、表面上は無料で無制限です。
TL;DR
- Puter.jsは開発者に、APIキー、OpenAIアカウント、サーバーなしで、OpenAIモデルの全カタログへ無料で無制限にアクセスすることを可能にします。
- サポートされるテキストモデルには、gpt-5.5、gpt-5.5-pro、gpt-5.4、gpt-5、gpt-5-mini、o1、o3、gpt-4.1、gpt-4o、およびすべてのチャットとCodexのバリアントが含まれます。
- 画像: gpt-image-2、gpt-image-1.5、dall-e-3。TTS: gpt-4o-mini-tts、tts-1、tts-1-hd。
- 1つの
<script>タグと1つの関数呼び出し(puter.ai.chat)だけで、GPT-5.5と対話できます。 - ストリーミング、関数呼び出し、ビジョン入力、画像生成、テキスト読み上げ機能はすべてブラウザで動作します。
- エンドユーザーはPuterアカウントから自身の使用量をまかないます。あなたは永久に支払う必要がありません。
- 移行計画のために、Apidogを使用して、Puterと公式のOpenAI APIに対して同じプロンプトのベンチマークを実行してください。
「無料無制限」の仕組み
Puter.js はLLMの課金モデルを逆転させます。あなたがOpenAIキーを保持し、すべてのトークン費用を負担する代わりに、エンドユーザーがPuter(無料アカウント)にサインインし、そのユーザーの残高から呼び出しが課金されます。新しいPuterアカウントには初期クレジットが付与され、ユーザーは必要に応じてチャージします。
開発者にとっては、以下の3つの利点があります。
- OpenAIアカウントも、リポジトリにキーも不要です。 情報漏洩のリスク、キーのローテーション、プロジェクトスコープのキー管理は不要です。
- あなた側の利用制限はありません。 各ユーザーが自身のPuterアカウントで実行するため、あなたの「制限」はユーザーベースに比例して拡大します。
- 課金のリスクはありません。 OpenAIからStripeの請求書が届くことはなく、エンタープライズ契約交渉も不要です。
ただし、トレードオフとして、これはブラウザファーストです。バックエンドのNodeスクリプトは、ログインしたユーザーセッションなしではPuterを使用できません。バックエンドでの使用には、公式のOpenAI APIが引き続き適切なパスです。
ステップ1: インストール
1つのCDNタグで、ビルドステップは不要です。
<script src="https://js.puter.com/v2/"></script>
これだけでインストールは完了です。バンドルされたアプリの場合は以下を使用します。
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
CDN版は、あらゆるHTMLファイル、ハッカソンのプロトタイプ、静的サイト、ブラウザ拡張機能で動作します。NPM版はツリーシェイキングとTypeScriptの型を提供します。
ステップ2: モデルを選択する
PuterはGPT-5.xの全ラインアップと、それ以前のすべてのモデルを公開しています。主なモデルは以下の通りです。
| モデルID | 使用場面 |
|---|---|
gpt-5.5-pro |
高度な推論。コーディングエージェント、複雑な分析 |
gpt-5.5 |
デフォルトの日常使い。コストと品質のバランスが良い |
gpt-5.4-nano |
最も安価で高速なテキスト処理。大量の分類タスク |
gpt-5.4-mini |
ミドルティア。チャットUIに適している |
gpt-5.3-codex |
コードに特化したタスク |
o3 |
複雑な推論チェーン |
o1-pro |
エージェントによる多段階プランニング |
gpt-4.1, gpt-4o, gpt-4o-mini |
安定しており、よく理解されているベースライン |
画像生成:
gpt-image-2: 最新、鮮明な出力、高速。gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: 古いですが安定しています。
テキスト読み上げ (Text-to-speech):
gpt-4o-mini-tts: 最新、最も自然な音声。tts-1,tts-1-hd: クラシックなTTS、低レイテンシー。
ステップ3: GPT-5.5に話させる
最小限のチャット呼び出し:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"WebSocketsについて3文で説明してください。",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
ブラウザで開きます。Puterが呼び出しを処理し、ユーザーはサインイン(または初回実行時に無料のPuterアカウントを作成)し、応答がページに表示されます。APIキー、環境変数、サーバーは不要です。
ステップ4: 応答をストリーミングする
チャットUIや長い回答の場合、ストリーミングが適切なデフォルトです。stream: trueを渡してイテレータを消費します。
const response = await puter.ai.chat(
"相対性理論について詳しく説明してください。",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
各part.textはトークンチャンクです。UIのバブルに追加すると、ユーザーはテキストが単語ごとに表示されるのを見ることができます。
ステップ5: ビジョン (画像入力)
2番目の引数として画像のURLを渡すと、モデルが画像を読み取り、それに関するプロンプトに答えます。
puter.ai.chat(
"この画像に何が見えますか?色、オブジェクト、雰囲気を説明してください。",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
これは、すべてのGPT-5.xモデルおよびGPT-4oのバリアントで機能します。使用例としては、altテキスト生成、ビジュアルQA、スクリーンショット分析、OCR、アクセシビリティツールなどがあります。
ステップ6: 画像を生成する
Puterのtxt2imgは、生成された画像が既にロードされた<img>要素を返します。
puter.ai.txt2img(
"未来的な夜の都市景観、シネマティック、ネオン、雨。",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
ユーザーはPuterアカウントから画像生成費用(通常、画像1枚あたり数セント)を支払います。無料の公開画像ジェネレーターとしては、これが現在存在する中で最もクリーンなセットアップです。
ステップ7: テキスト読み上げ
OpenAIのTTSラインはtxt2speechを介して公開されています。この関数は、生成された音声を含む<audio>要素を返します。
puter.ai.txt2speech(
"おかえりなさい。あなたのアカウント残高は$1,247.50です。",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
音声プロンプト、アプリのナレーション、ポッドキャストのイントロ、アクセシビリティのためのナレーションなどに使用してください。
ステップ8: 関数呼び出し
標準的なOpenAIの形式です。ツールを宣言し、モデルがtool_calls配列を出力し、あなたが実行して応答します。
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "都市の現在の天気を取得します。",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"東京の現在の天気は?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// あなた側で関数を実行し、結果で応答する
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
関数呼び出しの形式はOpenAIのものを踏襲しているため、既存のツール定義はそのまま利用できます。本番環境でのツール駆動型フローのテストについては、ApidogでのMCPサーバーテストを参照してください。
ステップ9: temperatureとmax_tokensを調整する
オプションオブジェクトで標準のOpenAIパラメータを渡します。
const response = await puter.ai.chat(
"火星について教えてください。",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
事実に基づいた回答には低い温度(0.0~0.3)、創造的な文章には高い温度(0.7~1.0)を使用します。max_tokensはユーザー側のコストを制限します。公開アプリをリリースする際に、呼び出しごとの費用を予測可能に保つのに役立ちます。
提供されるものとされないもの
PuterのGPT-5.5への無料無制限アクセスは実在しますが、公式OpenAI APIの表面的な機能の一部です。正直な分割は以下の通りです。
提供されるもの:
- 5.5、5.5 Pro、5.4(mini、nano、pro)、およびあらゆるCodexバリアントを含む、完全なGPT-5.xカタログ
- すべての古いOpenAIモデル(GPT-4.1、GPT-4o、o1、o3)
- 無料の画像生成のためのGPT-Image-2およびDALL-E
- gpt-4o-mini-ttsを含むOpenAI TTSライン
- ストリーミング、ビジョン、関数呼び出し、温度制御、max_tokens
提供されない可能性があるもの:
- Responses API(PuterはChat Completions形式を使用)
- プロンプトキャッシュによるコスト削減
- Files API(アップロードされたドキュメントコンテキスト)
- ブラウザコンテキストなしでのサーバーサイドでの使用
- OpenAIからの直接のレートリミットヘッダー
- OpenAIの構造化出力モードおよびJSONスキーマ強制
本格的な本番環境のフローには、公式のOpenAI APIが正しい答えです。ブラウザアプリ、サイドプロジェクト、公開ツールには、Puterで十分です。
Puterと公式OpenAIのどちらを使用すべきか
使い分けは以下の通りです。
Puterを使用する場合:
- 無料の公開アプリをリリースし、課金リスクを避けたい場合。
- プロトタイプを作成中で、OpenAIとの課金関係を構築したくない場合。
- バックエンドなしで静的サイト、ハッカソンプロジェクト、またはブラウザ拡張機能でOpenAIアクセスが必要な場合。
- ユーザーがPuterにサインインすることに抵抗がない(または既に利用している)場合。
公式OpenAI APIを使用する場合:
- サーバーサイドの呼び出しが必要な場合(cronジョブ、Webhookハンドラ、バッチ処理)。
- 安定したシステムプロンプトのコスト削減のためにプロンプトキャッシュが必要な場合。
- Responses API、Files、または完全な構造化出力が必要な場合。
- コンプライアンスのための契約関係が必要な場合(BAA、SOC 2、レジデンシー)。
- ユーザーがPuterのサインインステップを許容しない場合。
ほとんどのプロジェクトは、プロトタイプ作成のためにPuterから開始し、上記のいずれかの制限に達したときに公式APIに移行します。メッセージの形式は同じであるため、移行は簡単です。
有料の本番環境セットアップについては、「GPT-5.5 APIの使用方法」を参照してください。
Apidogでの統合テスト
Puterの呼び出しはブラウザ内で発生するため、バックエンドのテストランナーから直接スクリプトで実行することはできません。機能するパターンは以下の通りです。
- Puterスクリプトとプロンプト用のクエリパラメータを含む小さな静的ページを作成します。
- Apidogを使用して、上位のOpenAI APIサーフェス(最終的に移行する場合)を検証します。
- 両方を同じApidogコレクション内で別々の環境として保持し、ワンクリックで切り替えられるようにします。

Apidogをダウンロードし、puter-prototype(Puterページをホストするlocalhost URL)とopenai-prod(https://api.openai.com/v1)の2つの環境を設定します。プロジェクトが本番に移行しても、コレクションはきれいに引き継がれます。より広範なAPIテストパターンについては、「QAエンジニア向けのAPIテストツール」を参照してください。
FAQ
これは本当に無制限ですか、それとも隠れた上限がありますか?開発者側からは無制限です。エンドユーザーはPuterアカウントにある残高を使用します。新規アカウントには初期クレジットが付与され、ユーザーは必要に応じてチャージします。開発者ごとの上限はありません。
OpenAIアカウントは必要ですか?いいえ。PuterがOpenAIとの関係を処理します。あなたはOpenAIキーを見ることはありません。
本番環境で使用できますか?はい、ブラウザベースのアプリであれば使用できます。Puterは本番環境のインフラを実行しています。適切な質問は、ユーザーがPuterにサインインすることをいとわないかどうかです。もしそうであれば、リリースしてください。
Puter経由のGPT-5.5は公式APIと全く同じ性能を発揮しますか?モデルの出力は同じです。Puterはユーザーの代理として公式OpenAI APIを呼び出します。追加のホップがあるため、レイテンシーがわずかに高くなる可能性がありますが、モデルの動作は変わりません。
プロンプトキャッシュによる節約についてはどうですか?Puterは現在、OpenAIのプロンプトキャッシュの価格管理機能を公開していません。安定した5万トークンのシステムプロンプトがあり、キャッシュ割引が必要な場合は、公式APIを使用してください。
これをバックエンドサービスで使用できますか?きれいにはできません。Puterはブラウザファーストであり、ユーザーセッションを前提としています。バックエンドサービスは公式OpenAI APIを使用すべきです。無料のサーバーサイドオプションについては、「GPT-5.5 APIを無料で使う方法」を参照してください。
どのモデルをデフォルトにすべきですか?日常的な推論にはgpt-5.5。大量の分類にはgpt-5.4-nano。複雑な推論タスクにはgpt-5.5-pro。長い推論チェーンが必要な場合はo3。
ユーザーに多くの料金がかかりますか?OpenAIの料金体系では、ほとんどのチャット形式の使用はセッションあたり数セントです。一般的なユーザーは、Puterの初期クレジットで数十回の会話を実行でき、チャージが必要になる前に使い切ることができます。画像生成はより高価です。max_tokensを上限設定し、無駄な生成呼び出しを避けてください。
Puterで画像を無料で生成できますか?はい、txt2imgでgpt-image-2またはDALL-Eを使用できます。ユーザーはPuterの残高から画像生成費用を支払います。公式の有料APIガイドについては、「GPT-Image-2 APIの使用方法」を参照してください。
まとめ
Puter.jsを介した無料無制限のGPT-5.5アクセスは、OpenAI品質の課金なしでOpenAI品質の出力を求めるあらゆるブラウザベースのアプリにとって最もクリーンな方法です。スクリプトをドロップインし、モデルを選択し、プロンプトを記述するだけです。エンドユーザーが使用量を負担し、あなたはキーなしでリリースできます。
サーバーサイドのワークロード、プロンプトキャッシュ、Responses API、または完全な構造化出力が必要な場合は、公式のOpenAI APIが依然として正しい選択肢です。プロトタイプ、ハッカソンビルド、無料の公開アプリ、静的サイトにはPuterが答えです。
Apidogでリクエストを一度構築し、Puterと公式APIをベンチマークして、あなたの目的に合ったパスを選択してください。
