Le GPT-5.5 d'OpenAI est livré avec une API payante : 5 $ par million de jetons d'entrée, 30 $ par million de jetons de sortie. Pour un projet annexe, une construction de hackathon ou une application publique gratuite, cette facture met fin au travail avant même qu'il ne commence. Il existe une solution de contournement structurelle : Puter.js expose l'intégralité du catalogue OpenAI (GPT-5.5, GPT-5.5 Pro, chaque variante de GPT-5.x, GPT-Image-2, DALL-E, OpenAI TTS) sans clé OpenAI, et facture l'utilisateur final au lieu de vous. Pour le développeur, la surface est gratuite et illimitée.
En bref
- Puter.js offre aux développeurs un accès gratuit et illimité au catalogue complet des modèles OpenAI, sans clé API, sans compte OpenAI et sans serveur.
- Les modèles de texte pris en charge incluent gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o, ainsi que toutes les variantes de chat et de codex.
- Image : gpt-image-2, gpt-image-1.5, dall-e-3. Synthèse vocale (TTS) : gpt-4o-mini-tts, tts-1, tts-1-hd.
- Une balise
<script>, un appel de fonction (puter.ai.chat), et vous conversez avec GPT-5.5. - Le streaming, l'appel de fonctions, l'entrée visuelle, la génération d'images et la synthèse vocale fonctionnent tous dans le navigateur.
- L'utilisateur final couvre son utilisation depuis un compte Puter ; vous ne payez rien, pour toujours.
- Utilisez Apidog pour comparer le même prompt entre Puter et l'API officielle OpenAI pour la planification de la migration.
Comment fonctionne le “gratuit illimité”
Puter.js inverse le modèle de facturation des LLM. Au lieu que vous déteniez la clé OpenAI et que vous assumiez tous les coûts de jetons, votre utilisateur final se connecte à Puter (compte gratuit) et l'appel est facturé sur son solde. Les nouveaux comptes Puter reçoivent un crédit de démarrage ; les utilisateurs rechargent s'ils veulent plus.
Pour le développeur, trois choses en découlent :
- Pas de compte OpenAI, pas de clé dans votre dépôt. Pas de risque de fuite, pas de rotation, pas de gestion de clé spécifique au projet.
- Pas de plafond d'utilisation de votre côté. Chaque utilisateur utilise son propre compte, donc votre « limite » évolue linéairement avec votre base d'utilisateurs.
- Pas d'exposition à la facturation. Vous ne verrez jamais de facture Stripe d'OpenAI ; vous n'avez pas besoin de négocier de conditions d'entreprise.
Le compromis : c'est d'abord pour le navigateur. Un script Node backend ne peut pas utiliser Puter sans une session utilisateur connectée. Pour une utilisation backend, l'API officielle OpenAI reste la bonne voie.
Étape 1 : Installation
Une balise CDN, aucune étape de compilation :
<script src="https://js.puter.com/v2/"></script>
C'est l'installation complète. Ou pour une application packagée :
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
La version CDN fonctionne dans n'importe quel fichier HTML, prototype de hackathon, site statique ou extension de navigateur. La version NPM vous offre le tree-shaking et les types TypeScript.
Étape 2 : Choisir un modèle
Puter expose la gamme complète GPT-5.x ainsi que tous les modèles plus anciens. La liste courte :
| ID du modèle | Quand l'utiliser |
|---|---|
gpt-5.5-pro |
Raisonnement le plus profond ; agents de codage, analyse complexe |
gpt-5.5 |
Pilote quotidien par défaut ; excellent équilibre coût/qualité |
gpt-5.4-nano |
Texte le moins cher, le plus rapide ; classification à grand volume |
gpt-5.4-mini |
Niveau intermédiaire ; bon pour les interfaces utilisateur de chat |
gpt-5.3-codex |
Tâches spécifiques au code |
o3 |
Chaînes de raisonnement complexes |
o1-pro |
Planification multi-étapes agnostique |
gpt-4.1, gpt-4o, gpt-4o-mini |
Base stable et bien comprise |
Génération d'images :
gpt-image-2: le plus récent, sortie nette, rapide.gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: plus anciens mais stables.
Synthèse vocale :
gpt-4o-mini-tts: le plus récent, sonne le plus naturellement.tts-1,tts-1-hd: TTS classique, latence plus faible.
Étape 3 : Faire parler GPT-5.5
L'appel de chat minimal viable :
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Expliquez les WebSockets en trois phrases",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Ouvrez dans un navigateur. Puter gère l'appel, l'utilisateur se connecte (ou crée un compte Puter gratuit lors de la première exécution), et la réponse s'affiche sur la page. Pas de clé API, pas de variable d'environnement, pas de serveur.
Étape 4 : Diffuser la réponse en continu (Streaming)
Pour les interfaces utilisateur de chat et les longues réponses, le streaming est le bon comportement par défaut. Passez stream: true et consommez l'itérateur :
const response = await puter.ai.chat(
"Expliquez la théorie de la relativité en détail",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Chaque part.text est un bloc de jetons. Ajoutez-le à votre bulle d'interface utilisateur ; l'utilisateur voit le texte apparaître mot par mot.
Étape 5 : Vision (entrée d'image)
Passez une URL d'image comme deuxième argument ; le modèle lit l'image et répond à la requête la concernant :
puter.ai.chat(
"Que voyez-vous sur cette image ? Décrivez les couleurs, les objets et l'ambiance.",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
Cela fonctionne sur tous les modèles GPT-5.x et les variantes GPT-4o. Cas d'utilisation : génération de texte alternatif, QA visuel, analyse de captures d'écran, OCR, outils d'accessibilité.
Étape 6 : Générer des images
La fonction txt2img de Puter renvoie un élément <img> avec l'image générée déjà chargée :
puter.ai.txt2img(
"Une ville futuriste la nuit, cinématographique, néon, pluie",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
L'utilisateur paie le coût de la génération d'images à partir de son compte Puter (généralement quelques centimes par image). Pour un générateur d'images public gratuit, c'est la configuration la plus propre qui existe aujourd'hui.
Étape 7 : Synthèse vocale
La ligne TTS d'OpenAI est exposée via txt2speech. La fonction renvoie un élément <audio> avec la voix générée :
puter.ai.txt2speech(
"Bienvenue de nouveau. Le solde de votre compte est de 1 247,50 $.",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
Utilisez-le pour des invites vocales, des voix off d'applications, des introductions de podcasts ou de la narration d'accessibilité.
Étape 8 : Appel de fonctions
Forme standard d'OpenAI. Déclarez les outils, le modèle émet un tableau tool_calls, vous exécutez, vous répondez :
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "Obtenir la météo actuelle pour une ville.",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"Quel temps fait-il à Tokyo en ce moment ?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// Exécutez la fonction de votre côté, puis répondez avec le résultat
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
La forme d'appel de fonctions est identique à celle d'OpenAI, donc toutes les définitions d'outils que vous avez aujourd'hui sont directement portables. Pour tester les flux basés sur des outils dans des environnements de production, consultez les tests de serveur MCP dans Apidog.
Étape 9 : Ajuster la température et max_tokens
Passez les paramètres OpenAI standard dans l'objet d'options :
const response = await puter.ai.chat(
"Parlez-moi de Mars",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
Une température plus basse (0.0–0.3) pour des réponses factuelles, plus élevée (0.7–1.0) pour l'écriture créative. max_tokens plafonne le coût du côté de l'utilisateur ; utile pour maintenir des frais par appel prévisibles lorsque vous livrez une application publique.
Ce que vous obtenez et ce que vous n'obtenez pas
L'accès gratuit et illimité à GPT-5.5 via Puter est réel, mais c'est un sous-ensemble de la surface de l'API officielle OpenAI. La répartition honnête :
Vous obtenez :
- Le catalogue complet GPT-5.x, y compris 5.5, 5.5 Pro, 5.4 (mini, nano, pro), et chaque variante de codex
- Tous les modèles OpenAI plus anciens (GPT-4.1, GPT-4o, o1, o3)
- GPT-Image-2 et DALL-E pour la génération d'images gratuite
- La gamme OpenAI TTS, y compris gpt-4o-mini-tts
- Streaming, vision, appel de fonctions, contrôle de la température, max_tokens
Vous pourriez ne pas obtenir :
- L'API Responses (Puter utilise le format Chat Completions)
- La réduction des coûts de mise en cache des prompts
- L'API Files (contexte de document téléchargé)
- L'utilisation côté serveur sans contexte de navigateur
- Les en-têtes de limitation de débit directs d'OpenAI
- Le mode de sortie structurée et l'application du schéma JSON d'OpenAI
Pour les flux de production avancés, l'API officielle OpenAI est la bonne réponse. Pour les applications de navigateur, les projets annexes et les outils publics, Puter est suffisant.
Quand utiliser Puter vs l'API officielle OpenAI
La distinction :
Utilisez Puter quand :
- Vous lancez une application publique gratuite et ne souhaitez pas être exposé à la facturation.
- Vous prototypez et ne souhaitez pas établir de relation de facturation avec OpenAI.
- Vous souhaitez accéder à OpenAI dans un site statique, un projet de hackathon ou une extension de navigateur sans backend.
- Vos utilisateurs sont prêts à se connecter à Puter (ou l'utilisent déjà).
Utilisez l'API officielle OpenAI quand :
- Vous avez besoin d'appels côté serveur (tâches cron, gestionnaires de webhook, traitement par lots).
- Vous avez besoin de la mise en cache des prompts pour réduire les coûts sur les prompts système stables.
- Vous avez besoin de l'API Responses, des Fichiers ou des sorties structurées complètes.
- Vous avez besoin d'une relation contractuelle pour la conformité (BAA, SOC 2, résidence).
- Vos utilisateurs ne toléreront pas une étape de connexion à Puter.
La plupart des projets commencent avec Puter pour le prototypage et migrent vers l'API officielle lorsqu'ils atteignent l'une des limites ci-dessus. La migration est simple ; la forme du message est la même.
Pour une configuration de production payante, consultez Comment utiliser l'API GPT-5.5.
Tester l'intégration dans Apidog
Les appels Puter se produisent dans le navigateur, vous ne pouvez donc pas les scripter directement depuis un exécuteur de tests backend. Le modèle qui fonctionne :
- Créez une petite page statique avec le script Puter et un paramètre de requête pour le prompt.
- Utilisez Apidog pour valider la surface de l'API OpenAI en amont (lorsque vous migrerez éventuellement).
- Gardez les deux comme environnements séparés dans la même collection Apidog afin de pouvoir basculer en un clic.

Téléchargez Apidog et configurez deux environnements : puter-prototype (une URL localhost hébergeant votre page Puter) et openai-prod (https://api.openai.com/v1). La collection se transfère proprement lorsque vous passez à la production. Pour des modèles de test d'API plus larges, consultez l'outil de test d'API pour les ingénieurs QA.
FAQ
Est-ce vraiment illimité, ou y a-t-il une limite cachée ?Illimité du côté du développeur, oui. L'utilisateur final dispose du solde de son compte Puter ; les nouveaux comptes reçoivent un crédit de démarrage et les utilisateurs peuvent recharger s'ils veulent plus. Il n'y a pas de plafond par développeur.
Ai-je besoin d'un compte OpenAI ?Non. Puter gère la relation OpenAI. Vous ne verrez jamais de clé OpenAI.
Puis-je l'utiliser en production ?Oui, pour les applications basées sur le navigateur. Puter gère une infrastructure de production. La bonne question est de savoir si vos utilisateurs sont prêts à se connecter à Puter ; si oui, lancez-la.
Le GPT-5.5 via Puter fonctionne-t-il de manière identique à l'API officielle ?La sortie du modèle est la même ; Puter appelle l'API officielle OpenAI au nom de l'utilisateur. La latence peut être légèrement plus élevée en raison du saut supplémentaire, mais le comportement du modèle reste inchangé.
Qu'en est-il des économies de mise en cache des prompts ?Puter n'expose pas les contrôles de prix de mise en cache des prompts d'OpenAI aujourd'hui. Si vous avez un prompt système stable de 50k jetons et que vous avez besoin de la remise de cache, utilisez l'API officielle.
Puis-je l'utiliser dans un service backend ?Pas proprement. Puter est axé sur le navigateur et suppose une session utilisateur. Les services backend devraient utiliser l'API officielle OpenAI. Pour des options côté serveur gratuites, consultez Comment utiliser l'API GPT-5.5 gratuitement.
Quel modèle devrais-je utiliser par défaut ?gpt-5.5 pour le raisonnement quotidien. gpt-5.4-nano pour la classification à grand volume. gpt-5.5-pro pour les tâches de raisonnement complexes. o3 lorsque vous avez besoin de longues chaînes de raisonnement.
Mes utilisateurs seront-ils facturés beaucoup ?La plupart des utilisations de type chat coûtent quelques centimes par session aux tarifs d'OpenAI. Un utilisateur occasionnel peut effectuer des dizaines de conversations avec le crédit de démarrage de Puter avant de devoir recharger. La génération d'images est plus chère ; plafonnez max_tokens et évitez les appels de génération inutiles.
Puis-je générer des images gratuitement avec Puter ?Oui, via txt2img avec gpt-image-2 ou DALL-E. L'utilisateur paie le coût de la génération d'images à partir de son solde Puter. Pour le guide de l'API payante officielle, consultez Comment utiliser l'API GPT-Image-2.
En résumé
L'accès gratuit et illimité à GPT-5.5 via Puter.js est la voie la plus propre pour toute application basée sur un navigateur qui souhaite une sortie de qualité OpenAI sans la facturation de qualité OpenAI. Insérez le script, choisissez un modèle, rédigez le prompt. L'utilisateur final couvre l'utilisation ; vous livrez sans clé.
Pour les charges de travail côté serveur, la mise en cache des prompts, l'API Responses ou les sorties structurées complètes, l'API officielle OpenAI reste la bonne réponse. Pour les prototypes, les constructions de hackathon, les applications publiques gratuites et les sites statiques, Puter est la réponse.
Construisez la requête une fois dans Apidog, comparez Puter à l'API officielle et choisissez le chemin qui correspond à votre forme.
