La famille Claude d'Anthropic est la gamme de modèles à source fermée la plus performante pour le codage sérieux, le travail d'agent et le raisonnement sur des contextes longs, et le prix de l'API le reflète : Sonnet coûte 3 $ / 15 $ par million de tokens, Opus coûte plus cher. Ce coût arrête la plupart des projets annexes avant même qu'ils ne commencent. Il existe une voie qui inverse le modèle de facturation : Puter.js expose la gamme complète de Claude (Opus 4.7, Sonnet 4.6, Haiku 4.5, et sept autres variantes) sans clé Anthropic, et facture l'utilisateur final au lieu du développeur. Pour vous, en tant que développeur, c'est structurellement gratuit et illimité.
Ce guide vous présente la configuration de bout en bout : les ID de modèle, le code fonctionnel, le streaming et les compromis à connaître avant de déployer.
En bref
- Puter.js offre aux développeurs un accès gratuit et illimité à la famille Claude complète, sans clé API, sans facturation Anthropic, et sans serveur.
- L'utilisateur final couvre sa propre utilisation à partir d'un compte Puter ; vous ne payez rien.
- Modèles pris en charge : Opus 4.7, Opus 4.6, Opus 4.6 Rapide, Opus 4.5, Opus 4.1, Opus 4, Sonnet 4.6, Sonnet 4.5, Sonnet 4, Haiku 4.5.
- Une seule balise
<script>, un seul appel de fonction (puter.ai.chat), et vous discutez avec Claude. - Le streaming, les invites système, les conversations multi-tours fonctionnent tous ; Puter reproduit la structure des messages d'Anthropic.
- Utilisez Apidog pour scripter la même invite avec Claude via Puter et avec l'API officielle d'Anthropic pour l'analyse comparative.
Comment fonctionne le "gratuit illimité" en coulisses
Puter.js est une bibliothèque cloud et IA sans serveur qui fonctionne dans le navigateur. Le basculement architectural : au lieu que vous déteniez la clé API Anthropic et supportiez la facture, votre utilisateur final se connecte à Puter (compte gratuit) et l'appel est facturé sur son solde. Les nouveaux comptes Puter sont livrés avec un crédit de démarrage ; les utilisateurs rechargent s'ils veulent plus.
Pour le développeur, cela signifie trois choses :
- Pas de clé API dans votre dépôt. Aucun risque de fuite, pas de rotation, pas de clés spécifiques au projet à gérer.
- Aucune limite d'utilisation de votre côté. Chaque utilisateur utilise son propre compte, votre "limite" évolue donc linéairement avec votre base d'utilisateurs.
- Aucune relation avec Anthropic n'est nécessaire. Vous ne signez jamais de contrat avec Anthropic ; Puter est l'intermédiaire.
Le compromis : c'est d'abord pour le navigateur. Un script Python de backend ne peut pas utiliser Puter sans une session utilisateur connectée. Pour une utilisation backend, consultez la section alternatives ci-dessous.
Étape 1 : Intégrer le script
Une seule balise dans votre HTML, aucune étape de build :
<script src="https://js.puter.com/v2/"></script>
C'est l'installation complète. Il n'y a pas de npm install, pas de configuration de clé, pas de configuration DNS. Si vous préférez NPM pour une application groupée :
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
La balise CDN est la voie de moindre résistance pour un site statique ou un prototype rapide. L'importation NPM vous offre le tree-shaking et les types TypeScript dans une build Vite ou Webpack.
Étape 2 : Choisir un modèle Claude
Puter expose le catalogue Anthropic complet. Les ID de modèle suivent la nomenclature d'Anthropic avec des séparateurs par tiret :
| ID du modèle | Quand l'utiliser |
|---|---|
claude-opus-4-7 |
Dernier fleuron ; raisonnement le plus profond, meilleur travail d'agent |
claude-opus-4-6 |
Ancien fleuron ; codage robuste, légèrement moins cher |
claude-opus-4.6-fast |
Variante Opus à faible latence |
claude-opus-4-5 |
Choix stable pour les agents de production |
claude-opus-4-1 |
Stable héritée ; comportement bien compris |
claude-opus-4 |
Base Opus 4 originale |
claude-sonnet-4-6 |
Pilote quotidien par défaut ; excellent équilibre coût/qualité |
claude-sonnet-4-5 |
Ancien Sonnet ; moins cher, toujours excellent pour la plupart des tâches |
claude-sonnet-4 |
Base Sonnet 4 |
claude-haiku-4-5 |
Le plus rapide, le moins cher ; bon pour la classification à grand volume |
Les deux que vous utiliserez en premier : claude-sonnet-4-6 pour le raisonnement quotidien et claude-haiku-4-5 pour la classification rapide. Utilisez claude-opus-4-7 lorsque vous avez besoin d'une réelle profondeur (raisonnement long, révision de code complexe, planification multi-étapes d'agent).
Étape 3 : Faire parler Claude
L'appel minimal viable :
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Expliquez l'informatique quantique en termes simples",
{ model: 'claude-sonnet-4-6' }
).then(response => {
puter.print(response.message.content[0].text);
});
</script>
</body>
</html>
Ouvrez le fichier dans un navigateur. Puter gère l'appel API, l'utilisateur se connecte (ou crée un compte Puter gratuit lors de la première exécution), et la réponse s'affiche sur la page.
La structure de la réponse reflète l'API de messages d'Anthropic. response.message.content est un tableau de blocs de contenu ; pour les réponses en texte brut, vous lisez [0].text. Pour les réponses multi-parties (texte + appels d'outils), itérez le tableau.
Étape 4 : Diffuser la réponse en continu
Les longues réponses semblent lentes sans streaming. Passez stream: true et consommez l'itérateur :
const response = await puter.ai.chat(
"Rédigez un essai détaillé sur l'impact de l'intelligence artificielle sur la société",
{ model: 'claude-sonnet-4-6', stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Le modèle for await lit les morceaux au fur et à mesure qu'ils arrivent. Pour une interface utilisateur de chat, ajoutez chaque part.text à votre bulle de message ; l'utilisateur voit le texte apparaître mot par mot.
Étape 5 : Conversations multi-tours
Passez un tableau de messages au lieu d'une seule chaîne. Chaque message a un role et un content :
const messages = [
{ role: 'user', content: 'Je suis en train de construire une application Next.js avec Postgres.' },
{ role: 'assistant', content: 'Compris. Avec quoi avez-vous besoin d'aide ?' },
{ role: 'user', content: 'Comment dois-je structurer le dossier de migrations ?' },
];
const response = await puter.ai.chat(messages, {
model: 'claude-opus-4-7',
});
console.log(response.message.content[0].text);
Pour conserver l'état entre les tours, ajoutez chaque message utilisateur et chaque réponse de l'assistant au tableau avant le prochain appel. Claude lit l'intégralité de la transcription et reste cohérent.
Étape 6 : Invites système
Définissez la personnalité, les contraintes et le format de sortie avec un message système en haut :
const messages = [
{ role: 'system', content: 'Vous êtes un ingénieur backend senior. Répondez par des puces numérotées, jamais plus de cinq.' },
{ role: 'user', content: 'Comment puis-je prévenir l'injection SQL dans une application Node ?' },
];
const response = await puter.ai.chat(messages, { model: 'claude-sonnet-4-6' });
Les invites système sont maintenues tout au long de la conversation et sont l'endroit idéal pour définir le ton, le format de sortie et les garde-fous comportementaux.
Comparaison des modèles sur la même invite
Le moyen le plus rapide de trouver le bon modèle Claude pour votre cas d'utilisation est de scripter la même invite sur tous et de les comparer. Une petite boucle de benchmarking :
const models = ['claude-haiku-4-5', 'claude-sonnet-4-6', 'claude-opus-4-7'];
const prompt = "Refactoriser ce composant React pour utiliser des hooks : ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response.message.content[0].text);
console.log('---');
}
Exécutez-le une fois et vous verrez le schéma de compromis : Haiku est 5 à 10 fois plus rapide qu'Opus, Sonnet se situe au milieu, Opus produit des réponses nettement meilleures sur des invites difficiles. Pour la plupart des applications, Sonnet 4.6 est le bon choix par défaut.
Pour comparer le chemin gratuit de Puter avec l'API officielle d'Anthropic dans Apidog, conservez les deux fournisseurs dans la même collection et basculez l'environnement.
Ce que vous obtenez et ce que vous n'obtenez pas
Claude gratuit et illimité via Puter est réel, mais l'interface est un sous-ensemble de l'API officielle. La liste honnête :
Vous obtenez :
- Catalogue complet des modèles Claude (Opus, Sonnet, Haiku, toutes les versions actuelles)
- Conversations multi-tours
- Invites système
- Réponses en streaming
- Échelle prête pour la production (Puter gère l'infrastructure)
- Aucune exposition à la facturation pour vous en tant que développeur
Vous pourriez ne pas obtenir (selon la version de Puter) :
- Utilisation native d'outils / appel de fonctions (consultez la dernière documentation Puter)
- Entrée visuelle (pièces jointes d'images)
- Réduction des coûts de mise en cache des invites d'Anthropic
- Utilisation côté serveur sans contexte de navigateur
- Visibilité directe des limites de débit (vous ne voyez pas les en-têtes d'Anthropic)
Pour les workflows d'utilisation d'outils avancés, l'API officielle d'Anthropic ou le test de serveur MCP dans Apidog vous offre plus de contrôle. Pour un chatbot typique, une application de questions-réponses ou un générateur de contenu, l'interface de Puter est suffisante.
Quand utiliser Puter vs l'API officielle d'Anthropic
La distinction :
Utilisez Puter lorsque :
- Vous déployez une application publique gratuite et ne souhaitez pas d'exposition à la facturation.
- Vous êtes en phase de prototypage et ne souhaitez pas encore établir de relation de facturation avec Anthropic.
- Vous voulez prendre en charge Claude dans un site statique, un projet de hackathon ou une extension de navigateur sans backend.
- Vos utilisateurs sont heureux de se connecter à Puter (ou l'utilisent déjà).
Utilisez l'API officielle d'Anthropic lorsque :
- Vous avez besoin d'appels côté serveur (tâches cron, points de terminaison d'API, traitement par lots).
- Vous avez besoin de la mise en cache des invites pour réduire les coûts sur les invites système stables.
- Vous avez besoin d'une utilisation fine des outils, d'une entrée visuelle ou de l'API Fichiers.
- Vous avez besoin d'une relation contractuelle pour la conformité (BAA, SOC 2, résidence régionale).
- Vos utilisateurs ne toléreront pas une étape de connexion à Puter.
La plupart des projets commencent avec Puter pour le prototypage et migrent vers l'API officielle lorsqu'ils atteignent l'une des limites ci-dessus. La migration est simple ; la structure du message est la même.
Pour l'équivalent GPT, consultez Comment utiliser l'API GPT-5.5.
Tester l'intégration dans Apidog
Les appels Puter se produisent dans le navigateur, vous ne pouvez donc pas les scripter directement à partir d'un test runner backend. Le schéma qui fonctionne :
- Construisez une petite page statique avec le script Puter et un paramètre de requête pour l'invite.
- Utilisez Apidog pour valider la surface de l'API Anthropic en amont (lorsque vous migrerez éventuellement).
- Gardez les deux comme environnements séparés dans la même collection Apidog afin de pouvoir basculer en un clic.

Téléchargez Apidog et configurez deux environnements : puter-prototype (une URL localhost hébergeant votre page Puter) et anthropic-prod (https://api.anthropic.com/v1). La collection se transfère proprement lorsque vous passez de Puter à l'API officielle.
FAQ
Est-ce vraiment illimité, ou y a-t-il une limite cachée ?Illimité du côté du développeur, oui. L'utilisateur final dispose du solde de son compte Puter ; les nouveaux comptes reçoivent un crédit de démarrage et les utilisateurs rechargent s'ils veulent plus. Il n'y a pas de limite par développeur.
Dois-je m'inscrire à Anthropic ?Non. Puter gère la relation avec Anthropic. Vous ne verrez jamais de clé Anthropic.
Puis-je l'utiliser en production ?Oui, pour les applications basées sur le navigateur. Puter gère l'infrastructure de production. La bonne question est de savoir si vos utilisateurs sont prêts à se connecter à Puter ; si oui, déployez-la.
Claude via Puter fonctionne-t-il de manière identique à l'API officielle ?La sortie du modèle est la même ; Puter appelle l'API officielle d'Anthropic au nom de l'utilisateur. La latence peut être légèrement plus élevée en raison du saut supplémentaire, mais le comportement du modèle reste inchangé.
Qu'en est-il des économies de mise en cache des invites de Claude ?Puter n'expose pas aujourd'hui les contrôles de prix de la mise en cache des invites d'Anthropic. Si vous avez une invite système stable de 50 000 tokens et que vous avez besoin de la remise de cache, utilisez l'API officielle.
Puis-je utiliser Claude dans un bot Discord ou un service backend via Puter ?Pas de manière propre. Puter est axé sur le navigateur et suppose une session utilisateur. Les services backend devraient utiliser l'API officielle d'Anthropic.
Quel modèle dois-je utiliser par défaut ?claude-sonnet-4-6. Il offre le bon équilibre entre coût, vitesse et qualité pour la plupart des invites. Passez à claude-opus-4-7 lorsque vous avez besoin d'un raisonnement plus approfondi, et à claude-haiku-4-5 lorsque vous avez besoin d'une classification en masse.
Mes utilisateurs seront-ils beaucoup facturés ?La plupart des utilisations de type chat coûtent quelques centimes par session aux tarifs d'Anthropic. Un utilisateur occasionnel peut exécuter des dizaines de conversations avec le crédit de démarrage de Puter avant de devoir recharger.
En conclusion
Claude gratuit et illimité via Puter.js est la voie la plus simple pour toute application basée sur le navigateur qui souhaite une sortie de qualité Anthropic sans la facturation de qualité Anthropic. Intégrez le script, choisissez un modèle, écrivez l'invite. L'utilisateur final couvre l'utilisation ; vous déployez sans clé.
Pour les charges de travail côté serveur, la mise en cache des invites ou les flux d'utilisation d'outils complets, l'API officielle d'Anthropic reste la bonne réponse. Mais pour les prototypes, les applications publiques gratuites, les builds de hackathon, les projets personnels et les sites statiques, Puter est la solution.
Créez la requête une fois dans Apidog, comparez Puter à l'API officielle, et choisissez la voie qui correspond à vos besoins.
