La familia Claude de Anthropic es la línea de modelos de código cerrado más capaz para codificación seria, trabajo de agente y razonamiento de contexto largo, y el precio de la API lo refleja: Sonnet cuesta $3 / $15 por millón de tokens, Opus cuesta más. Ese costo detiene la mayoría de los proyectos paralelos antes de que comiencen. Hay un camino que invierte el modelo de facturación: Puter.js expone la línea completa de Claude (Opus 4.7, Sonnet 4.6, Haiku 4.5 y otras siete variantes) sin una clave de Anthropic, y factura al usuario final en lugar de al desarrollador. Para ti como creador, es estructuralmente gratuito e ilimitado.
Esta guía te lleva por la configuración de principio a fin: los ID de modelo, el código funcional, el streaming y las ventajas y desventajas que necesitas conocer antes de lanzar.
TL;DR
- **Puter.js** ofrece a los desarrolladores acceso gratuito e ilimitado a toda la familia Claude sin clave de API, sin facturación de Anthropic, sin servidor.
- El usuario final cubre su propio uso desde una cuenta de Puter; tú pagas cero.
- Modelos compatibles: **Opus 4.7, Opus 4.6, Opus 4.6 Fast, Opus 4.5, Opus 4.1, Opus 4, Sonnet 4.6, Sonnet 4.5, Sonnet 4, Haiku 4.5**.
- Una etiqueta
<script>, una llamada a función (puter.ai.chat), y ya estás hablando con Claude. - El streaming, los mensajes de sistema, las conversaciones multiturno funcionan; Puter refleja la estructura de mensajes de Anthropic.
- Utiliza Apidog para ejecutar el mismo prompt contra Claude a través de Puter y contra la API oficial de Anthropic para realizar pruebas de rendimiento.
Cómo funciona "gratis ilimitado" bajo el capó
Puter.js es una biblioteca de IA y nube sin servidor que se ejecuta en el navegador. La inversión de la arquitectura: en lugar de que tú tengas la clave de API de Anthropic y asumas la factura, tu usuario final inicia sesión en Puter (cuenta gratuita) y la llamada se carga a su saldo. Las nuevas cuentas de Puter vienen con crédito inicial; los usuarios recargan si quieren más.
Para el desarrollador, esto significa tres cosas:
- **Sin clave de API en tu repositorio.** Sin riesgo de fuga, sin rotación, sin claves con alcance de proyecto que gestionar.
- **Sin límite de uso por tu parte.** Cada usuario se ejecuta contra su propia cuenta, por lo que tu "límite" escala linealmente con tu base de usuarios.
- **No se necesita relación con Anthropic.** Nunca firmas un contrato con Anthropic; Puter es el intermediario.
La contrapartida: esto es principalmente para el navegador. Un script de Python de backend no puede usar Puter sin una sesión de usuario iniciada. Para uso en backend, consulta la sección de alternativas a continuación.
Paso 1: Inserta el script
Una etiqueta en tu HTML, sin paso de compilación:
<script src="https://js.puter.com/v2/"></script>
Esa es toda la instalación. No hay `npm install`, no hay configuración de claves, no hay configuración de DNS. Si prefieres NPM para una aplicación empaquetada:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
La etiqueta CDN es el camino de menor resistencia para un sitio estático o un prototipo rápido. La importación de NPM te proporciona tree-shaking y tipos de TypeScript en una compilación con Vite o Webpack.
Paso 2: Elige un modelo Claude
Puter expone el catálogo completo de Anthropic. Los ID de modelo siguen la nomenclatura de Anthropic con separadores de guion:
| ID de Modelo | Cuándo usar |
|---|---|
claude-opus-4-7 |
El último buque insignia; razonamiento más profundo, mejor trabajo de agente |
claude-opus-4-6 |
Buque insignia anterior; codificación robusta, ligeramente más económico |
claude-opus-4.6-fast |
Variante Opus de menor latencia |
claude-opus-4-5 |
Elección estable para agentes de producción |
claude-opus-4-1 |
Estable heredado; comportamiento bien comprendido |
claude-opus-4 |
Línea base original de Opus 4 |
claude-sonnet-4-6 |
Conductor diario predeterminado; fuerte equilibrio costo/calidad |
claude-sonnet-4-5 |
Sonnet anterior; más económico, sigue siendo excelente para la mayoría de las tareas |
claude-sonnet-4 |
Línea base de Sonnet 4 |
claude-haiku-4-5 |
El más rápido y económico; bueno para clasificación de alto volumen |
Los dos que usarías primero: **claude-sonnet-4-6** para el razonamiento diario y **claude-haiku-4-5** para la clasificación rápida. Recurre a **claude-opus-4-7** cuando necesites una profundidad real (razonamiento de formato largo, revisión de código compleja, planificación de agente en varios pasos).
Paso 3: Haz que Claude hable
La llamada mínima viable:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain quantum computing in simple terms",
{ model: 'claude-sonnet-4-6' }
).then(response => {
puter.print(response.message.content[0].text);
});
</script>
</body>
</html>
Abre el archivo en un navegador. Puter maneja la llamada a la API, el usuario inicia sesión (o crea una cuenta gratuita de Puter en la primera ejecución), y la respuesta se imprime en la página.
La forma de la respuesta refleja la API de mensajes de Anthropic. response.message.content es un array de bloques de contenido; para respuestas de texto plano lees [0].text. Para respuestas multiparte (texto + llamadas a herramientas), itera el array.
Paso 4: Transmite la respuesta
Las respuestas largas se sienten lentas sin streaming. Pasa stream: true y consume el iterador:
const response = await puter.ai.chat(
"Write a detailed essay on the impact of artificial intelligence on society",
{ model: 'claude-sonnet-4-6', stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
El patrón for await lee los fragmentos a medida que llegan. Para una interfaz de usuario de chat, añade cada part.text a tu burbuja de mensaje; el usuario ve el texto aparecer palabra por palabra.
Paso 5: Conversaciones multiturno
Pasa un array de mensajes en lugar de una sola cadena. Cada mensaje tiene un role y un content:
const messages = [
{ role: 'user', content: 'I am building a Next.js app with Postgres.' },
{ role: 'assistant', content: 'Got it. What do you need help with?' },
{ role: 'user', content: 'How should I structure the migrations folder?' },
];
const response = await puter.ai.chat(messages, {
model: 'claude-opus-4-7',
});
console.log(response.message.content[0].text);
Para mantener el estado a lo largo de los turnos, añade cada mensaje de usuario y cada respuesta del asistente al array antes de la siguiente llamada. Claude lee toda la transcripción y se mantiene consistente.
Paso 6: Mensajes de sistema
Establece la persona, las restricciones y el formato de salida con un mensaje de sistema al principio:
const messages = [
{ role: 'system', content: 'You are a senior backend engineer. Reply in numbered bullets, never more than five.' },
{ role: 'user', content: 'How do I prevent SQL injection in a Node app?' },
];
const response = await puter.ai.chat(messages, { model: 'claude-sonnet-4-6' });
Los mensajes de sistema se mantienen a lo largo de toda la conversación y son el lugar adecuado para el tono, el formato de salida y las pautas de comportamiento.
Comparando modelos con el mismo prompt
La forma más rápida de encontrar el modelo Claude adecuado para tu caso de uso es ejecutar el mismo prompt en todos ellos y comparar. Un pequeño bucle de benchmark:
const models = ['claude-haiku-4-5', 'claude-sonnet-4-6', 'claude-opus-4-7'];
const prompt = "Refactor this React component to use hooks: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response.message.content[0].text);
console.log('---');
}
Ejecútalo una vez y verás el patrón de compromiso: Haiku es 5-10 veces más rápido que Opus, Sonnet se sitúa en el medio, Opus produce respuestas notablemente mejores en prompts difíciles. Para la mayoría de las aplicaciones, Sonnet 4.6 es el valor predeterminado correcto.
Para comparar el camino gratuito de Puter con la API oficial de Anthropic en Apidog, mantén ambos proveedores en la misma colección y alterna el entorno.
Lo que obtienes y lo que no
Claude gratuito ilimitado a través de Puter es real, pero la superficie es un subconjunto de la API oficial. La lista honesta:
Obtienes:
- Catálogo completo de modelos Claude (Opus, Sonnet, Haiku, todas las versiones actuales)
- Conversaciones multiturno
- Mensajes de sistema
- Respuestas en streaming
- Escala lista para producción (Puter gestiona la infraestructura)
- Cero exposición a la facturación para ti como desarrollador
Puede que no obtengas (dependiendo de la versión de Puter):
- Uso nativo de herramientas / llamadas a funciones (consulta la documentación más reciente de Puter)
- Entrada de visión (adjuntos de imagen)
- Reducción de costos por caché de prompts de Anthropic
- Uso en el lado del servidor sin un contexto de navegador
- Visibilidad directa del límite de velocidad (no ves los encabezados de Anthropic)
Para flujos de trabajo avanzados de uso de herramientas, la API oficial de Anthropic o las pruebas de servidor MCP en Apidog te ofrecen más control. Para un chatbot típico, una aplicación de preguntas y respuestas o un generador de contenido, la superficie de Puter es suficiente.
Cuándo usar Puter vs la API oficial de Anthropic
La división:
Usa Puter cuando:
- Estás lanzando una aplicación pública gratuita y no quieres exposición a la facturación.
- Estás haciendo un prototipo y aún no quieres establecer una relación de facturación con Anthropic.
- Quieres dar soporte a Claude en un sitio estático, proyecto de hackathon o extensión de navegador sin un backend.
- Tus usuarios están contentos de iniciar sesión en Puter (o ya lo usan).
Usa la API oficial de Anthropic cuando:
- Necesitas llamadas desde el lado del servidor (tareas cron, puntos finales de API, procesamiento por lotes).
- Necesitas caché de prompts para ahorrar costos en mensajes de sistema estables.
- Necesitas un uso de herramientas detallado, entrada de visión o la API de Archivos.
- Necesitas una relación contractual para cumplimiento (BAAs, SOC 2, residencia regional).
- Tus usuarios no tolerarán un paso de inicio de sesión de Puter.
La mayoría de los proyectos comienzan en Puter para la creación de prototipos y migran a la API oficial cuando alcanzan uno de los límites anteriores. La migración es sencilla; la forma del mensaje es la misma.
Para el equivalente de GPT, consulta Cómo usar la API de GPT-5.5.
Probando la integración en Apidog
Las llamadas de Puter ocurren en el navegador, por lo que no puedes ejecutarlas directamente desde un probador de backend. El patrón que funciona:
- Crea una pequeña página estática con el script de Puter y un parámetro de consulta para el prompt.
- Usa Apidog para validar la superficie de la API de Anthropic (cuando eventualmente migres).
- Mantén ambos como entornos separados en la misma colección de Apidog para que puedas intercambiar con un solo clic.

Descarga Apidog y configura dos entornos: puter-prototype (una URL de localhost que aloja tu página de Puter) y anthropic-prod (https://api.anthropic.com/v1). La colección se transfiere limpiamente cuando pasas de Puter a la API oficial.
Preguntas Frecuentes
¿Esto es realmente ilimitado, o hay un límite oculto?Ilimitado desde el lado del desarrollador, sí. El usuario final tiene el saldo que haya en su cuenta de Puter; las cuentas nuevas obtienen crédito inicial y los usuarios recargan si quieren más. No hay un límite por desarrollador.
¿Necesito registrarme en Anthropic?No. Puter gestiona la relación con Anthropic. Nunca verás una clave de Anthropic.
¿Puedo usar esto en producción?Sí, para aplicaciones basadas en navegador. Puter ejecuta infraestructura de producción. La pregunta correcta es si tus usuarios están dispuestos a iniciar sesión en Puter; si es así, lánzalo.
¿Claude a través de Puter funciona idénticamente a la API oficial?La salida del modelo es la misma; Puter llama a la API oficial de Anthropic en nombre del usuario. La latencia puede ser ligeramente mayor debido al salto adicional, pero el comportamiento del modelo no cambia.
¿Qué pasa con los ahorros por caché de prompts de Claude?Puter no expone hoy los controles de precios de caché de prompts de Anthropic. Si tienes un prompt de sistema estable de 50k tokens y necesitas el descuento por caché, usa la API oficial.
¿Puedo usar Claude en un bot de Discord o servicio de backend a través de Puter?No de forma limpia. Puter es principalmente para el navegador y asume una sesión de usuario. Los servicios de backend deberían usar la API oficial de Anthropic.
¿Qué modelo debería usar por defecto?claude-sonnet-4-6. Es el equilibrio adecuado entre costo, velocidad y calidad para la mayoría de los prompts. Pasa a claude-opus-4-7 cuando necesites un razonamiento más profundo, y a claude-haiku-4-5 cuando necesites clasificación masiva.
¿Se les cobrará mucho a mis usuarios?La mayoría del uso de tipo chat cuesta centavos por sesión a las tarifas de Anthropic. Un usuario ocasional puede ejecutar docenas de conversaciones con el crédito inicial de Puter antes de que necesite recargar.
Para resumir
Claude gratuito ilimitado a través de Puter.js es el camino más limpio para cualquier aplicación basada en navegador que quiera una salida con calidad Anthropic sin la facturación de calidad Anthropic. Inserta el script, elige un modelo, escribe el prompt. El usuario final cubre el uso; tú lanzas sin una clave.
Para cargas de trabajo en el lado del servidor, caché de prompts o flujos completos de uso de herramientas, la API oficial de Anthropic sigue siendo la respuesta correcta. Pero para prototipos, aplicaciones públicas gratuitas, proyectos de hackathon, proyectos paralelos y sitios estáticos, Puter es la respuesta.
Crea la solicitud una vez en Apidog, compara Puter con la API oficial y elige el camino que se adapte a tu forma.
