El GPT-5.5 de OpenAI se distribuye con una API de pago: $5 por millón de tokens de entrada, $30 por millón de salida. Para un proyecto secundario, una construcción de hackathon o una aplicación pública gratuita, esa factura detiene el trabajo antes de que comience. Existe una solución estructural: Puter.js expone todo el catálogo de OpenAI (GPT-5.5, GPT-5.5 Pro, todas las variantes de GPT-5.x, GPT-Image-2, DALL-E, OpenAI TTS) sin una clave de OpenAI, y factura al usuario final en lugar de a ti. Para el desarrollador, la superficie es gratuita e ilimitada.
En resumen
- Puter.js proporciona a los desarrolladores acceso gratuito e ilimitado a todo el catálogo de modelos de OpenAI sin clave API, sin cuenta de OpenAI y sin servidor.
- Los modelos de texto compatibles incluyen gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o, además de cada variante de chat y códec.
- Imágenes: gpt-image-2, gpt-image-1.5, dall-e-3. TTS: gpt-4o-mini-tts, tts-1, tts-1-hd.
- Una etiqueta
<script>, una llamada a función (puter.ai.chat), y ya estás hablando con GPT-5.5. - Streaming, llamadas a funciones, entrada de visión, generación de imágenes y conversión de texto a voz, todo funciona en el navegador.
- El usuario final cubre su uso desde una cuenta de Puter; tú pagas cero, para siempre.
- Usa Apidog para comparar el mismo prompt con Puter y la API oficial de OpenAI para la planificación de la migración.
Cómo funciona lo de "gratis ilimitado"
Puter.js cambia el modelo de facturación de los LLM. En lugar de que tú tengas la clave de OpenAI y asumas cada costo de token, tu usuario final inicia sesión en Puter (cuenta gratuita) y la llamada se carga a su saldo. Las nuevas cuentas de Puter obtienen crédito inicial; los usuarios recargan si quieren más.
Para el desarrollador, se derivan tres cosas:
- Sin cuenta de OpenAI, sin clave en tu repositorio. Sin riesgo de fuga, sin rotación, sin gestión de claves específica del proyecto.
- Sin límite de uso por tu parte. Cada usuario opera con su propia cuenta, por lo que tu "límite" escala linealmente con tu base de usuarios.
- Sin exposición a la facturación. Nunca verás una factura de Stripe de OpenAI; no necesitas negociar términos empresariales.
La contrapartida: esto es prioritario para el navegador. Un script de Node en el backend no puede usar Puter sin una sesión de usuario iniciada. Para el uso en backend, la API oficial de OpenAI sigue siendo el camino correcto.
Paso 1: Instalación
Una etiqueta CDN, sin pasos de compilación:
<script src="https://js.puter.com/v2/"></script>
Esa es toda la instalación. O para una aplicación empaquetada:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
La versión CDN funciona en cualquier archivo HTML, prototipo de hackathon, sitio estático o extensión de navegador. La versión NPM te proporciona tree-shaking y tipos de TypeScript.
Paso 2: Elige un modelo
Puter expone toda la línea GPT-5.x más todo lo anterior. La lista corta:
| ID del Modelo | Cuándo usar |
|---|---|
gpt-5.5-pro |
Razonamiento más profundo; agentes de codificación, análisis complejo |
gpt-5.5 |
Uso diario predeterminado; buen equilibrio coste/calidad |
gpt-5.4-nano |
Texto más barato y rápido; clasificación de alto volumen |
gpt-5.4-mini |
Nivel medio; bueno para interfaces de chat |
gpt-5.3-codex |
Tareas específicas de código |
o3 |
Cadenas de razonamiento complejas |
o1-pro |
Planificación agéntica de varios pasos |
gpt-4.1, gpt-4o, gpt-4o-mini |
Base estable y bien entendida |
Generación de imágenes:
gpt-image-2: el más reciente, salida nítida, rápido.gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: más antiguos pero estables.
Texto a voz:
gpt-4o-mini-tts: el más reciente, suena más natural.tts-1,tts-1-hd: TTS clásico, menor latencia.
Paso 3: Haz que GPT-5.5 hable
La llamada de chat mínima viable:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain WebSockets in three sentences",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Ábrelo en un navegador. Puter gestiona la llamada, el usuario inicia sesión (o crea una cuenta gratuita de Puter en la primera ejecución), y la respuesta se imprime en la página. Sin clave API, sin variable de entorno, sin servidor.
Paso 4: Transmite la respuesta
Para interfaces de chat y respuestas largas, el streaming es el valor predeterminado correcto. Pasa `stream: true` y consume el iterador:
const response = await puter.ai.chat(
"Explain the theory of relativity in detail",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Cada `part.text` es un fragmento de token. Agrégalo a tu burbuja de UI; el usuario verá el texto aparecer palabra por palabra.
Paso 5: Visión (entrada de imagen)
Pasa una URL de imagen como segundo argumento; el modelo lee la imagen y responde al prompt sobre ella:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
Esto funciona en todos los modelos GPT-5.x y las variantes GPT-4o. Casos de uso: generación de texto alternativo, QA visual, análisis de capturas de pantalla, OCR, herramientas de accesibilidad.
Paso 6: Generar imágenes
txt2img de Puter devuelve un elemento <img> con la imagen generada ya cargada:
puter.ai.txt2img(
"A futuristic cityscape at night, cinematic, neon, rain",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
El usuario paga el costo de generación de imágenes desde su cuenta de Puter (típicamente unos pocos centavos por imagen). Para un generador de imágenes público gratuito, esta es la configuración más limpia que existe hoy en día.
Paso 7: Texto a voz
La línea TTS de OpenAI se expone a través de `txt2speech`. La función devuelve un elemento <audio> con la voz generada:
puter.ai.txt2speech(
"Welcome back. Your account balance is $1,247.50.",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
Úsalo para indicaciones de voz, locuciones de aplicaciones, introducciones de podcasts o narración de accesibilidad.
Paso 8: Llamada a funciones
Formato estándar de OpenAI. Declara herramientas, el modelo emite un array `tool_calls`, tú ejecutas, tú respondes:
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "Get the current weather for a city.",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"What's the weather in Tokyo right now?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// Execute the function on your side, then reply with the result
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
El formato de llamada a funciones es un reflejo del de OpenAI, por lo que cualquier definición de herramienta que tengas hoy se puede portar directamente. Para probar flujos basados en herramientas en entornos de producción, consulta las pruebas de servidor MCP en Apidog.
Paso 9: Ajusta la temperatura y max_tokens
Pasa los parámetros estándar de OpenAI en el objeto de opciones:
const response = await puter.ai.chat(
"Tell me about Mars",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
Temperatura más baja (0.0–0.3) para respuestas factuales, más alta (0.7–1.0) para escritura creativa. `max_tokens` limita el costo para el usuario; útil para mantener los cargos por llamada predecibles cuando lanzas una aplicación pública.
Lo que obtienes y lo que no
El acceso gratuito ilimitado a GPT-5.5 de Puter es real, pero es un subconjunto de la superficie de la API oficial de OpenAI. La división honesta:
Obtienes:
- Catálogo completo de GPT-5.x, incluyendo 5.5, 5.5 Pro, 5.4 (mini, nano, pro) y todas las variantes de códec
- Todos los modelos más antiguos de OpenAI (GPT-4.1, GPT-4o, o1, o3)
- GPT-Image-2 y DALL-E para generación gratuita de imágenes
- Línea TTS de OpenAI, incluyendo gpt-4o-mini-tts
- Streaming, visión, llamada a funciones, control de temperatura, max_tokens
Puede que no obtengas:
- La API de Respuestas (Puter usa el formato de Chat Completions)
- Reducción de costos por caché de prompts
- La API de Archivos (contexto de documentos subidos)
- Uso del lado del servidor sin un contexto de navegador
- Cabeceras de límite de tasa directas de OpenAI
- El modo de salida estructurada de OpenAI y la aplicación de esquemas JSON
Para flujos de nivel de producción profundos, la API oficial de OpenAI es la respuesta correcta. Para aplicaciones de navegador, proyectos secundarios y herramientas públicas, Puter es suficiente.
Cuándo usar Puter vs. OpenAI oficial
La división:
Usa Puter cuando:
- Estás lanzando una aplicación pública gratuita y no quieres exposición a la facturación.
- Estás creando prototipos y no quieres establecer una relación de facturación con OpenAI.
- Quieres acceso a OpenAI en un sitio estático, proyecto de hackathon o extensión de navegador sin un backend.
- Tus usuarios están contentos de iniciar sesión en Puter (o ya lo usan).
Usa la API oficial de OpenAI cuando:
- Necesitas llamadas del lado del servidor (tareas programadas, manejadores de webhooks, procesamiento por lotes).
- Necesitas almacenamiento en caché de prompts para ahorrar costos en prompts de sistema estables.
- Necesitas la API de Respuestas, Archivos o salidas estructuradas completas.
- Necesitas una relación contractual para el cumplimiento (BAAs, SOC 2, residencia).
- Tus usuarios no tolerarán un paso de inicio de sesión en Puter.
La mayoría de los proyectos comienzan en Puter para la creación de prototipos y migran a la API oficial cuando alcanzan uno de los límites anteriores. La migración es sencilla; el formato de los mensajes es el mismo.
Para la configuración de producción de pago, consulta Cómo usar la API de GPT-5.5.
Probando la integración en Apidog
Las llamadas de Puter ocurren en el navegador, por lo que no puedes programarlas directamente desde un ejecutor de pruebas de backend. El patrón que funciona:
- Crea una pequeña página estática con el script de Puter y un parámetro de consulta para el prompt.
- Usa Apidog para validar la superficie de la API de OpenAI (cuando finalmente migres).
- Mantén ambos como entornos separados en la misma colección de Apidog para que puedas intercambiarlos con un solo clic.

Descarga Apidog y configura dos entornos: puter-prototype (una URL de localhost que aloja tu página de Puter) y openai-prod (https://api.openai.com/v1). La colección se traslada limpiamente cuando avanzas. Para patrones de pruebas de API más amplios, consulta herramienta de prueba de API para ingenieros de QA.
Preguntas frecuentes
¿Es esto realmente ilimitado, o hay un límite oculto?Ilimitado desde el lado del desarrollador, sí. El usuario final tiene el saldo que haya en su cuenta de Puter; las nuevas cuentas obtienen crédito inicial y los usuarios recargan si quieren más. No hay un límite por desarrollador.
¿Necesito una cuenta de OpenAI?No. Puter gestiona la relación con OpenAI. Nunca verás una clave de OpenAI.
¿Puedo usar esto en producción?Sí, para aplicaciones basadas en navegador. Puter ejecuta infraestructura de producción. La pregunta correcta es si tus usuarios están dispuestos a iniciar sesión en Puter; si es así, lánzalo.
¿El GPT-5.5 a través de Puter funciona idénticamente a la API oficial?La salida del modelo es la misma; Puter llama a la API oficial de OpenAI en nombre del usuario. La latencia puede ser ligeramente mayor debido al salto adicional, pero el comportamiento del modelo no cambia.
¿Qué pasa con los ahorros por caché de prompts?Puter no expone hoy los controles de precios de caché de prompts de OpenAI. Si tienes un prompt de sistema estable de 50k tokens y necesitas el descuento por caché, usa la API oficial.
¿Puedo usar esto en un servicio de backend?No de forma limpia. Puter está diseñado para el navegador y asume una sesión de usuario. Los servicios de backend deberían usar la API oficial de OpenAI. Para opciones gratuitas del lado del servidor, consulta Cómo usar la API de GPT-5.5 gratis.
¿Qué modelo debería usar por defecto?gpt-5.5 para razonamiento diario. gpt-5.4-nano para clasificación de alto volumen. gpt-5.5-pro para tareas de razonamiento difíciles. o3 cuando necesites cadenas de razonamiento largas.
¿Se les cobrará mucho a mis usuarios?La mayoría del uso de tipo chat cuesta centavos por sesión a las tarifas de OpenAI. Un usuario ocasional puede ejecutar docenas de conversaciones con el crédito inicial de Puter antes de necesitar recargar. La generación de imágenes es más cara; limita `max_tokens` y evita llamadas de generación desperdiciadas.
¿Puedo generar imágenes gratis con Puter?Sí, a través de `txt2img` con `gpt-image-2` o DALL-E. El usuario paga el costo de generación de imágenes desde su saldo de Puter. Para la guía oficial de la API de pago, consulta Cómo usar la API de GPT-Image-2.
Conclusión
El acceso gratuito ilimitado a GPT-5.5 a través de Puter.js es el camino más limpio para cualquier aplicación basada en navegador que desee una salida de calidad OpenAI sin la facturación de calidad OpenAI. Inserta el script, elige un modelo, escribe el prompt. El usuario final cubre el uso; tú lanzas sin una clave.
Para cargas de trabajo del lado del servidor, caché de prompts, la API de Respuestas o salidas estructuradas completas, la API oficial de OpenAI sigue siendo la respuesta correcta. Para prototipos, construcciones de hackathons, aplicaciones públicas gratuitas y sitios estáticos, Puter es la respuesta.
Crea la solicitud una vez en Apidog, compara Puter con la API oficial y elige el camino que se ajuste a tu forma.
