O GPT-5.5 da OpenAI vem com uma API paga: $5 por milhão de tokens de entrada, $30 por milhão de saída. Para um projeto paralelo, uma construção de hackathon ou um aplicativo público gratuito, essa conta interrompe o trabalho antes mesmo de começar. Existe uma solução estrutural: o Puter.js expõe todo o catálogo da OpenAI (GPT-5.5, GPT-5.5 Pro, todas as variantes GPT-5.x, GPT-Image-2, DALL-E, OpenAI TTS) sem uma chave da OpenAI, e cobra o usuário final em vez de você. Para o desenvolvedor, a superfície é gratuita e ilimitada.
Em resumo
- O Puter.js oferece aos desenvolvedores acesso gratuito e ilimitado a todo o catálogo de modelos OpenAI, sem chave de API, sem conta OpenAI, sem servidor.
- Os modelos de texto suportados incluem gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o, além de todas as variantes de chat e codex.
- Imagem: gpt-image-2, gpt-image-1.5, dall-e-3. TTS: gpt-4o-mini-tts, tts-1, tts-1-hd.
- Uma tag
<script>, uma chamada de função (puter.ai.chat), e você está conversando com o GPT-5.5. - Streaming, chamada de função, entrada de visão, geração de imagem e conversão de texto em fala funcionam todos no navegador.
- O usuário final cobre seu uso a partir de uma conta Puter; você paga zero, para sempre.
- Use o Apidog para comparar o mesmo prompt com o Puter e a API oficial da OpenAI para planejar a migração.
botão
Como funciona o “gratuito ilimitado”
O Puter.js inverte o modelo de cobrança de LLM. Em vez de você manter a chave da OpenAI e arcar com o custo de cada token, seu usuário final faz login no Puter (conta gratuita) e a chamada é cobrada do saldo dele. Novas contas Puter recebem crédito inicial; os usuários recarregam se quiserem mais.
Para o desenvolvedor, três coisas se seguem:
- Sem conta OpenAI, sem chave no seu repositório. Sem risco de vazamento, sem rotação, sem gerenciamento de chave com escopo de projeto.
- Sem limite de uso do seu lado. Cada usuário usa sua própria conta, então seu “limite” escala linearmente com sua base de usuários.
- Sem exposição a cobranças. Você nunca verá uma fatura do Stripe da OpenAI; você não precisa negociar termos empresariais.
A desvantagem: isso é focado no navegador. Um script Node de backend não pode usar o Puter sem uma sessão de usuário logado. Para uso em backend, a API oficial da OpenAI ainda é o caminho certo.
Passo 1: Instalação
Uma tag CDN, sem etapa de build:
<script src="https://js.puter.com/v2/"></script>
Essa é a instalação completa. Ou para um aplicativo empacotado:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
A versão CDN funciona em qualquer arquivo HTML, protótipo de hackathon, site estático ou extensão de navegador. A versão NPM oferece tree-shaking e tipos TypeScript.
Passo 2: Escolha um modelo
Puter expõe a linha completa do GPT-5.x, além de tudo o que é mais antigo. A lista resumida:
| ID do Modelo | Quando usar |
|---|---|
gpt-5.5-pro |
Raciocínio profundo; agentes de codificação, análise complexa |
gpt-5.5 |
Principal para o dia a dia; bom equilíbrio entre custo e qualidade |
gpt-5.4-nano |
Texto mais barato e rápido; classificação de alto volume |
gpt-5.4-mini |
Nível intermediário; bom para UIs de chat |
gpt-5.3-codex |
Tarefas específicas de código |
o3 |
Cadeias de raciocínio complexas |
o1-pro |
Planejamento agêntico multi-etapas |
gpt-4.1, gpt-4o, gpt-4o-mini |
Base estável e bem compreendida |
Geração de imagem:
gpt-image-2: mais recente, saída nítida, rápido.gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: mais antigos, mas estáveis.
Texto-para-fala:
gpt-4o-mini-tts: mais recente, soa o mais natural.tts-1,tts-1-hd: TTS clássico, menor latência.
Passo 3: Fazer o GPT-5.5 falar
A chamada de chat mínima viável:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain WebSockets in three sentences",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Abra em um navegador. O Puter lida com a chamada, o usuário faz login (ou cria uma conta Puter gratuita na primeira execução) e a resposta é impressa na página. Sem chave de API, sem variável de ambiente, sem servidor.
Passo 4: Transmitir a resposta
Para UIs de chat e respostas longas, o streaming é o padrão certo. Passe stream: true e consuma o iterador:
const response = await puter.ai.chat(
"Explain the theory of relativity in detail",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Cada part.text é um pedaço de token. Anexe à sua bolha de UI; o usuário vê o texto aparecer palavra por palavra.
Passo 5: Visão (entrada de imagem)
Passe uma URL de imagem como segundo argumento; o modelo lê a imagem e responde ao prompt sobre ela:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
Isso funciona em todos os modelos GPT-5.x e nas variantes GPT-4o. Casos de uso: geração de texto alternativo, QA visual, análise de captura de tela, OCR, ferramentas de acessibilidade.
Passo 6: Gerar imagens
O txt2img do Puter retorna um elemento <img> com a imagem gerada já carregada:
puter.ai.txt2img(
"A futuristic cityscape at night, cinematic, neon, rain",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
O usuário paga o custo de geração da imagem de sua conta Puter (geralmente alguns centavos por imagem). Para um gerador de imagens público gratuito, esta é a configuração mais limpa que existe hoje.
Passo 7: Texto-para-fala
A linha TTS da OpenAI é exposta através de txt2speech. A função retorna um elemento <audio> com a voz gerada:
puter.ai.txt2speech(
"Welcome back. Your account balance is $1,247.50.",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
Use-o para prompts de voz, locuções de aplicativos, introduções de podcast ou narração de acessibilidade.
Passo 8: Chamada de função
Formato padrão da OpenAI. Declare ferramentas, o modelo emite um array tool_calls, você executa, você responde:
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "Get the current weather for a city.",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"What's the weather in Tokyo right now?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// Execute the function on your side, then reply with the result
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
O formato de chamada de função espelha o da OpenAI, então quaisquer definições de ferramentas que você tenha hoje são portadas diretamente. Para testar fluxos orientados a ferramentas em configurações de nível de produção, veja teste de servidor MCP no Apidog.
Passo 9: Ajustar temperatura e max_tokens
Passe os parâmetros padrão da OpenAI no objeto de opções:
const response = await puter.ai.chat(
"Tell me about Mars",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
Temperatura mais baixa (0.0–0.3) para respostas factuais, mais alta (0.7–1.0) para escrita criativa. max_tokens limita o custo do lado do usuário; útil para manter as cobranças por chamada previsíveis ao lançar um aplicativo público.
O que você ganha e o que você não ganha
O acesso gratuito e ilimitado ao GPT-5.5 do Puter é real, mas é um subconjunto da superfície oficial da API da OpenAI. A divisão honesta:
Você ganha:
- Catálogo completo do GPT-5.x, incluindo 5.5, 5.5 Pro, 5.4 (mini, nano, pro) e todas as variantes codex
- Todos os modelos OpenAI mais antigos (GPT-4.1, GPT-4o, o1, o3)
- GPT-Image-2 e DALL-E para geração gratuita de imagens
- Linha OpenAI TTS, incluindo gpt-4o-mini-tts
- Streaming, visão, chamada de função, controle de temperatura, max_tokens
Você pode não ganhar:
- A API Responses (Puter usa o formato Chat Completions)
- Redução de custo de cache de prompt
- A API Files (contexto de documento enviado)
- Uso no lado do servidor sem um contexto de navegador
- Headers diretos de limite de taxa da OpenAI
- Modo de saída estruturada e imposição de esquema JSON da OpenAI
Para fluxos de nível de produção aprofundados, a API oficial da OpenAI é a resposta certa. Para aplicativos de navegador, projetos paralelos e ferramentas públicas, o Puter é suficiente.
Quando usar Puter vs. OpenAI oficial
A divisão:
Use Puter quando:
- Você está lançando um aplicativo público gratuito e não quer exposição a cobranças.
- Você está prototipando e não quer configurar um relacionamento de cobrança com a OpenAI.
- Você quer acesso à OpenAI em um site estático, projeto de hackathon ou extensão de navegador sem um backend.
- Seus usuários estão felizes em fazer login no Puter (ou já o usam).
Use a API oficial da OpenAI quando:
- Você precisa de chamadas no lado do servidor (tarefas cron, manipuladores de webhook, processamento em lote).
- Você precisa de cache de prompt para economia de custos em prompts de sistema estáveis.
- Você precisa da API Responses, Files ou saídas estruturadas completas.
- Você precisa de um relacionamento contratual para conformidade (BAAs, SOC 2, residência).
- Seus usuários não tolerarão uma etapa de login no Puter.
A maioria dos projetos começa com Puter para prototipagem e migra para a API oficial quando atingem um dos limites acima. A migração é simples; o formato da mensagem é o mesmo.
Para configuração de produção paga, veja Como usar a API GPT-5.5.
Testando a integração no Apidog
As chamadas do Puter acontecem no navegador, então você não pode scriptá-las diretamente de um test runner de backend. O padrão que funciona:
- Construa uma pequena página estática com o script Puter e um parâmetro de consulta para o prompt.
- Use o Apidog para validar a superfície da API upstream da OpenAI (quando você eventualmente migrar).
- Mantenha ambos como ambientes separados na mesma coleção do Apidog para que você possa alternar com um clique.

Baixe o Apidog e configure dois ambientes: puter-prototype (uma URL localhost hospedando sua página Puter) e openai-prod (https://api.openai.com/v1). A coleção é portada de forma limpa quando você avança. Para padrões mais amplos de teste de API, veja ferramenta de teste de API para engenheiros de QA.
FAQ
Isso é realmente ilimitado, ou há um limite oculto? Ilimitado do lado do desenvolvedor, sim. O usuário final tem o saldo que estiver em sua conta Puter; novas contas recebem crédito inicial e os usuários recarregam se quiserem mais. Não há limite por desenvolvedor.
Preciso de uma conta OpenAI? Não. O Puter lida com o relacionamento com a OpenAI. Você nunca verá uma chave da OpenAI.
Posso usar isso em produção? Sim, para aplicativos baseados em navegador. O Puter executa infraestrutura de produção. A pergunta certa é se seus usuários estão dispostos a fazer login no Puter; se sim, lance-o.
O GPT-5.5 através do Puter tem o mesmo desempenho da API oficial? A saída do modelo é a mesma; o Puter chama a API oficial da OpenAI em nome do usuário. A latência pode ser marginalmente maior por causa do salto extra, mas o comportamento do modelo permanece inalterado.
E as economias de cache de prompt? O Puter não expõe os controles de preço de cache de prompt da OpenAI hoje. Se você tem um prompt de sistema estável de 50k tokens e precisa do desconto de cache, use a API oficial.
Posso usar isso em um serviço de backend? Não de forma limpa. O Puter é focado no navegador e assume uma sessão de usuário. Os serviços de backend devem usar a API oficial da OpenAI. Para opções gratuitas no lado do servidor, veja Como usar a API GPT-5.5 gratuitamente.
Qual modelo devo usar por padrão? gpt-5.5 para raciocínio diário. gpt-5.4-nano para classificação de alto volume. gpt-5.5-pro para tarefas de raciocínio difíceis. o3 quando você precisar de longas cadeias de raciocínio.
Meus usuários serão cobrados muito? A maioria do uso em estilo de chat custa centavos por sessão nas taxas da OpenAI. Um usuário casual pode executar dezenas de conversas com o crédito inicial do Puter antes de precisar recarregar. A geração de imagens é mais cara; limite max_tokens e evite chamadas de geração desperdiçadas.
Posso gerar imagens gratuitamente com o Puter? Sim, através de txt2img com gpt-image-2 ou DALL-E. O usuário paga o custo de geração de imagem do seu saldo Puter. Para o guia da API oficial paga, veja Como usar a API GPT-Image-2.
Conclusão
O acesso gratuito e ilimitado ao GPT-5.5 através do Puter.js é o caminho mais limpo para qualquer aplicativo baseado em navegador que deseja saída com qualidade OpenAI sem a cobrança da OpenAI. Insira o script, escolha um modelo, escreva o prompt. O usuário final cobre o uso; você entrega sem uma chave.
Para cargas de trabalho no lado do servidor, cache de prompt, a API Responses ou saídas estruturadas completas, a API oficial da OpenAI ainda é a resposta certa. Para protótipos, construções de hackathon, aplicativos públicos gratuitos e sites estáticos, o Puter é a resposta.
Construa a solicitação uma vez no Apidog, compare o Puter com a API oficial e escolha o caminho que se adequa à sua forma.
botão
