A OpenAI dobrou o preço por token na linha GPT-5 com o lançamento do GPT-5.5 em 23 de abril de 2026. A entrada passa de $2.50 para $5.00 por milhão de tokens. A saída passa de $15.00 para $30.00 por milhão. O preço Pro permanece estável em $30 / $180. Essa é a manchete; os detalhes é onde o custo real reside.
Este guia cobre todas as superfícies de precificação: API padrão, Batch, Flex e Priority; precificação Pro; limites do Codex por plano; e como fazer o cálculo para sua carga de trabalho real antes de se comprometer com uma mudança de modelo padrão.
Para a visão geral do modelo, consulte O que é GPT-5.5. Para o passo a passo do desenvolvedor, consulte Como usar a API GPT-5.5.
TL;DR
| Serviço | Entrada / M | Saída / M |
|---|---|---|
| API padrão GPT-5.5 | $5.00 | $30.00 |
| API Pro GPT-5.5 | $30.00 | $180.00 |
| GPT-5.5 Batch (50 % de desconto) | $2.50 | $15.00 |
| GPT-5.5 Flex (50 % de desconto) | $2.50 | $15.00 |
| GPT-5.5 Priority (2.5×) | $12.50 | $75.00 |
| API padrão GPT-5.4 | $2.50 | $15.00 |
| API GPT-5.4-mini | $0.25 | $2.00 |
Efeito líquido: GPT-5.5 é 2× o GPT-5.4 no nível do token, mas a OpenAI afirma um aumento líquido de ~20 % no Índice de Inteligência, uma vez que a eficiência do token é considerada.
Os números principais
A OpenAI publicou os preços na página de preços da API no mesmo dia do lançamento.
- GPT-5.5: $5.00 por milhão de tokens de entrada, $30.00 por milhão de tokens de saída.
- GPT-5.5 Pro: $30.00 por milhão de tokens de entrada, $180.00 por milhão de tokens de saída.
- Janela de contexto: 1 milhão de tokens em ambas as variantes. Tokens de raciocínio contam para a janela e para a cobrança de saída.
Batch, Flex e Priority
A OpenAI oferece três níveis alternativos que redefinem o preço padrão.
API Batch
Enfileire as requisições através do endpoint Batch e elas serão executadas com 50 % do preço padrão. O tempo de resposta é inferior a 24 horas. Bom para:
- Avaliações noturnas em um conjunto de dados completo.
- Preenchimentos retroativos e reprocessamento histórico.
- Qualquer fluxo de trabalho onde o orçamento de latência é medido em horas, não em segundos.
Com a precificação Batch, o GPT-5.5 custa $2.50 / $15.00 por milhão de tokens; idêntico à precificação padrão do GPT-5.4. Para cargas de trabalho offline, a duplicação de preço desaparece.
Processamento Flex
O Flex também oferece 50 % de desconto nas taxas padrão, mas o tempo de espera é variável; de segundos a vários minutos, dependendo da carga. Use o Flex quando puder tolerar latência imprevisível e desejar preços de nível Batch com respostas quase síncronas.
Processamento Priority
O Priority custa 2.5× a taxa padrão ($12.50 / $75.00 por milhão de tokens no GPT-5.5) e oferece um throughput mais rápido que o padrão, limites de taxa mais altos e tempo de fila quase zero. Reserve-o para experiências voltadas para o usuário ao vivo, onde a latência de cauda aparece nas métricas de retenção.
Cálculo de custo do modo de raciocínio
O modo de raciocínio do GPT-5.5 é o mesmo ID de modelo com um `reasoning.effort` mais alto. Ele não altera o preço por token; ele altera quantos tokens uma única requisição usa. Espere que o multiplicador se enquadre em três faixas.
| Esforço | Multiplicador de tokens de saída | Quando usar |
|---|---|---|
| `low` (padrão) | 1× | Chamadas mais rotineiras |
| `medium` | 1.3–2× | Codificação multi-etapas, geração estruturada |
| `high` | 2–4× | Pesquisa aprofundada, revisão crítica de correção |
| `xhigh` | 3–8× | Loops de agente com cadeias de ferramentas, planejamento denso |
Uma única chamada `xhigh` em um prompt longo pode facilmente usar 20 mil tokens de raciocínio; a $30 por milhão, isso é $0.60 apenas para o raciocínio, além do custo dos tokens de saída finais.
Orçamento por carga de trabalho, não por requisição.
Preços do Codex
O acesso ao Codex está vinculado ao plano ChatGPT, não à cobrança por token. Em 23 de abril de 2026, a estrutura é a seguinte.
| Plano | Acesso Codex | GPT-5.5 | Observações |
|---|---|---|---|
| Gratuito | Sim (tempo limitado) | Sim | Limites semanais apertados |
| Go | Sim (tempo limitado) | Sim | 2× os limites do Gratuito |
| Plus ($20 / mês) | Sim | Sim | Limites padrão |
| Pro ($200 / mês) | Sim | Sim + Raciocínio + Pro (no ChatGPT) | Maiores limites por usuário |
| Business | Sim | Sim | Baseado em assento |
| Enterprise / Edu | Sim | Sim | Baseado em contrato |
Para usuários que passam a maior parte do tempo em um fluxo de trabalho de codificação via terminal, o Plus ou Pro é a maneira mais barata de executar o GPT-5.5; a taxa mensal fixa supera até mesmo a precificação Batch, uma vez que você ultrapasse algumas centenas de milhares de tokens por dia. O guia do caminho gratuito cobre o ponto de entrada sem custo.
Comparação: GPT-5.5 vs o restante da linha
Quando você paga pelo GPT-5.5 e quando você mantém o GPT-5.4 ou GPT-5.4-mini? O cálculo do custo depende de quão intensiva em saída sua carga de trabalho é.
| Modelo | Entrada / M | Saída / M | Custo por 1 mil tokens de saída |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
Um fluxo de decisão aproximado:
- Saída de alto volume e baixo risco (classificação, sumarização, chat simples): GPT-5.4-mini.
- Tráfego de produção geral onde o 5.4 já passa nos padrões de qualidade: GPT-5.4.
- Codificação complexa, trabalho de agente multi-etapas, cadeias de pesquisa: GPT-5.5.
- Saída crítica de correção onde uma resposta errada é cara para ser detectada a jusante: GPT-5.5 Pro.
Um exemplo prático: custo por tarefa do agente de codificação
Uma sessão típica de codificação de agente através da API no GPT-5.5 com `reasoning.effort: "medium"` se parece com isso.
- Tokens de entrada por tarefa (contexto do repositório + prompt do usuário): ~15.000
- Tokens de saída por tarefa (código + explicações): ~3.000
- Tokens de raciocínio por tarefa (esforço médio): ~6.000
Custo por tarefa com preços padrão:
- Entrada: 15 K × $5.00 / M = $0.075
- Saída: (3 K + 6 K) × $30.00 / M = $0.27
- Total: $0.345 por tarefa de codificação concluída.
Executando a mesma carga de trabalho no GPT-5.4:
- Entrada: 15 K × $2.50 / M = $0.0375
- Saída: 9 K × $15.00 / M = $0.135
- Total: $0.1725 por tarefa de codificação concluída.
O GPT-5.5 custa exatamente 2× mais por tarefa com o mesmo esforço de raciocínio. A atualização se paga quando a lacuna do SWE-bench (88.7 % vs aproximadamente 74 %) permite concluir tarefas suficientes com sucesso para eliminar uma segunda viagem de ida e volta. Se uma em cada oito tarefas no GPT-5.4 precisa de uma reescrita manual, o GPT-5.5 é mais barato no total.
Controles de custo que valem a pena implementar no Dia 1
Cinco alavancas que mantêm as faturas do GPT-5.5 sob controle.
- Limites rígidos de `max_output_tokens`. Em cada chamada, sempre. O padrão é 2.000, a menos que você precise explicitamente de uma saída longa.
- Esquemas JSON estritos. Saída malformada significa novas tentativas; novas tentativas são uma chamada com preço total.
- Roteie por dificuldade. Direcione requisições fáceis para GPT-5.4-mini; escale as difíceis para GPT-5.5. Um roteador de 10 linhas economiza mais do que qualquer otimização em nível de prompt.
- Use Batch para qualquer coisa offline. Avaliações, preenchimentos retroativos, geração de relatórios noturnos; tudo com 50 % de desconto.
- Monitore `usage.reasoning_tokens`. A surpresa na fatura do GPT-5.5 é quase sempre o gasto de tokens de raciocínio com alto esforço. Crie um alerta para isso.
Estimativa de custo mensal por plano
Se você está escolhendo um nível do ChatGPT para acesso ao GPT-5.5, veja o que cada plano oferece.
| Plano | Preço mensal | Melhor ajuste |
|---|---|---|
| Gratuito | $0 | Experimentar GPT-5.5 via Codex antes de se comprometer |
| Go | $4 / mês | Estudantes e usuários leves que desejam o dobro dos limites do Gratuito |
| Plus | $20 / mês | Desenvolvedores individuais usando Codex + ChatGPT diariamente |
| Pro | $200 / mês | Usuários avançados que desejam Raciocínio e Pro no ChatGPT |
| Business | $25 / assento / mês | Equipes que precisam de espaços de trabalho compartilhados |
| Enterprise / Edu | Personalizado | Baseado em contrato com SLA |
Para qualquer um que execute mais de ~4 milhões de tokens de saída por mês na API, o Pro no ChatGPT mais o CLI do Codex acaba sendo mais barato do que a cobrança pay-as-you-go da API, desde que a carga de trabalho se encaixe na janela de contexto de 400 mil do CLI.
Sinais de mudança de preço para observar
Dois sinais que valem a pena acompanhar se você está fazendo um orçamento de longo prazo.
- O GA da API GPT-5.5. Os preços podem cair à medida que a OpenAI responde à pressão competitiva de Anthropic Claude Mythos, Gemini 3.5 e modelos de código aberto (open-weight) avaliados no quadro de líderes da Vellum.
- Democratização do modelo Pro. A OpenAI historicamente reduziu os preços do nível Pro dentro de 3 a 6 meses de cada lançamento. Não presuma que os $30 / $180 de hoje sejam permanentes; também não presuma que eles cairão.
FAQ
O cache reduz o custo de entrada?Sim. Tokens de entrada em cache no GPT-5.5 são cobrados a uma fração da taxa padrão; a página de preços da OpenAI tem o multiplicador exato. Armazene em cache tudo o que você reutiliza em mais de uma requisição (prompts de sistema, esquemas de ferramentas, contexto de repositório).
Há desconto por volume?Não há um publicado. Contratos empresariais geralmente incluem taxas personalizadas, e a OpenAI ajusta os preços em resposta ao uso contínuo. Fale com a equipe de vendas se o gasto anual ultrapassar sete dígitos.
O modo de raciocínio custa extra além da precificação por token?Não. Custa mais porque usa mais tokens, não porque a taxa por token muda.
O uso do Codex CLI é cobrado separadamente do uso da API?Apenas se você fizer login com uma chave de API. Logins do ChatGPT cobram a taxa do plano; logins com chave de API cobram a conta baseada em uso.
Qual é a maneira mais barata de experimentar o GPT-5.5?Plano Gratuito ou Go mais Codex CLI. Veja nosso guia do caminho gratuito para todas as opções sem custo.
