O Claude Sonnet 5 foi lançado em 30 de junho de 2026, e o preço é a manchete. Você obtém um desempenho próximo ao Opus 4.8 em tarefas de agenciamento e uso de ferramentas por uma fração do custo. Este guia fornece os números exatos: a taxa de introdução, a taxa padrão, a data em que mudam e um detalhe do tokenizador que muda silenciosamente sua conta real. Você também verá como o Sonnet 5 se compara ao Opus 4.8 e ao Fable 5 para que você possa escolher o modelo certo com base no custo, e não apenas na capacidade. Quando você começar a chamar a API, Apidog é onde você envia essas requisições, as salva e rastreia exatamente o que está pagando.
Aqui está o que você obtém: a taxa por token, um exemplo de custo detalhado, uma tabela de comparação modelo a modelo e uma pequena lista de verificação para estimar e monitorar os gastos antes que eles o surpreendam.

Preços do Claude Sonnet 5 em resumo
O Sonnet 5 usa a mesma taxa por token de seu predecessor, o Sonnet 4.6. Nada mudou no preço de tabela. O que mudou foi o desconto introdutório que dura pelos primeiros dois meses.
| Taxa | Entrada (por 1M de tokens) | Saída (por 1M de tokens) | Em vigor |
|---|---|---|---|
| Introdução | $2 | $10 | Até 31 de agosto de 2026 |
| Padrão | $3 | $15 | A partir de 1º de setembro de 2026 |
O ID do modelo é claude-sonnet-5 sem sufixo de data. Essa única string é o que você envia na requisição da API, e ela é cobrada de acordo com essas taxas.
Duas coisas importantes para fixar agora:
- A taxa introdutória (entrada de $2 / saída de $10) está ativa até 31 de agosto de 2026. Depois disso, ela passa para o padrão de $3 / $15.
- A taxa padrão é idêntica à do Sonnet 4.6. Se você já estava usando o Sonnet 4.6, seu preço por token não aumenta ao migrar.
Este último ponto parece uma vitória clara. Em grande parte, é. Mas há um detalhe do tokenizador que muda a matemática, e é fácil de perder.
A pegadinha do tokenizador: mesma taxa, mais tokens
O Sonnet 5 vem com um novo tokenizador. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que no Sonnet 4.6, cerca de 1.3x. Isso não é uma mudança na API. O formato da requisição, resposta e streaming são idênticos, e você não precisa escrever nenhum código novo. Mas tudo o que você mede ou orça em tokens muda.
Como você paga por token, mais tokens para o mesmo texto significa um custo mais alto para uma requisição equivalente, mesmo que a taxa por token não tenha mudado.
Aqui está um exemplo prático. Digamos que um prompt tinha 10.000 tokens no Sonnet 4.6.
- No Sonnet 4.6 a $3 por milhão de entrada: 10.000 tokens custam cerca de $0.030.
- No Sonnet 5, o mesmo texto tem aproximadamente 13.000 tokens. Com a taxa introdutória de $2 por milhão de entrada: cerca de $0.026.
- No Sonnet 5 com a taxa padrão de $3 por milhão de entrada (após 31 de agosto): cerca de $0.039.
Então, durante o período introdutório, o desconto cancela aproximadamente os tokens extras, e você pode pagar o mesmo ou um pouco menos. Assim que a taxa padrão entrar em vigor, o mesmo texto com 1.3x tokens custará mais do que custava no Sonnet 4.6 com a mesma taxa por token. A taxa é fixa. A conta não.
Isso afeta mais do que o custo:
- Os campos
usagee os resultados de contagem de tokens retornam valores mais altos para o mesmo texto. Conte novamente com o Sonnet 5. Não reutilize suas contagens antigas do Sonnet 4.6. - A janela de contexto de 1M de tokens comporta menos texto em média, já que cada token agora cobre menos texto.
- Os orçamentos de
max_tokensque você definiu perto da sua saída esperada podem ser truncados. Revise-os.
A conclusão é simples: modele suas cargas de trabalho reais com contagem de tokens no Sonnet 5 antes de assumir paridade. A documentação de contagem de tokens da Anthropic mostra como medir um prompt em relação ao tokenizador atual. Para uma análise completa de uma primeira chamada de API e onde ler o bloco usage, consulte nosso guia da API Claude Sonnet 5.
Como o Sonnet 5 se compara ao Opus 4.8 e ao Fable 5
O Sonnet 5 está precificado para ser o modelo de volume. O caso de valor é mais claro quando você o compara com os modelos acima dele. Todos os três compartilham uma janela de contexto de 1M de tokens e saída máxima de 128K, então a diferença aqui é o preço e onde cada modelo se destaca.
| Modelo | ID do Modelo | Entrada (por 1M) | Saída (por 1M) |
|---|---|---|---|
| Sonnet 5 (introdução) | claude-sonnet-5 |
$2 | $10 |
| Sonnet 5 (padrão) | claude-sonnet-5 |
$3 | $15 |
| Sonnet 4.6 | claude-sonnet-4-6 |
$3 | $15 |
| Opus 4.8 | claude-opus-4-8 |
$5 | $25 |
| Fable 5 | claude-fable-5 |
$10 | $50 |
Leia essa tabela tendo os benchmarks em mente. Em tarefas de agenciamento e uso de ferramentas, os números de lançamento da Anthropic colocam o Sonnet 5 dentro de aproximadamente 1 a 3 pontos do Opus 4.8. Os números relatados incluem SWE-bench Pro em 63.2% para o Sonnet 5 versus 69.2% para o Opus 4.8, Terminal-Bench 2.1 em 80.4% versus 82.7%, e OSWorld-Verified em 81.2% versus 83.4%. O Opus se destaca em cerca de 6 pontos em raciocínio puro sem nenhum apoio.
Então, a decisão de custo se resume a isto:
- Com a taxa padrão, o Sonnet 5 é 40% mais barato na entrada e 40% mais barato na saída do que o Opus 4.8, para um desempenho próximo ao Opus em trabalhos com muitas ferramentas.
- O Fable 5 custa $10 / $50, mais que o triplo da taxa de entrada padrão do Sonnet 5. Você o utiliza quando precisa do modelo mais capaz amplamente lançado da Anthropic, não para loops de agente de alto volume.
- Comparado ao Sonnet 4.6, você paga o mesmo por token por melhores pontuações de codificação e agenciamento, com a ressalva do tokenizador mencionada acima.
Se você está ponderando a capacidade contra o preço para um trabalho específico, nossa análise do Sonnet 5 vs Opus 4.8 detalha a decisão tarefa por tarefa. Para o lado do Fable 5 da escada, consulte o guia de preços do Fable 5.
Teste e rastreie as requisições que você está pagando com Apidog
Cada dólar em sua conta do Sonnet 5 corresponde a uma requisição HTTP: um POST para a API de Mensagens com um corpo JSON, uma chave de API e uma resposta pela qual você paga por token. Se você está adivinhando essas requisições, está adivinhando seu custo.

Apidog oferece um lugar para tornar essas requisições reais e repetíveis:
- Envie uma requisição Sonnet 5 e veja a resposta exata, incluindo o bloco
usageque informa a contagem de tokens de entrada e saída por chamada. Esse é o seu custo, por requisição, antes de escalá-la. - Salve a requisição em uma coleção para que sua equipe execute a mesma chamada, e não chamadas ligeiramente diferentes que cobram de forma diferente.
- Armazene sua chave de API como uma variável de ambiente e alterne entre chaves de teste e produção sem editar a requisição.
- Adicione asserções automatizadas para que uma mudança de prompt que duplica o comprimento da saída seja detectada na CI, e não na fatura.
- Simule o endpoint para que você possa construir e testar sua integração sem gastar tokens reais em cada execução de desenvolvimento.
Aqui está uma primeira requisição no formato da API de Mensagens da Anthropic. Envie-a no Apidog, leia os campos usage na resposta, e você terá um número de custo real por chamada para multiplicar.
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in two sentences."}
]
}'
A resposta inclui um objeto usage com input_tokens e output_tokens. Multiplique esses valores pelas taxas na tabela acima e você terá o custo exato dessa chamada. Faça isso para seus prompts reais e sua estimativa deixará de ser um palpite.
Baixe o Apidog para enviar requisições Sonnet 5, inspecionar o uso de tokens e organizar as chamadas pelas quais você está sendo cobrado em um único espaço de trabalho.
Perguntas frequentes
Quanto custa a API Claude Sonnet 5?
Durante o período introdutório, até 31 de agosto de 2026, custa $2 por milhão de tokens de entrada e $10 por milhão de tokens de saída. A partir de 1º de setembro de 2026, passa para a taxa padrão de $3 por milhão de entrada e $15 por milhão de saída.
O Sonnet 5 é mais barato que o Sonnet 4.6?
A taxa por token é a mesma do Sonnet 4.6 no nível padrão ($3 / $15), e menor durante a janela introdutória. Mas o novo tokenizador do Sonnet 5 produz cerca de 30% mais tokens para o mesmo texto, então o custo de uma requisição equivalente pode ser maior na taxa padrão. Conte os tokens no Sonnet 5 para ver seu número real. Nossa comparação Sonnet 5 vs Sonnet 4.6 abrange os detalhes da migração.
Por que o mesmo prompt custa mais no Sonnet 5 do que no Sonnet 4.6?
A taxa por token não mudou, mas o novo tokenizador divide o mesmo texto em aproximadamente 1.3x mais tokens. Mais tokens à mesma taxa significa um custo mais alto para um texto equivalente, o que é mais visível quando o desconto introdutório termina.
Como o preço do Sonnet 5 se compara ao Opus 4.8?
O Opus 4.8 custa $5 por milhão de entrada e $25 por milhão de saída, versus os $3 / $15 padrão do Sonnet 5. O Sonnet 5 fica dentro de cerca de 1 a 3 pontos do Opus 4.8 nos benchmarks de agenciamento relatados pela Anthropic, então você obtém um desempenho próximo em tarefas com muitas ferramentas a um preço mais baixo.
Existem maneiras mais baratas de executar o Sonnet 5?
Sim. O processamento em lote e o cache de prompts reduzem a taxa efetiva para cargas de trabalho adequadas. As taxas de desconto exatas estão na página de preços da Anthropic. Dimensionar max_tokens corretamente e manter os prompts concisos também reduz o custo de saída, que é 5x a taxa de entrada.
