Claude Sonnet 5: Preços, Custos e Análise Completa (2026)

O Claude Sonnet 5 foi lançado em 30 de junho de 2026, e o preço é a manchete. Você obtém um desempenho próximo ao Opus 4.8 em tarefas de agenciamento e uso de ferramentas por uma fração do custo. Este guia fornece os números exatos: a taxa de introdução, a taxa padrão, a data em que mudam e um detalhe do tokenizador que muda silenciosamente sua conta real. Você também verá como o Sonnet 5 se compara ao Opus 4.8 e ao Fable 5 para que você possa escolher o modelo certo com base no custo, e não apenas na capacidade. Quando você começar a chamar a API, Apidog é onde você envia essas requisições, as salva e rastreia exatamente o que está pagando.

botão

Aqui está o que você obtém: a taxa por token, um exemplo de custo detalhado, uma tabela de comparação modelo a modelo e uma pequena lista de verificação para estimar e monitorar os gastos antes que eles o surpreendam.

Preços do Claude Sonnet 5 em resumo

O Sonnet 5 usa a mesma taxa por token de seu predecessor, o Sonnet 4.6. Nada mudou no preço de tabela. O que mudou foi o desconto introdutório que dura pelos primeiros dois meses.

Taxa	Entrada (por 1M de tokens)	Saída (por 1M de tokens)	Em vigor
Introdução	$2	$10	Até 31 de agosto de 2026
Padrão	$3	$15	A partir de 1º de setembro de 2026

O ID do modelo é claude-sonnet-5 sem sufixo de data. Essa única string é o que você envia na requisição da API, e ela é cobrada de acordo com essas taxas.

Duas coisas importantes para fixar agora:

A taxa introdutória (entrada de $2 / saída de $10) está ativa até 31 de agosto de 2026. Depois disso, ela passa para o padrão de $3 / $15.
A taxa padrão é idêntica à do Sonnet 4.6. Se você já estava usando o Sonnet 4.6, seu preço por token não aumenta ao migrar.

Este último ponto parece uma vitória clara. Em grande parte, é. Mas há um detalhe do tokenizador que muda a matemática, e é fácil de perder.

A pegadinha do tokenizador: mesma taxa, mais tokens

O Sonnet 5 vem com um novo tokenizador. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que no Sonnet 4.6, cerca de 1.3x. Isso não é uma mudança na API. O formato da requisição, resposta e streaming são idênticos, e você não precisa escrever nenhum código novo. Mas tudo o que você mede ou orça em tokens muda.

Como você paga por token, mais tokens para o mesmo texto significa um custo mais alto para uma requisição equivalente, mesmo que a taxa por token não tenha mudado.

Aqui está um exemplo prático. Digamos que um prompt tinha 10.000 tokens no Sonnet 4.6.

No Sonnet 4.6 a $3 por milhão de entrada: 10.000 tokens custam cerca de $0.030.
No Sonnet 5, o mesmo texto tem aproximadamente 13.000 tokens. Com a taxa introdutória de $2 por milhão de entrada: cerca de $0.026.
No Sonnet 5 com a taxa padrão de $3 por milhão de entrada (após 31 de agosto): cerca de $0.039.

Então, durante o período introdutório, o desconto cancela aproximadamente os tokens extras, e você pode pagar o mesmo ou um pouco menos. Assim que a taxa padrão entrar em vigor, o mesmo texto com 1.3x tokens custará mais do que custava no Sonnet 4.6 com a mesma taxa por token. A taxa é fixa. A conta não.

Isso afeta mais do que o custo:

Os campos usage e os resultados de contagem de tokens retornam valores mais altos para o mesmo texto. Conte novamente com o Sonnet 5. Não reutilize suas contagens antigas do Sonnet 4.6.
A janela de contexto de 1M de tokens comporta menos texto em média, já que cada token agora cobre menos texto.
Os orçamentos de max_tokens que você definiu perto da sua saída esperada podem ser truncados. Revise-os.

A conclusão é simples: modele suas cargas de trabalho reais com contagem de tokens no Sonnet 5 antes de assumir paridade. A documentação de contagem de tokens da Anthropic mostra como medir um prompt em relação ao tokenizador atual. Para uma análise completa de uma primeira chamada de API e onde ler o bloco usage, consulte nosso guia da API Claude Sonnet 5.

Como o Sonnet 5 se compara ao Opus 4.8 e ao Fable 5

O Sonnet 5 está precificado para ser o modelo de volume. O caso de valor é mais claro quando você o compara com os modelos acima dele. Todos os três compartilham uma janela de contexto de 1M de tokens e saída máxima de 128K, então a diferença aqui é o preço e onde cada modelo se destaca.

Modelo	ID do Modelo	Entrada (por 1M)	Saída (por 1M)
Sonnet 5 (introdução)	`claude-sonnet-5`	$2	$10
Sonnet 5 (padrão)	`claude-sonnet-5`	$3	$15
Sonnet 4.6	`claude-sonnet-4-6`	$3	$15
Opus 4.8	`claude-opus-4-8`	$5	$25
Fable 5	`claude-fable-5`	$10	$50

Leia essa tabela tendo os benchmarks em mente. Em tarefas de agenciamento e uso de ferramentas, os números de lançamento da Anthropic colocam o Sonnet 5 dentro de aproximadamente 1 a 3 pontos do Opus 4.8. Os números relatados incluem SWE-bench Pro em 63.2% para o Sonnet 5 versus 69.2% para o Opus 4.8, Terminal-Bench 2.1 em 80.4% versus 82.7%, e OSWorld-Verified em 81.2% versus 83.4%. O Opus se destaca em cerca de 6 pontos em raciocínio puro sem nenhum apoio.

Então, a decisão de custo se resume a isto:

Com a taxa padrão, o Sonnet 5 é 40% mais barato na entrada e 40% mais barato na saída do que o Opus 4.8, para um desempenho próximo ao Opus em trabalhos com muitas ferramentas.
O Fable 5 custa $10 / $50, mais que o triplo da taxa de entrada padrão do Sonnet 5. Você o utiliza quando precisa do modelo mais capaz amplamente lançado da Anthropic, não para loops de agente de alto volume.
Comparado ao Sonnet 4.6, você paga o mesmo por token por melhores pontuações de codificação e agenciamento, com a ressalva do tokenizador mencionada acima.

Se você está ponderando a capacidade contra o preço para um trabalho específico, nossa análise do Sonnet 5 vs Opus 4.8 detalha a decisão tarefa por tarefa. Para o lado do Fable 5 da escada, consulte o guia de preços do Fable 5.

Teste e rastreie as requisições que você está pagando com Apidog

Cada dólar em sua conta do Sonnet 5 corresponde a uma requisição HTTP: um POST para a API de Mensagens com um corpo JSON, uma chave de API e uma resposta pela qual você paga por token. Se você está adivinhando essas requisições, está adivinhando seu custo.

Apidog oferece um lugar para tornar essas requisições reais e repetíveis:

Envie uma requisição Sonnet 5 e veja a resposta exata, incluindo o bloco usage que informa a contagem de tokens de entrada e saída por chamada. Esse é o seu custo, por requisição, antes de escalá-la.
Salve a requisição em uma coleção para que sua equipe execute a mesma chamada, e não chamadas ligeiramente diferentes que cobram de forma diferente.
Armazene sua chave de API como uma variável de ambiente e alterne entre chaves de teste e produção sem editar a requisição.
Adicione asserções automatizadas para que uma mudança de prompt que duplica o comprimento da saída seja detectada na CI, e não na fatura.
Simule o endpoint para que você possa construir e testar sua integração sem gastar tokens reais em cada execução de desenvolvimento.

Aqui está uma primeira requisição no formato da API de Mensagens da Anthropic. Envie-a no Apidog, leia os campos usage na resposta, e você terá um número de custo real por chamada para multiplicar.

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in two sentences."}
    ]
  }'

A resposta inclui um objeto usage com input_tokens e output_tokens. Multiplique esses valores pelas taxas na tabela acima e você terá o custo exato dessa chamada. Faça isso para seus prompts reais e sua estimativa deixará de ser um palpite.

Baixe o Apidog para enviar requisições Sonnet 5, inspecionar o uso de tokens e organizar as chamadas pelas quais você está sendo cobrado em um único espaço de trabalho.

Perguntas frequentes

Quanto custa a API Claude Sonnet 5?

Durante o período introdutório, até 31 de agosto de 2026, custa $2 por milhão de tokens de entrada e $10 por milhão de tokens de saída. A partir de 1º de setembro de 2026, passa para a taxa padrão de $3 por milhão de entrada e $15 por milhão de saída.

O Sonnet 5 é mais barato que o Sonnet 4.6?

A taxa por token é a mesma do Sonnet 4.6 no nível padrão ($3 / $15), e menor durante a janela introdutória. Mas o novo tokenizador do Sonnet 5 produz cerca de 30% mais tokens para o mesmo texto, então o custo de uma requisição equivalente pode ser maior na taxa padrão. Conte os tokens no Sonnet 5 para ver seu número real. Nossa comparação Sonnet 5 vs Sonnet 4.6 abrange os detalhes da migração.

Por que o mesmo prompt custa mais no Sonnet 5 do que no Sonnet 4.6?

A taxa por token não mudou, mas o novo tokenizador divide o mesmo texto em aproximadamente 1.3x mais tokens. Mais tokens à mesma taxa significa um custo mais alto para um texto equivalente, o que é mais visível quando o desconto introdutório termina.

Como o preço do Sonnet 5 se compara ao Opus 4.8?

O Opus 4.8 custa $5 por milhão de entrada e $25 por milhão de saída, versus os $3 / $15 padrão do Sonnet 5. O Sonnet 5 fica dentro de cerca de 1 a 3 pontos do Opus 4.8 nos benchmarks de agenciamento relatados pela Anthropic, então você obtém um desempenho próximo em tarefas com muitas ferramentas a um preço mais baixo.

Existem maneiras mais baratas de executar o Sonnet 5?

Sim. O processamento em lote e o cache de prompts reduzem a taxa efetiva para cargas de trabalho adequadas. As taxas de desconto exatas estão na página de preços da Anthropic. Dimensionar max_tokens corretamente e manter os prompts concisos também reduz o custo de saída, que é 5x a taxa de entrada.