O Que É Claude Sonnet 5? Recursos, Benchmarks e Preços

Claude Sonnet 5 é o mais novo modelo de nível intermediário da Anthropic, lançado em 30 de junho de 2026. A Anthropic o descreve como “a melhor combinação de velocidade e inteligência” e “o modelo Sonnet mais agêntico até agora”. Em resumo: ele se aproxima do Opus 4.8 em tarefas de agente e uso de ferramentas, custando muito menos. Este guia aborda o que é o Sonnet 5, suas especificações completas, os benchmarks de lançamento, preços, disponibilidade e quem deve usá-lo. Se você planeja chamar o modelo via HTTP, pode testar essas solicitações no Apidog conforme avança.

botão

Cada seção aqui leva a um aprofundamento focado, então trate esta página como um mapa e siga os links quando precisar de detalhes sobre a API, preços, ou um comparativo direto com o Opus 4.8.

O que é o Claude Sonnet 5

Claude Sonnet 5 é o sucessor do Claude Sonnet 4.6. Seu ID de modelo de API é a string exata claude-sonnet-5, sem sufixo de data. Ele se encaixa na camada Sonnet, que a Anthropic posiciona entre os modelos Haiku menores e os modelos Opus e Fable maiores.

A principal novidade é sobre valor. Em tarefas onde o modelo usa ferramentas, executa em loop ou atua como um agente, o Sonnet 5 se aproxima de poucos pontos do Opus 4.8. Em raciocínio puro, sem apoio, o Opus ainda lidera. Portanto, o Sonnet 5 é o modelo que você procura quando deseja um forte desempenho de agente sem pagar os preços do Opus.

É também uma atualização direta para o Sonnet 4.6. Você muda o ID do modelo e então revisa três mudanças de comportamento e uma mudança no tokenizador. Abordamos isso abaixo e na comparação dedicada Sonnet 5 vs Sonnet 4.6.

Especificações completas

Aqui está o que você obtém com claude-sonnet-5:

Especificação	Valor
Janela de contexto	1.000.000 tokens (1M)
Saída máxima	128.000 tokens (128K)
Pensamento adaptativo	Ativado por padrão
Parâmetro de esforço	low / medium / high / xhigh
Visão, cache de prompt, uso de ferramentas, lote, saídas estruturadas	Suportado
Camada de Prioridade	Não disponível
Retenção zero de dados (ZDR)	Suportado para organizações com acordo ZDR

Algumas observações sobre isso:

A janela de contexto de 1M é o padrão e o máximo. Não há uma variante de contexto menor para escolher.
O pensamento adaptativo está ativado por padrão. Esta é uma mudança em relação ao Sonnet 4.6, onde não enviar o campo thinking significava que nenhum pensamento ocorria.
O parâmetro de esforço controla o quanto o modelo pensa e gasta. Você o define como low (baixo), medium (médio), high (alto) ou xhigh (muito alto), dependendo do quão duro você quer que o modelo trabalhe.
O conjunto de recursos corresponde ao Sonnet 4.6, com uma exceção: a Camada de Prioridade não está disponível no Sonnet 5.

Para a forma completa de solicitação e resposta, consulte o guia passo a passo da API e a visão geral dos modelos da Anthropic.

As três mudanças de comportamento e o novo tokenizador

Se você está migrando do Sonnet 4.6, três coisas mudaram no nível da API. Ignore-as e suas solicitações podem retornar um erro 400 ou se comportar de forma diferente de antes.

O pensamento adaptativo está ativado por padrão. Solicitações sem o campo thinking agora são executadas com pensamento adaptativo. Para desativá-lo, envie thinking: {type: "disabled"}. Como max_tokens limita a saída total (tokens de pensamento mais texto de resposta), revise max_tokens para cargas de trabalho que costumavam ser executadas sem pensamento.
O pensamento estendido manual foi removido. Enviar thinking: {type: "enabled", budget_tokens: N} agora retorna um erro 400. Use o pensamento adaptativo e o parâmetro de esforço em vez disso.
Parâmetros de amostragem não são aceitos. Definir temperature, top_p ou top_k para um valor não padrão retorna um erro 400. Remova-os ao migrar. Direcione o comportamento por meio de instruções no prompt do sistema.

O pré-preenchimento de mensagens do assistente ainda não é suportado e retorna um 400, assim como no Sonnet 4.6. Use saídas estruturadas ou instruções no prompt do sistema para moldar a resposta.

Há mais uma mudança que é fácil de ignorar porque não afeta a forma da API. O Sonnet 5 usa um novo tokenizador. O mesmo texto de entrada produz aproximadamente 30% mais tokens do que no Sonnet 4.6, cerca de 1,3 vezes mais. Nada na sua solicitação, resposta ou código de streaming muda. Mas tudo o que você mede ou orça em tokens muda:

Os campos de usage e os resultados da contagem de tokens são maiores para o mesmo texto. Conte novamente usando o Sonnet 5 em vez de reutilizar seus números do 4.6.
A janela de 1M comporta menos texto em média, já que cada token agora cobre menos texto.
Orçamentos de max_tokens dimensionados próximos à sua saída esperada podem agora ser truncados. Revise-os.
O custo por solicitação de texto equivalente pode aumentar, embora o preço por token não tenha mudado.

A página de novidades documenta cada um desses pontos, e a documentação de contagem de tokens mostra como medi-los.

Visão geral dos benchmarks

Os números abaixo são os valores relatados pela Anthropic no lançamento. Eles são corroborados por artigos de lançamento, então trate-os como resultados relatados em vez de testes independentes.

Benchmark	Sonnet 5	Opus 4.8	Sonnet 4.6
SWE-bench Pro (codificação agêntica)	63,2%	69,2%	58,1%
Terminal-Bench 2.1	80,4%	82,7%	Não relatado
OSWorld-Verified (uso de computador)	81,2%	83,4%	78,5%

O padrão é consistente. Com ferramentas no loop, o Sonnet 5 se aproxima de 1 a 3 pontos do Opus 4.8. Em raciocínio puro, sem apoio, o Opus lidera por aproximadamente 6 pontos. O Sonnet 5 é mais forte em tarefas de agente e ferramentas do que em raciocínio puro.

Em comparação com seu predecessor, o Sonnet 5 melhora claramente: o SWE-bench Pro sobe de 58,1% para 63,2%, e o OSWorld-Verified aumenta de 78,5% para 81,2%.

A análise completa, incluindo o que esses benchmarks não abordam, está disponível no aprofundamento dos benchmarks do Sonnet 5. Você também pode verificar o centro de transparência da Anthropic para os dados subjacentes.

Preços

O Sonnet 5 mantém a mesma taxa por token do Sonnet 4.6 e foi lançado com um desconto introdutório.

Preços	Entrada (por M tokens)	Saída (por M tokens)
Introdutório (até 31 de agosto de 2026)	US$ 2	US$ 10
Padrão (a partir de 1º de setembro de 2026)	US$ 3	US$ 15

A taxa introdutória de US$ 2 por milhão de entrada e US$ 10 por milhão de saída vai até 31 de agosto de 2026. Depois disso, ela passa para o padrão de US$ 3 por milhão de entrada e US$ 15 por milhão de saída, o que corresponde ao Sonnet 4.6.

Há um detalhe que vale a pena considerar. Como o novo tokenizador produz cerca de 30% mais tokens para o mesmo texto, o custo de uma solicitação equivalente pode ser maior do que no Sonnet 4.6, mesmo que a taxa por token seja idêntica. Não presuma paridade exata. Modele suas cargas de trabalho reais com a contagem de tokens antes de alocar um orçamento.

Para contexto, o Opus 4.8 custa US$ 5 por milhão de entrada e US$ 25 por milhão de saída, e o Fable 5 custa US$ 10 por milhão de entrada e US$ 50 por milhão de saída. O Sonnet 5 está bem abaixo de ambos. Para taxas de lote e cache de prompt, verifique a página de preços da Anthropic, em vez de qualquer número citado de segunda mão. A análise completa de preços apresenta um exemplo prático.

Disponibilidade

O Sonnet 5 está disponível nos próprios produtos da Anthropic e nas principais plataformas de nuvem:

API Claude: disponível para todos os clientes.
Aplicativos Claude: o modelo padrão para Free e Pro, e também disponível para Max, Team e Enterprise.
Claude Code: disponível.
AWS: através do Claude no Amazon Bedrock e na Plataforma Claude na AWS. Não nas rotas legadas Bedrock InvokeModel ou Converse.
Google Cloud: disponível no Vertex AI.
Microsoft Foundry: em prévia.

Como o Sonnet 5 é o padrão no plano gratuito do Claude, a maioria das pessoas pode experimentá-lo sem pagar nada. O guia de acesso gratuito abrange os caminhos gratuitos legítimos e seus limites.

Resumo de segurança

O cartão do sistema da Anthropic relata uma taxa geral menor de comportamentos indesejáveis do que o Sonnet 4.6, e o modelo é mais seguro em contextos de agente. Ele apresenta menor alucinação e bajulação do que o Sonnet 4.6, e é melhor em recusar solicitações maliciosas e resistir à injeção de prompt.

O Sonnet 5 é também o primeiro modelo da camada Sonnet com salvaguardas de cibersegurança em tempo real. Solicitações que abordam tópicos cibernéticos proibidos ou de alto risco podem ser recusadas. Uma recusa retorna como um HTTP 200 bem-sucedido com stop_reason: "refusal", não um erro, então trate esse motivo de parada em seu código.

Para ser justo sobre as compensações: o Sonnet 5 apresenta taxas de comportamento desalinhado mais altas do que o Opus 4.8 e o Mythos Preview na auditoria comportamental automatizada da Anthropic, e tem menor capacidade cibernética do que os modelos Opus. Nenhum modelo Sonnet conseguiu desenvolver um exploit funcional, pontuando 0,0% nessa medida.

Teste a API do Sonnet 5 com Apidog

Ao chamar o Sonnet 5, você está acessando uma API HTTP com cabeçalhos de autenticação, corpos de solicitação e resposta JSON, limites de taxa e erros. Isso é exatamente o tipo de coisa que o Apidog foi construído para lidar. O Apidog é uma plataforma completa de desenvolvimento e teste de API, para que você possa enviar solicitações do Sonnet 5, salvá-las como uma coleção reutilizável e gerenciar suas chaves por ambiente.

Uma configuração prática se parece com isto:

Crie uma solicitação para o endpoint de Mensagens da Anthropic e armazene sua chave de API como uma variável de ambiente, não no corpo da solicitação.
Salve a solicitação em uma coleção para que sua equipe possa reutilizá-la.
Adicione uma asserção para verificar a forma da resposta, por exemplo, se stop_reason está presente para que um resultado de refusal não passe despercebido.
Simule o endpoint quando quiser construir com base em uma resposta estável sem gastar tokens.

Aqui está a forma da API de Mensagens que você enviaria:

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in one sentence."}
    ]
  }'

Como o pensamento adaptativo está ativado por padrão, essa solicitação é executada com pensamento, a menos que você adicione thinking: {type: "disabled"}. Lembre-se de que max_tokens limita o pensamento mais o texto de resposta juntos, então dê espaço suficiente. Depois que sua solicitação funcionar, salve-a e adicione um teste para detectar regressões ao trocar de modelos mais tarde. Se você quiser acompanhar, Baixe o Apidog e importe a solicitação. O passo a passo completo da API tem o fluxo completo, incluindo a versão do SDK Python.

Para quem é o Sonnet 5

O Sonnet 5 é um bom padrão em muitas situações:

Você constrói agentes ou fluxos de trabalho que usam muitas ferramentas. É aqui que o Sonnet 5 se destaca e permanece próximo ao Opus 4.8.
Você executa alto volume e se preocupa com o custo. A diferença de preço em relação ao Opus é grande, e a taxa introdutória a torna ainda maior até agosto.
Você quer uma atualização direta do Sonnet 4.6. Troque o ID do modelo, revise as três mudanças de comportamento e meça novamente seus tokens.
Você codifica no Claude Code ou em um editor. O Sonnet 5 é um forte padrão de codificação agêntica. Veja como usá-lo no Claude Code.

Opte pelo Opus 4.8 quando precisar do raciocínio puro mais complexo, autonomia de longo prazo ou a mais alta qualidade absoluta, e o custo extra valer a pena. A comparação Sonnet 5 vs Opus 4.8 detalha essa decisão. Para obter informações sobre a própria camada Opus, consulte o que é o Claude Opus 4.8.

FAQ

O Claude Sonnet 5 é melhor que o Opus 4.8? Depende da tarefa. Em benchmarks de agente e uso de ferramentas, o Sonnet 5 se aproxima de 1 a 3 pontos do Opus 4.8 a um preço muito menor. Em raciocínio puro, o Opus 4.8 lidera por aproximadamente 6 pontos. Escolha o Sonnet 5 para agentes e alto volume, e o Opus 4.8 para o raciocínio mais complexo. A comparação direta detalha isso.

Qual é o ID do modelo para Claude Sonnet 5? O ID do modelo da API é claude-sonnet-5, sem sufixo de data. Defina essa string como o valor de model em sua solicitação.

Quanto custa o Claude Sonnet 5? A taxa introdutória é de US$ 2 por milhão de tokens de entrada e US$ 10 por milhão de tokens de saída até 31 de agosto de 2026. Depois disso, ela passa para o padrão de US$ 3 por milhão de entrada e US$ 15 por milhão de saída. Observe que o novo tokenizador produz cerca de 30% mais tokens para o mesmo texto, então uma solicitação equivalente pode custar mais, mesmo com a mesma taxa por token.

Posso usar o Claude Sonnet 5 gratuitamente? Sim. O Sonnet 5 é o modelo padrão no plano gratuito do Claude em claude.ai e na camada gratuita do Claude Code, sujeito a limites de uso. Consulte o guia de acesso gratuito para os caminhos legítimos e seus limites.

Preciso mudar meu código para fazer upgrade do Sonnet 4.6? Principalmente, você muda o ID do modelo. Em seguida, revise três coisas: o pensamento adaptativo agora está ativado por padrão, então revise max_tokens; o campo de pensamento estendido budget_tokens agora retorna um 400; e parâmetros de amostragem não padrão agora retornam um 400. Meça novamente suas contagens de tokens devido ao novo tokenizador.

botão