Claude Sonnet 5 est le tout nouveau modèle de milieu de gamme d'Anthropic, lancé le 30 juin 2026. Anthropic le qualifie de "meilleure combinaison de vitesse et d'intelligence" et de "modèle Sonnet le plus autonome à ce jour". En bref : il se rapproche d'Opus 4.8 sur les tâches d'agentivité et d'utilisation d'outils tout en coûtant beaucoup moins cher. Ce guide couvre ce qu'est Sonnet 5, ses spécifications complètes, les benchmarks de lancement, la tarification, la disponibilité, et qui devrait l'utiliser. Si vous prévoyez d'appeler le modèle via HTTP, vous pouvez tester ces requêtes dans Apidog au fur et à mesure.
Chaque section ici renvoie à une exploration approfondie ciblée, alors traitez cette page comme une carte et suivez les liens lorsque vous avez besoin de détails sur l'API, la tarification, ou une comparaison directe avec Opus 4.8.
Qu'est-ce que Claude Sonnet 5
Claude Sonnet 5 est le successeur de Claude Sonnet 4.6. Son ID de modèle API est la chaîne exacte claude-sonnet-5, sans suffixe de date. Il se situe dans la catégorie Sonnet, qu'Anthropic positionne entre les modèles Haiku plus petits et les modèles Opus et Fable plus grands.

Le point essentiel est la valeur. Sur les tâches où le modèle utilise des outils, s'exécute en boucle ou agit comme un agent, Sonnet 5 se situe à quelques points d'Opus 4.8. Sur le raisonnement pur sans support, Opus reste en tête. Sonnet 5 est donc le modèle vers lequel vous vous tournez lorsque vous souhaitez une forte performance d'agentivité sans payer les prix d'Opus.
C'est aussi une mise à niveau directe pour Sonnet 4.6. Vous changez l'ID du modèle, puis examinez trois changements de comportement et un changement de tokenizer. Nous les abordons ci-dessous et dans la comparaison dédiée Sonnet 5 vs Sonnet 4.6.
Spécifications complètes
Voici ce que vous obtenez avec claude-sonnet-5 :
| Spécification | Valeur |
|---|---|
| Fenêtre de contexte | 1 000 000 jetons (1M) |
| Sortie maximale | 128 000 jetons (128K) |
| Pensée adaptative | Activée par défaut |
| Paramètre d'effort | faible / moyen / élevé / très élevé |
| Vision, mise en cache de prompts, utilisation d'outils, traitement par lots, sorties structurées | Pris en charge |
| Niveau de priorité | Non disponible |
| Rétention zéro des données (ZDR) | Pris en charge pour les organisations ayant un accord ZDR |
Quelques remarques à ce sujet :
- La fenêtre de contexte de 1M est à la fois par défaut et la maximale. Il n'y a pas de variante de contexte plus petite à choisir.
- La pensée adaptative est activée par défaut. C'est un changement par rapport à Sonnet 4.6, où ne pas envoyer de champ
thinkingsignifiait qu'aucune pensée n'avait lieu du tout. - Le paramètre d'effort contrôle la quantité de pensée et de dépense du modèle. Vous le définissez sur
faible,moyen,élevéoutrès élevéselon l'intensité avec laquelle vous souhaitez que le modèle travaille. - L'ensemble des fonctionnalités correspond à Sonnet 4.6, à une exception près : le niveau de priorité n'est pas disponible sur Sonnet 5.
Pour la forme complète des requêtes et réponses, consultez le guide API étape par étape et l'aperçu des modèles d'Anthropic.
Les trois changements de comportement et le nouveau tokenizer
Si vous passez de Sonnet 4.6, trois choses ont changé au niveau de l'API. Si vous les ignorez, vos requêtes peuvent renvoyer une erreur 400 ou se comporter différemment d'auparavant.
- **La pensée adaptative est activée par défaut.** Les requêtes sans champ
thinkings'exécutent désormais avec la pensée adaptative. Pour la désactiver, envoyezthinking: {type: "disabled"}. Étant donné quemax_tokenslimite la sortie totale (jetons de pensée plus texte de réponse), réexaminezmax_tokenspour les charges de travail qui s'exécutaient auparavant sans pensée. - **La pensée étendue manuelle est supprimée.** L'envoi de
thinking: {type: "enabled", budget_tokens: N}renvoie désormais une erreur 400. Utilisez plutôt la pensée adaptative et le paramètre d'effort. - **Les paramètres d'échantillonnage ne sont pas acceptés.** La définition de
temperature,top_poutop_kà une valeur non par défaut renvoie une erreur 400. Supprimez-les lors de la migration. Orientez plutôt le comportement via les instructions du prompt système.
Le pré-remplissage des messages d'assistant n'est toujours pas pris en charge et renvoie une erreur 400, comme sur Sonnet 4.6. Utilisez des sorties structurées ou des instructions de prompt système pour façonner la réponse.
Il y a un autre changement facile à manquer car il ne touche pas la forme de l'API. Sonnet 5 utilise un nouveau tokenizer. Le même texte d'entrée produit environ 30% de jetons de plus que sur Sonnet 4.6, soit environ 1,3 fois plus. Rien ne change dans votre requête, votre réponse ou votre code de streaming. Mais tout ce que vous mesurez ou budgétisez en jetons change :
- Les champs
usageet les résultats de comptage de jetons sont plus élevés pour le même texte. Recomptez avec Sonnet 5 au lieu de réutiliser vos chiffres de 4.6. - La fenêtre de 1M contient moins de texte en moyenne, car chaque jeton couvre désormais moins de texte.
- Les budgets
max_tokensdimensionnés près de votre sortie attendue peuvent maintenant être tronqués. Réexaminez-les. - Le coût par requête d'un texte équivalent peut augmenter même si le prix par jeton n'a pas changé.
La page des nouveautés documente chacun de ces points, et la documentation sur le comptage des jetons montre comment les mesurer.
Aperçu des benchmarks
Les chiffres ci-dessous sont les données rapportées par Anthropic lors du lancement. Ils sont corroborés par les articles du jour du lancement, donc traitez-les comme des résultats rapportés plutôt que des tests indépendants.
| Benchmark | Sonnet 5 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|---|
| SWE-bench Pro (codage agentique) | 63,2% | 69,2% | 58,1% |
| Terminal-Bench 2.1 | 80,4% | 82,7% | Non rapporté |
| OSWorld-Verified (utilisation d'ordinateur) | 81,2% | 83,4% | 78,5% |
La tendance est constante. Avec des outils en boucle, Sonnet 5 se situe à environ 1 à 3 points d'Opus 4.8. Sur le raisonnement pur sans support, Opus mène d'environ 6 points. Sonnet 5 est plus performant sur les tâches d'agentivité et d'outils que sur le raisonnement pur.

Par rapport à son prédécesseur, Sonnet 5 s'améliore nettement : SWE-bench Pro passe de 58,1% à 63,2%, et OSWorld-Verified grimpe de 78,5% à 81,2%.
L'analyse complète, y compris ce que ces benchmarks omettent, se trouve dans l'exploration approfondie des benchmarks de Sonnet 5. Vous pouvez également consulter le centre de transparence d'Anthropic pour les chiffres sous-jacents.
Tarification
Sonnet 5 conserve le même tarif par jeton que Sonnet 4.6, et a été lancé avec une réduction de lancement.
| Tarification | Entrée (par M jetons) | Sortie (par M jetons) |
|---|---|---|
| Introduction (jusqu'au 31 août 2026) | 2 $ | 10 $ |
| Standard (à partir du 1er septembre 2026) | 3 $ | 15 $ |
Le tarif de lancement de 2 $ par million d'entrées et 10 $ par million de sorties est valable jusqu'au 31 août 2026. Après cette date, il passera au tarif standard de 3 $ par million d'entrées et 15 $ par million de sorties, ce qui correspond à Sonnet 4.6.
Il y a un point à prendre en compte. Étant donné que le nouveau tokenizer produit environ 30% de jetons de plus pour le même texte, le coût d'une requête équivalente peut être plus élevé que sur Sonnet 4.6 même si le tarif par jeton est identique. Ne supposez pas une parité absolue. Modélisez vos charges de travail réelles avec un comptage de jetons avant de vous engager sur un budget.
Pour le contexte, Opus 4.8 coûte 5 $ par million d'entrées et 25 $ par million de sorties, et Fable 5 coûte 10 $ par million d'entrées et 50 $ par million de sorties. Sonnet 5 se situe bien en dessous des deux. Pour les tarifs de traitement par lots et de mise en cache de prompts, consultez la page de tarification d'Anthropic plutôt que tout chiffre cité de seconde main. La répartition complète des prix présente un exemple détaillé.
Disponibilité
Sonnet 5 est disponible sur les produits propres d'Anthropic et les principales plateformes cloud :
- **API Claude :** disponible pour tous les clients.
- **Applications Claude :** le modèle par défaut pour les versions Gratuite et Pro, et également disponible pour Max, Team et Enterprise.
- **Code Claude :** disponible.
- **AWS :** via Claude dans Amazon Bedrock et la plateforme Claude sur AWS. Pas sur le chemin hérité Bedrock InvokeModel ou Converse.
- **Google Cloud :** disponible sur Vertex AI.
- **Microsoft Foundry :** en préversion.
Puisque Sonnet 5 est le modèle par défaut du plan gratuit Claude, la plupart des gens peuvent l'essayer sans rien payer. Le guide d'accès gratuit couvre les voies gratuites honnêtes et leurs limites.
Résumé de la sécurité
La fiche système d'Anthropic rapporte un taux global plus faible de comportements indésirables que Sonnet 4.6, et le modèle est plus sûr dans les contextes d'agentivité. Il présente une hallucination et une sycophantie plus faibles que Sonnet 4.6, et il est meilleur pour refuser les requêtes malveillantes et résister à l'injection de prompts.

Sonnet 5 est également le premier modèle de la catégorie Sonnet doté de protections de cybersécurité en temps réel. Les requêtes concernant des sujets cyber interdits ou à haut risque peuvent être refusées. Un refus est renvoyé comme un HTTP 200 réussi avec stop_reason: "refusal", et non comme une erreur, alors gérez cette raison d'arrêt dans votre code.
Pour être juste sur les compromis : Sonnet 5 présente des taux de comportement mal alignés plus élevés qu'Opus 4.8 et Mythos Preview lors de l'audit comportemental automatisé d'Anthropic, et il a une capacité cyber inférieure à celle des modèles Opus. Aucun modèle Sonnet n'a pu développer un exploit fonctionnel, obtenant 0,0 % sur cette mesure.
Testez l'API Sonnet 5 avec Apidog
Lorsque vous appelez Sonnet 5, vous utilisez une API HTTP avec des en-têtes d'authentification, des corps de requête et de réponse JSON, des limites de débit et des erreurs. C'est exactement le genre de chose pour laquelle Apidog est conçu. Apidog est une plateforme tout-en-un de développement et de test d'API, vous permettant d'envoyer des requêtes Sonnet 5, de les enregistrer comme une collection réutilisable et de gérer vos clés par environnement.

Une configuration pratique ressemble à ceci :
- Créez une requête vers le point d'accès Anthropic Messages et stockez votre clé API en tant que variable d'environnement, et non dans le corps de la requête.
- Enregistrez la requête dans une collection afin que votre équipe puisse la réutiliser.
- Ajoutez une assertion pour vérifier la forme de la réponse, par exemple que
stop_reasonest présent afin qu'un résultat derefusalne passe pas inaperçu. - Simulez le point d'accès lorsque vous souhaitez développer avec une réponse stable sans dépenser de jetons.
Voici la forme de l'API Messages que vous enverriez :
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in one sentence."}
]
}'
Étant donné que la pensée adaptative est activée par défaut, cette requête s'exécute avec la pensée à moins que vous n'ajoutiez thinking: {type: "disabled"}. N'oubliez pas que max_tokens limite la pensée et le texte de réponse combinés, alors donnez-lui suffisamment d'espace. Une fois que votre requête fonctionne, enregistrez-la et ajoutez un test pour détecter les régressions lorsque vous changerez de modèle plus tard. Si vous voulez suivre, Téléchargez Apidog et importez la requête. Le guide complet de l'API présente le flux complet, y compris la version du SDK Python.
À qui s'adresse Sonnet 5
Sonnet 5 est un bon choix par défaut dans de nombreuses situations :
- **Vous créez des agents ou des workflows intensifs en outils.** C'est là que Sonnet 5 excelle et reste proche d'Opus 4.8.
- **Vous gérez un volume élevé et vous souciez des coûts.** L'écart de prix par rapport à Opus est important, et le tarif de lancement l'accentue jusqu'en août.
- **Vous souhaitez une mise à niveau directe depuis Sonnet 4.6.** Changez l'ID du modèle, examinez les trois changements de comportement et recomptez vos jetons.
- **Vous codez dans Claude Code ou un éditeur.** Sonnet 5 est un excellent modèle par défaut pour le codage agentique. Découvrez comment l'utiliser dans Claude Code.
Préférez Opus 4.8 lorsque vous avez besoin du raisonnement pur le plus difficile, d'une autonomie à long terme, ou de la qualité la plus élevée et que le coût supplémentaire en vaut la peine. La comparaison Sonnet 5 vs Opus 4.8 détaille cette décision. Pour des informations sur la catégorie Opus elle-même, consultez ce qu'est Claude Opus 4.8.
FAQ
**Claude Sonnet 5 est-il meilleur qu'Opus 4.8 ?** Cela dépend de la tâche. Sur les benchmarks d'agentivité et d'utilisation d'outils, Sonnet 5 se situe à environ 1 à 3 points d'Opus 4.8 à un prix bien inférieur. Sur le raisonnement pur, Opus 4.8 mène d'environ 6 points. Choisissez Sonnet 5 pour les agents et les volumes élevés, et Opus 4.8 pour le raisonnement le plus complexe. La comparaison directe en détaille les aspects.
**Quel est l'ID du modèle pour Claude Sonnet 5 ?** L'ID du modèle API est claude-sonnet-5, sans suffixe de date. Définissez cette chaîne comme valeur du champ model dans votre requête.
**Combien coûte Claude Sonnet 5 ?** Le tarif de lancement est de 2 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie jusqu'au 31 août 2026. Après cette date, il passera au tarif standard de 3 $ par million d'entrées et 15 $ par million de sorties. Notez que le nouveau tokenizer produit environ 30% de jetons de plus pour le même texte, donc une requête équivalente peut coûter plus cher même au même tarif par jeton.
**Puis-je utiliser Claude Sonnet 5 gratuitement ?** Oui. Sonnet 5 est le modèle par défaut du plan gratuit Claude sur claude.ai et dans le niveau gratuit de Claude Code, sous réserve de limites d'utilisation. Consultez le guide d'accès gratuit pour connaître les voies honnêtes et leurs plafonds.
**Dois-je modifier mon code pour passer de Sonnet 4.6 ?** Principalement, vous modifiez l'ID du modèle. Ensuite, examinez trois points : la pensée adaptative est désormais activée par défaut, alors révisez max_tokens, le champ de pensée étendue budget_tokens renvoie désormais une erreur 400, et les paramètres d'échantillonnage non par défaut renvoient également une erreur 400. Re-mesurez vos nombres de jetons en raison du nouveau tokenizer.
