Qu'est-ce que Claude Sonnet 5 ? Fonctionnalités, Benchmarks et Prix

Claude Sonnet 5 expliqué : le lancement en juin 2026, un contexte d'1M, la pensée adaptative, les benchmarks de lancement par rapport à Opus 4.8, le prix de lancement, la disponibilité et à qui il s'adresse.

Ashley Innocent

Ashley Innocent

1 July 2026

Qu'est-ce que Claude Sonnet 5 ? Fonctionnalités, Benchmarks et Prix

Apidog pour les entreprises

Déploiement sur site

SSO & RBAC

Conforme SOC 2

Découvrir Apidog Enterprise

Claude Sonnet 5 est le tout nouveau modèle de milieu de gamme d'Anthropic, lancé le 30 juin 2026. Anthropic le qualifie de "meilleure combinaison de vitesse et d'intelligence" et de "modèle Sonnet le plus autonome à ce jour". En bref : il se rapproche d'Opus 4.8 sur les tâches d'agentivité et d'utilisation d'outils tout en coûtant beaucoup moins cher. Ce guide couvre ce qu'est Sonnet 5, ses spécifications complètes, les benchmarks de lancement, la tarification, la disponibilité, et qui devrait l'utiliser. Si vous prévoyez d'appeler le modèle via HTTP, vous pouvez tester ces requêtes dans Apidog au fur et à mesure.

bouton

Chaque section ici renvoie à une exploration approfondie ciblée, alors traitez cette page comme une carte et suivez les liens lorsque vous avez besoin de détails sur l'API, la tarification, ou une comparaison directe avec Opus 4.8.

Qu'est-ce que Claude Sonnet 5

Claude Sonnet 5 est le successeur de Claude Sonnet 4.6. Son ID de modèle API est la chaîne exacte claude-sonnet-5, sans suffixe de date. Il se situe dans la catégorie Sonnet, qu'Anthropic positionne entre les modèles Haiku plus petits et les modèles Opus et Fable plus grands.

Le point essentiel est la valeur. Sur les tâches où le modèle utilise des outils, s'exécute en boucle ou agit comme un agent, Sonnet 5 se situe à quelques points d'Opus 4.8. Sur le raisonnement pur sans support, Opus reste en tête. Sonnet 5 est donc le modèle vers lequel vous vous tournez lorsque vous souhaitez une forte performance d'agentivité sans payer les prix d'Opus.

C'est aussi une mise à niveau directe pour Sonnet 4.6. Vous changez l'ID du modèle, puis examinez trois changements de comportement et un changement de tokenizer. Nous les abordons ci-dessous et dans la comparaison dédiée Sonnet 5 vs Sonnet 4.6.

Spécifications complètes

Voici ce que vous obtenez avec claude-sonnet-5 :

Spécification Valeur
Fenêtre de contexte 1 000 000 jetons (1M)
Sortie maximale 128 000 jetons (128K)
Pensée adaptative Activée par défaut
Paramètre d'effort faible / moyen / élevé / très élevé
Vision, mise en cache de prompts, utilisation d'outils, traitement par lots, sorties structurées Pris en charge
Niveau de priorité Non disponible
Rétention zéro des données (ZDR) Pris en charge pour les organisations ayant un accord ZDR

Quelques remarques à ce sujet :

Pour la forme complète des requêtes et réponses, consultez le guide API étape par étape et l'aperçu des modèles d'Anthropic.

Les trois changements de comportement et le nouveau tokenizer

Si vous passez de Sonnet 4.6, trois choses ont changé au niveau de l'API. Si vous les ignorez, vos requêtes peuvent renvoyer une erreur 400 ou se comporter différemment d'auparavant.

  1. **La pensée adaptative est activée par défaut.** Les requêtes sans champ thinking s'exécutent désormais avec la pensée adaptative. Pour la désactiver, envoyez thinking: {type: "disabled"}. Étant donné que max_tokens limite la sortie totale (jetons de pensée plus texte de réponse), réexaminez max_tokens pour les charges de travail qui s'exécutaient auparavant sans pensée.
  2. **La pensée étendue manuelle est supprimée.** L'envoi de thinking: {type: "enabled", budget_tokens: N} renvoie désormais une erreur 400. Utilisez plutôt la pensée adaptative et le paramètre d'effort.
  3. **Les paramètres d'échantillonnage ne sont pas acceptés.** La définition de temperature, top_p ou top_k à une valeur non par défaut renvoie une erreur 400. Supprimez-les lors de la migration. Orientez plutôt le comportement via les instructions du prompt système.

Le pré-remplissage des messages d'assistant n'est toujours pas pris en charge et renvoie une erreur 400, comme sur Sonnet 4.6. Utilisez des sorties structurées ou des instructions de prompt système pour façonner la réponse.

Il y a un autre changement facile à manquer car il ne touche pas la forme de l'API. Sonnet 5 utilise un nouveau tokenizer. Le même texte d'entrée produit environ 30% de jetons de plus que sur Sonnet 4.6, soit environ 1,3 fois plus. Rien ne change dans votre requête, votre réponse ou votre code de streaming. Mais tout ce que vous mesurez ou budgétisez en jetons change :

La page des nouveautés documente chacun de ces points, et la documentation sur le comptage des jetons montre comment les mesurer.

Aperçu des benchmarks

Les chiffres ci-dessous sont les données rapportées par Anthropic lors du lancement. Ils sont corroborés par les articles du jour du lancement, donc traitez-les comme des résultats rapportés plutôt que des tests indépendants.

Benchmark Sonnet 5 Opus 4.8 Sonnet 4.6
SWE-bench Pro (codage agentique) 63,2% 69,2% 58,1%
Terminal-Bench 2.1 80,4% 82,7% Non rapporté
OSWorld-Verified (utilisation d'ordinateur) 81,2% 83,4% 78,5%

La tendance est constante. Avec des outils en boucle, Sonnet 5 se situe à environ 1 à 3 points d'Opus 4.8. Sur le raisonnement pur sans support, Opus mène d'environ 6 points. Sonnet 5 est plus performant sur les tâches d'agentivité et d'outils que sur le raisonnement pur.

Par rapport à son prédécesseur, Sonnet 5 s'améliore nettement : SWE-bench Pro passe de 58,1% à 63,2%, et OSWorld-Verified grimpe de 78,5% à 81,2%.

L'analyse complète, y compris ce que ces benchmarks omettent, se trouve dans l'exploration approfondie des benchmarks de Sonnet 5. Vous pouvez également consulter le centre de transparence d'Anthropic pour les chiffres sous-jacents.

Tarification

Sonnet 5 conserve le même tarif par jeton que Sonnet 4.6, et a été lancé avec une réduction de lancement.

Tarification Entrée (par M jetons) Sortie (par M jetons)
Introduction (jusqu'au 31 août 2026) 2 $ 10 $
Standard (à partir du 1er septembre 2026) 3 $ 15 $

Le tarif de lancement de 2 $ par million d'entrées et 10 $ par million de sorties est valable jusqu'au 31 août 2026. Après cette date, il passera au tarif standard de 3 $ par million d'entrées et 15 $ par million de sorties, ce qui correspond à Sonnet 4.6.

Il y a un point à prendre en compte. Étant donné que le nouveau tokenizer produit environ 30% de jetons de plus pour le même texte, le coût d'une requête équivalente peut être plus élevé que sur Sonnet 4.6 même si le tarif par jeton est identique. Ne supposez pas une parité absolue. Modélisez vos charges de travail réelles avec un comptage de jetons avant de vous engager sur un budget.

Pour le contexte, Opus 4.8 coûte 5 $ par million d'entrées et 25 $ par million de sorties, et Fable 5 coûte 10 $ par million d'entrées et 50 $ par million de sorties. Sonnet 5 se situe bien en dessous des deux. Pour les tarifs de traitement par lots et de mise en cache de prompts, consultez la page de tarification d'Anthropic plutôt que tout chiffre cité de seconde main. La répartition complète des prix présente un exemple détaillé.

Disponibilité

Sonnet 5 est disponible sur les produits propres d'Anthropic et les principales plateformes cloud :

Puisque Sonnet 5 est le modèle par défaut du plan gratuit Claude, la plupart des gens peuvent l'essayer sans rien payer. Le guide d'accès gratuit couvre les voies gratuites honnêtes et leurs limites.

Résumé de la sécurité

La fiche système d'Anthropic rapporte un taux global plus faible de comportements indésirables que Sonnet 4.6, et le modèle est plus sûr dans les contextes d'agentivité. Il présente une hallucination et une sycophantie plus faibles que Sonnet 4.6, et il est meilleur pour refuser les requêtes malveillantes et résister à l'injection de prompts.

Sonnet 5 est également le premier modèle de la catégorie Sonnet doté de protections de cybersécurité en temps réel. Les requêtes concernant des sujets cyber interdits ou à haut risque peuvent être refusées. Un refus est renvoyé comme un HTTP 200 réussi avec stop_reason: "refusal", et non comme une erreur, alors gérez cette raison d'arrêt dans votre code.

Pour être juste sur les compromis : Sonnet 5 présente des taux de comportement mal alignés plus élevés qu'Opus 4.8 et Mythos Preview lors de l'audit comportemental automatisé d'Anthropic, et il a une capacité cyber inférieure à celle des modèles Opus. Aucun modèle Sonnet n'a pu développer un exploit fonctionnel, obtenant 0,0 % sur cette mesure.

Testez l'API Sonnet 5 avec Apidog

Lorsque vous appelez Sonnet 5, vous utilisez une API HTTP avec des en-têtes d'authentification, des corps de requête et de réponse JSON, des limites de débit et des erreurs. C'est exactement le genre de chose pour laquelle Apidog est conçu. Apidog est une plateforme tout-en-un de développement et de test d'API, vous permettant d'envoyer des requêtes Sonnet 5, de les enregistrer comme une collection réutilisable et de gérer vos clés par environnement.

Une configuration pratique ressemble à ceci :

  1. Créez une requête vers le point d'accès Anthropic Messages et stockez votre clé API en tant que variable d'environnement, et non dans le corps de la requête.
  2. Enregistrez la requête dans une collection afin que votre équipe puisse la réutiliser.
  3. Ajoutez une assertion pour vérifier la forme de la réponse, par exemple que stop_reason est présent afin qu'un résultat de refusal ne passe pas inaperçu.
  4. Simulez le point d'accès lorsque vous souhaitez développer avec une réponse stable sans dépenser de jetons.

Voici la forme de l'API Messages que vous enverriez :

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in one sentence."}
    ]
  }'

Étant donné que la pensée adaptative est activée par défaut, cette requête s'exécute avec la pensée à moins que vous n'ajoutiez thinking: {type: "disabled"}. N'oubliez pas que max_tokens limite la pensée et le texte de réponse combinés, alors donnez-lui suffisamment d'espace. Une fois que votre requête fonctionne, enregistrez-la et ajoutez un test pour détecter les régressions lorsque vous changerez de modèle plus tard. Si vous voulez suivre, Téléchargez Apidog et importez la requête. Le guide complet de l'API présente le flux complet, y compris la version du SDK Python.

À qui s'adresse Sonnet 5

Sonnet 5 est un bon choix par défaut dans de nombreuses situations :

Préférez Opus 4.8 lorsque vous avez besoin du raisonnement pur le plus difficile, d'une autonomie à long terme, ou de la qualité la plus élevée et que le coût supplémentaire en vaut la peine. La comparaison Sonnet 5 vs Opus 4.8 détaille cette décision. Pour des informations sur la catégorie Opus elle-même, consultez ce qu'est Claude Opus 4.8.

FAQ

**Claude Sonnet 5 est-il meilleur qu'Opus 4.8 ?** Cela dépend de la tâche. Sur les benchmarks d'agentivité et d'utilisation d'outils, Sonnet 5 se situe à environ 1 à 3 points d'Opus 4.8 à un prix bien inférieur. Sur le raisonnement pur, Opus 4.8 mène d'environ 6 points. Choisissez Sonnet 5 pour les agents et les volumes élevés, et Opus 4.8 pour le raisonnement le plus complexe. La comparaison directe en détaille les aspects.

**Quel est l'ID du modèle pour Claude Sonnet 5 ?** L'ID du modèle API est claude-sonnet-5, sans suffixe de date. Définissez cette chaîne comme valeur du champ model dans votre requête.

**Combien coûte Claude Sonnet 5 ?** Le tarif de lancement est de 2 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie jusqu'au 31 août 2026. Après cette date, il passera au tarif standard de 3 $ par million d'entrées et 15 $ par million de sorties. Notez que le nouveau tokenizer produit environ 30% de jetons de plus pour le même texte, donc une requête équivalente peut coûter plus cher même au même tarif par jeton.

**Puis-je utiliser Claude Sonnet 5 gratuitement ?** Oui. Sonnet 5 est le modèle par défaut du plan gratuit Claude sur claude.ai et dans le niveau gratuit de Claude Code, sous réserve de limites d'utilisation. Consultez le guide d'accès gratuit pour connaître les voies honnêtes et leurs plafonds.

**Dois-je modifier mon code pour passer de Sonnet 4.6 ?** Principalement, vous modifiez l'ID du modèle. Ensuite, examinez trois points : la pensée adaptative est désormais activée par défaut, alors révisez max_tokens, le champ de pensée étendue budget_tokens renvoie désormais une erreur 400, et les paramètres d'échantillonnage non par défaut renvoient également une erreur 400. Re-mesurez vos nombres de jetons en raison du nouveau tokenizer.

bouton

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API