Claude Sonnet 5 a été lancé le 30 juin 2026, et son prix fait la une. Vous obtenez des performances proches d'Opus 4.8 pour les tâches d'agentique et d'utilisation d'outils, à une fraction du coût. Ce guide vous donne les chiffres exacts : le tarif de lancement, le tarif standard, la date de leur changement, et un détail sur le tokenizer qui modifie discrètement votre facture réelle. Vous verrez également comment Sonnet 5 se compare à Opus 4.8 et Fable 5 afin de pouvoir choisir le bon modèle en fonction du coût, et non seulement de ses capacités. Lorsque vous commencez à appeler l'API, Apidog est l'endroit où vous envoyez ces requêtes, les enregistrez et suivez exactement ce que vous payez.
Voici ce que vous obtiendrez : le tarif par jeton, un exemple de coût détaillé, un tableau comparatif modèle par modèle, et une courte liste de contrôle pour estimer et surveiller vos dépenses avant qu'elles ne vous surprennent.

Tarification de Claude Sonnet 5 en un coup d'œil
Sonnet 5 utilise le même tarif par jeton que son prédécesseur, Sonnet 4.6. Rien n'a changé sur le prix affiché. Ce qui a changé, c'est la réduction de lancement qui court pendant les deux premiers mois.
| Tarif | Entrée (par 1M de jetons) | Sortie (par 1M de jetons) | En vigueur |
|---|---|---|---|
| Lancement | $2 | $10 | Jusqu'au 31 août 2026 |
| Standard | $3 | $15 | À partir du 1er septembre 2026 |
L'ID du modèle est claude-sonnet-5 sans suffixe de date. Cette chaîne de caractères unique est ce que vous envoyez dans la requête API, et elle est facturée à ces tarifs.
Deux points à retenir dès maintenant :
- Le tarif de lancement (2 $ en entrée / 10 $ en sortie) est en vigueur jusqu'au 31 août 2026. Après cette date, il passe au tarif standard de 3 $ / 15 $.
- Le tarif standard est identique à celui de Sonnet 4.6. Si vous utilisiez déjà Sonnet 4.6, votre prix par jeton n'augmente pas lors de la migration.
Ce dernier point ressemble à une victoire nette. C'en est une, en grande partie. Mais il y a un détail sur le tokenizer qui change le calcul, et il est facile de le manquer.
Le piège du tokenizer : même tarif, plus de jetons
Sonnet 5 est livré avec un nouveau tokenizer. Le même texte d'entrée produit environ 30 % de jetons en plus qu'avec Sonnet 4.6, soit environ 1,3 fois plus. Il ne s'agit pas d'un changement d'API. Les formats de requête, de réponse et de streaming sont identiques, et vous n'écrivez pas de nouveau code. Mais tout ce que vous mesurez ou budgétisez en jetons se trouve modifié.
Parce que vous payez par jeton, plus de jetons pour le même texte signifie un coût plus élevé pour une requête équivalente, même si le tarif par jeton n'a pas changé.
Voici un exemple concret. Supposons qu'une invite (prompt) représentait 10 000 jetons sur Sonnet 4.6.
- Sur Sonnet 4.6 à 3 $ par million d'entrées : 10 000 jetons coûtent environ 0,030 $.
- Sur Sonnet 5, le même texte représente environ 13 000 jetons. Au tarif de lancement de 2 $ par million d'entrées : environ 0,026 $.
- Sur Sonnet 5 au tarif standard de 3 $ par million d'entrées (après le 31 août) : environ 0,039 $.
Ainsi, pendant la période de lancement, la réduction annule approximativement les jetons supplémentaires, et vous pourriez payer à peu près le même prix ou légèrement moins. Une fois le tarif standard appliqué, le même texte, à 1,3 fois le nombre de jetons, coûte plus cher qu'il ne le faisait sur Sonnet 4.6 au même tarif par jeton. Le tarif est fixe. La facture ne l'est pas.
Cela affecte plus que le coût :
- Les champs
usageet les résultats du comptage de jetons sont plus élevés pour le même texte. Refaites le comptage avec Sonnet 5. Ne réutilisez pas vos anciens comptages de Sonnet 4.6. - La fenêtre contextuelle de 1M de jetons contient moins de texte en moyenne, car chaque jeton couvre désormais moins de texte.
- Les budgets
max_tokensque vous avez définis près de votre sortie attendue peuvent tronquer. Revoyez-les.
La conclusion est simple : modélisez vos charges de travail réelles avec le comptage de jetons sur Sonnet 5 avant de supposer une parité parfaite. La documentation de comptage de jetons d'Anthropic montre comment mesurer une invite par rapport au tokenizer actuel. Pour une présentation complète d'un premier appel API et de l'endroit où lire le bloc usage, consultez notre guide de l'API Claude Sonnet 5.
Comment Sonnet 5 se compare à Opus 4.8 et Fable 5
Sonnet 5 est tarifé pour être le modèle de travail à grand volume. Son avantage est le plus évident lorsque vous le comparez aux modèles supérieurs. Les trois partagent une fenêtre contextuelle de 1M de jetons et une sortie maximale de 128K, donc la différence réside ici dans le prix et l'endroit où chaque modèle tire son épingle du jeu.
| Modèle | ID du modèle | Entrée (par 1M) | Sortie (par 1M) |
|---|---|---|---|
| Sonnet 5 (lancement) | claude-sonnet-5 |
$2 | $10 |
| Sonnet 5 (standard) | claude-sonnet-5 |
$3 | $15 |
| Sonnet 4.6 | claude-sonnet-4-6 |
$3 | $15 |
| Opus 4.8 | claude-opus-4-8 |
$5 | $25 |
| Fable 5 | claude-fable-5 |
$10 | $50 |
Lisez ce tableau en gardant à l'esprit les benchmarks. Sur les tâches d'agentique et d'utilisation d'outils, les chiffres de lancement d'Anthropic placent Sonnet 5 à environ 1 à 3 points d'Opus 4.8. Les chiffres rapportés incluent SWE-bench Pro à 63,2 % pour Sonnet 5 contre 69,2 % pour Opus 4.8, Terminal-Bench 2.1 à 80,4 % contre 82,7 %, et OSWorld-Verified à 81,2 % contre 83,4 %. Opus prend l'avantage d'environ 6 points sur le raisonnement pur sans support.
La décision concernant le coût se résume donc à ceci :
- Au tarif standard, Sonnet 5 est 40 % moins cher en entrée et 40 % moins cher en sortie qu'Opus 4.8, pour des performances proches d'Opus sur les tâches nécessitant beaucoup d'outils.
- Fable 5 est à 10 $ / 50 $, soit plus du triple du tarif d'entrée standard de Sonnet 5. Vous l'utiliserez lorsque vous aurez besoin du modèle le plus performant d'Anthropic largement disponible, et non pour des boucles d'agents à fort volume.
- Par rapport à Sonnet 4.6, vous payez le même prix par jeton pour de meilleures performances de codage et d'agentique, avec la mise en garde concernant le tokenizer mentionnée ci-dessus.
Si vous évaluez les capacités par rapport au prix pour un travail spécifique, notre comparaison Sonnet 5 vs Opus 4.8 examine la décision tâche par tâche. Pour le côté Fable 5 de l'échelle, consultez le guide de tarification de Fable 5.
Testez et suivez les requêtes que vous payez avec Apidog
Chaque dollar de votre facture Sonnet 5 correspond à une requête HTTP : une requête POST vers l'API Messages avec un corps JSON, une clé API, et une réponse que vous payez par jeton. Si vous devinez ces requêtes, vous devinez votre coût.

Apidog vous offre un espace pour rendre ces requêtes réelles et reproductibles :
- Envoyez une requête Sonnet 5 et voyez la réponse exacte, y compris le bloc
usagequi vous indique le nombre de jetons d'entrée et de sortie par appel. C'est votre coût, par requête, avant de la mettre à l'échelle. - Enregistrez la requête dans une collection afin que votre équipe exécute le même appel, et non des appels légèrement différents qui seraient facturés différemment.
- Stockez votre clé API comme variable d'environnement et basculez entre les clés de test et de production sans modifier la requête.
- Ajoutez des assertions automatisées pour qu'un changement d'invite qui double la longueur de la sortie soit détecté en CI, et non sur la facture.
- Simulez le point de terminaison pour pouvoir construire et tester votre intégration sans dépenser de jetons réels à chaque exécution de développement.
Voici une première requête au format de l'API Anthropic Messages. Envoyez-la dans Apidog, lisez les champs usage dans la réponse, et vous obtiendrez un vrai coût par appel à multiplier.
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in two sentences."}
]
}'
La réponse inclut un objet usage avec input_tokens et output_tokens. Multipliez-les par les tarifs du tableau ci-dessus et vous obtiendrez le coût de cet appel exact. Faites cela pour vos invites réelles et votre estimation cessera d'être une supposition.
Téléchargez Apidog pour envoyer des requêtes Sonnet 5, inspecter l'utilisation des jetons et organiser les appels que vous facturez dans un seul espace de travail.
Questions fréquentes
Combien coûte l'API Claude Sonnet 5 ?
Pendant la période de lancement, jusqu'au 31 août 2026, elle coûte 2 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie. À partir du 1er septembre 2026, elle passe au tarif standard de 3 $ par million d'entrée et 15 $ par million de sortie.
Sonnet 5 est-il moins cher que Sonnet 4.6 ?
Le tarif par jeton est le même que Sonnet 4.6 au niveau standard (3 $ / 15 $), et inférieur pendant la période de lancement. Mais le nouveau tokenizer de Sonnet 5 produit environ 30 % de jetons en plus pour le même texte, de sorte que le coût d'une requête équivalente peut être plus élevé au tarif standard. Comptez les jetons sur Sonnet 5 pour voir votre chiffre réel. Notre comparaison Sonnet 5 vs Sonnet 4.6 couvre les détails de la migration.
Pourquoi la même invite coûte-t-elle plus cher sur Sonnet 5 que sur Sonnet 4.6 ?
Le tarif par jeton n'a pas changé, mais le nouveau tokenizer divise le même texte en environ 1,3 fois plus de jetons. Plus de jetons au même tarif signifie un coût plus élevé pour un texte équivalent, surtout après la fin de la réduction de lancement.
Comment la tarification de Sonnet 5 se compare-t-elle à celle d'Opus 4.8 ?
Opus 4.8 coûte 5 $ par million d'entrées et 25 $ par million de sorties, contre 3 $ / 15 $ pour le tarif standard de Sonnet 5. Sonnet 5 se situe à environ 1 à 3 points d'Opus 4.8 sur les benchmarks d'agentique rapportés par Anthropic, vous obtenez donc des performances proches sur les tâches nécessitant beaucoup d'outils à un prix inférieur.
Existe-t-il des moyens moins chers d'utiliser Sonnet 5 ?
Oui. Le traitement par lots et la mise en cache des invites réduisent le tarif effectif pour les charges de travail appropriées. Les tarifs réduits exacts se trouvent sur la page de tarification d'Anthropic. Dimensionner correctement max_tokens et garder les invites concises réduit également le coût de sortie, qui est 5 fois supérieur au tarif d'entrée.
