En bref
Claude Opus 4.7 est le modèle le plus performant d'Anthropic, disponible au grand public, lancé le 16 avril 2026. Il introduit une vision haute résolution (jusqu'à 3,75 mégapixels), un nouveau niveau d'effort xhigh, des budgets de tâches pour les boucles agentiques, et un nouveau tokenizer. Il conserve la fenêtre contextuelle d'un million de tokens et les tarifs de 5 $/25 $ par million de tokens d'Opus 4.6, mais apporte plusieurs modifications importantes à l'API, notamment la suppression des budgets de réflexion étendus et des paramètres d'échantillonnage.
Introduction
Anthropic a lancé Claude Opus 4.7 le 16 avril 2026. Il remplace Opus 4.6 en tant que modèle de premier niveau dans la gamme Claude et cible les développeurs créant des agents autonomes, des assistants de travail intellectuel et des applications à forte composante visuelle.
Cette version est importante pour trois raisons. Premièrement, c'est le premier modèle Claude avec prise en charge d'images haute résolution, multipliant par plus de trois le budget de pixels de 1,15 MP à 3,75 MP. Deuxièmement, il introduit des budgets de tâches, un moyen de donner au modèle une allocation de tokens pour une boucle agentique entière plutôt que pour un seul tour. Troisièmement, il apporte des changements majeurs qui nécessitent des mises à jour de code si vous migrez depuis Opus 4.6.
Spécifications Principales
| Spécification | Valeur |
|---|---|
| ID du modèle API | claude-opus-4-7 |
| Fenêtre contextuelle | 1 000 000 tokens |
| Tokens de sortie max. | 128 000 tokens |
| Tarification en entrée | 5 $ par million de tokens |
| Tarification en sortie | 25 $ par million de tokens |
| Tarification en entrée par lot | 2,50 $ par million de tokens |
| Tarification en sortie par lot | 12,50 $ par million de tokens |
| Tarification de lecture du cache | 0,50 $ par million de tokens |
| Écriture cache 5 min | 6,25 $ par million de tokens |
| Écriture cache 1 heure | 10 $ par million de tokens |
| Date de sortie | 16 avril 2026 |
| Disponibilité | API Claude, Amazon Bedrock, Google Vertex AI, Microsoft Foundry |
Opus 4.7 utilise un nouveau tokenizer qui peut produire jusqu'à 35 % de tokens en plus pour le même texte par rapport à Opus 4.6. Le prix par token reste inchangé, mais votre coût effectif par requête peut augmenter en fonction du contenu.

Nouveautés de Claude Opus 4.7
Prise en charge des images haute résolution
C'est l'ajout majeur. Les modèles Claude précédents limitaient l'entrée d'images à 1 568 pixels sur le bord long (environ 1,15 mégapixels). Opus 4.7 porte cette limite à 2 576 pixels sur le bord long (environ 3,75 mégapixels).
L'impact pratique : les captures d'écran, les maquettes de conception, les documents et les photographies sont traités avec une fidélité bien supérieure. Le mappage des coordonnées est désormais de 1:1 avec les pixels réels, éliminant les calculs de facteur d'échelle que les flux de travail informatiques exigeaient auparavant.
Opus 4.7 améliore également des sous-tâches de vision spécifiques :
- Perception de bas niveau : les tâches de pointage, de mesure et de comptage sont plus précises
- Localisation d'images : la détection de boîtes englobantes et la localisation d'images naturelles montrent des gains clairs
Une résolution plus élevée signifie plus de tokens par image. Si votre cas d'utilisation n'a pas besoin de cette fidélité supplémentaire, réduisez la taille des images avant de les envoyer pour économiser des coûts.
Nouveau niveau d'effort xhigh
Le paramètre d'effort contrôle la quantité de raisonnement que Claude investit dans une réponse. Opus 4.7 ajoute xhigh au-dessus des niveaux existants high (élevé), medium (moyen) et low (faible).
Utilisez xhigh pour les tâches de codage et agentiques où la qualité prime sur la latence. À ce niveau, le modèle dépense beaucoup plus de tokens en raisonnement interne, ce qui se traduit par de meilleurs résultats pour les problèmes complexes. Utilisez high comme minimum pour les travaux sensibles à l'intelligence. Les niveaux inférieurs échangent la précision contre la vitesse et des économies de coûts.
Budgets de tâches (Bêta)
Les budgets de tâches résolvent un problème rencontré par tous ceux qui développent des agents : comment empêcher une boucle agentique multi-tour de consommer un nombre illimité de tokens ?
Avec les budgets de tâches, vous donnez à Claude un objectif approximatif de tokens pour l'ensemble de la boucle, y compris la réflexion, les appels d'outils, les résultats d'outils et la sortie finale. Le modèle voit un compte à rebours en cours et l'utilise pour prioriser le travail, ignorer les étapes de faible valeur et terminer en douceur lorsque le budget est épuisé.
Détails clés :
- Le budget de tâche minimum est de 20 000 tokens
- C'est un conseil, pas une limite stricte. Claude essaie de s'y tenir mais peut le dépasser
- C'est différent de
max_tokens, qui est une limite stricte par requête que le modèle ne voit pas - Nécessite l'en-tête bêta
task-budgets-2026-03-13
Pour les tâches agentiques ouvertes où la qualité est primordiale, ignorez le budget de tâches et laissez le modèle s'exécuter. Réservez les budgets de tâches pour les charges de travail où vous devez contrôler les dépenses totales.
La réflexion adaptative comme seul mode de réflexion
La réflexion étendue (où vous définissez un budget_tokens fixe) est supprimée. Tenter de définir thinking: {"type": "enabled", "budget_tokens": N} renvoie une erreur 400.
La réflexion adaptative est le seul mode de réflexion activé. Dans les évaluations internes d'Anthropic, elle a constamment surpassé l'approche à budget fixe car le modèle alloue les tokens de raisonnement dynamiquement en fonction de la difficulté de la tâche.
Important : la réflexion adaptative est désactivée par défaut. Vous devez explicitement définir thinking: {"type": "adaptive"} pour l'activer.
Par défaut, le contenu de la réflexion est également omis des réponses. Si vous avez besoin de voir le raisonnement du modèle (par exemple, pour diffuser la progression aux utilisateurs), définissez display: "summarized" dans la configuration de la réflexion.
Mémoire Améliorée
Opus 4.7 est plus performant pour l'écriture et la lecture depuis une mémoire basée sur le système de fichiers. Si votre agent conserve un bloc-notes, un fichier de notes ou un stockage de mémoire structurée d'un tour à l'autre, il fera un meilleur travail de mise à jour et de référencement de ces notes.
Cela est important pour les agents de codage de longue durée, les assistants de recherche et tout flux de travail où le contexte est conservé entre les sessions.
Améliorations du travail intellectuel
Gains spécifiques sur les tâches de connaissances réelles :
- Révision de documents : meilleure production et auto-vérification des modifications suivies dans les fichiers .docx
- Édition de diapositives : précision améliorée lors de la génération et de la validation des mises en page .pptx
- Analyse de graphiques : meilleure utilisation des bibliothèques de traitement d'images (comme PIL) pour analyser les graphiques au niveau des pixels et transcrire les données des figures

Ce qui a changé par rapport à Opus 4.6
Changements API Rédhibitoires
Ces changements s'appliquent à l'API Messages. Si vous utilisez les agents gérés de Claude, il n'y a pas de changements rédhibitoires.
| Changement | Avant (Opus 4.6) | Après (Opus 4.7) |
|---|---|---|
| Réflexion étendue | thinking: {"type": "enabled", "budget_tokens": 32000} |
Doit utiliser thinking: {"type": "adaptive"} |
| Paramètres d'échantillonnage | temperature, top_p, top_k acceptés |
Les valeurs non par défaut renvoient une erreur 400 |
| Affichage de la réflexion | Contenu de la réflexion inclus par défaut | Omis par défaut ; activer avec display: "summarized" |
| Tokenizer | Tokenizer standard | Nouveau tokenizer (jusqu'à 35% de tokens en plus pour le même texte) |
Changements de comportement
Ceux-ci ne sont pas rédhibitoires pour l'API mais peuvent affecter vos prompts :
- Suivi des instructions plus littéral. Le modèle ne généralisera pas silencieusement les instructions d'un élément à l'autre
- La longueur de la réponse s'adapte à la complexité de la tâche au lieu d'une verbosité fixe par défaut
- Moins d'appels d'outils par défaut, préférant le raisonnement à l'action. Augmentez l'effort pour augmenter l'utilisation des outils
- Ton plus direct et affirmé avec moins d'émojis et moins de formulations orientées validation
- Moins de sous-agents générés par défaut dans les flux de travail agentiques
Si vous avez mis en place des échafaudages de prompts pour forcer Claude à adopter des comportements spécifiques (comme « revérifier la mise en page des diapositives » ou « donner des mises à jour de statut »), essayez de les supprimer. Opus 4.7 gère beaucoup de ces modèles nativement.
Répartition des prix
Opus 4.7 maintient la même tarification par token qu'Opus 4.6 et 4.5 :
| Type d'utilisation | Coût |
|---|---|
| Entrée standard | 5 $ / M de tokens |
| Sortie standard | 25 $ / M de tokens |
| Entrée par lot | 2,50 $ / M de tokens |
| Sortie par lot | 12,50 $ / M de tokens |
| Lecture du cache | 0,50 $ / M de tokens |
| Écriture cache 5 min | 6,25 $ / M de tokens |
| Écriture cache 1 heure | 10 $ / M de tokens |
| Entrée mode rapide (Opus 4.6 uniquement) | 30 $ / M de tokens |
| Résidence des données aux États-Unis | Multiplicateur 1,1x |
Le nouveau tokenizer est la principale considération de coût. Parce qu'il peut produire jusqu'à 35 % de tokens en plus pour le même texte d'entrée, votre coût effectif par requête pourrait augmenter même si le prix par token n'a pas changé. Testez avec le point de terminaison /v1/messages/count_tokens pour mesurer l'impact sur vos prompts spécifiques.
La fenêtre contextuelle de 1 million de tokens n'a pas de prime de contexte long. Une requête de 900 000 tokens coûte le même tarif par token qu'une requête de 9 000 tokens.
Où utiliser Opus 4.7
Cas d'utilisation pertinents
- Agents de codage autonomes : le niveau d'effort
xhigh+ les budgets de tâches vous donnent un contrôle précis sur le comportement et le coût de l'agent - Utilisation informatique : le mappage des coordonnées 1:1 des pixels et la vision de 3,75 MP rendent l'interaction avec l'écran significativement plus fiable
- Traitement de documents : analyse améliorée des fichiers .docx, .pptx et des graphiques pour l'automatisation du travail intellectuel
- Récupération de contexte long : fenêtre de 1M de tokens à un prix standard pour les grandes bases de code, les documents juridiques ou les articles de recherche
- Agents multi-sessions : meilleure mémoire basée sur des fichiers pour les flux de travail qui s'étendent sur plusieurs conversations
Quand Opus 4.7 peut être excessif
- Tâches simples de questions-réponses ou de classification : Haiku 4.5 (1 $/5 $ par M de tokens) ou Sonnet 4.6 (3 $/15 $ par M de tokens) offrent d'excellents résultats pour une fraction du coût
- Flux de chatbot à faible latence : la surcharge de la réflexion adaptative et des niveaux d'effort élevés ajoute de la latence
- Analyse par lots sur données structurées : l'API Batch avec Sonnet est généralement plus rentable
Comment tester votre intégration Claude Opus 4.7 avec Apidog
Changer votre ID de modèle de claude-opus-4-6 à claude-opus-4-7 est la partie facile. La partie plus difficile est de valider que vos prompts existants, définitions d'outils et gestion des erreurs fonctionnent toujours correctement après les changements rédhibitoires.

Apidog rend cela simple :
Importez votre schéma API. Insérez votre spécification OpenAPI ou définissez manuellement vos points de terminaison de l'API Claude. Apidog génère automatiquement des modèles de requête pour l'API Messages.
Créez des scénarios de test. Configurez des conversations à plusieurs tours qui testent vos modèles spécifiques d'utilisation d'outils. Apidog vous permet d'enchaîner des requêtes, de passer le contexte entre les tours et de valider les schémas de réponse.
Comparez les versions du modèle. Exécutez les mêmes scénarios de test avec claude-opus-4-6 et claude-opus-4-7 côte à côte. Vérifiez les différences dans le nombre de tokens, la structure de la réponse et la qualité de la sortie.
Validez les changements rédhibitoires. Confirmez que votre configuration thinking mise à jour fonctionne, que les paramètres d'échantillonnage supprimés ne réapparaissent pas furtivement, et que le nouveau tokenizer ne dépasse pas vos limites max_tokens.
Déboguez les charges utiles d'utilisation d'outils. Inspectez les corps complets des requêtes et des réponses pour les conversations d'utilisation d'outils à plusieurs tours. L'interface visuelle d'Apidog facilite l'identification des résultats d'outils mal formés ou des références tool_use_id manquantes.
Liste de contrôle de migration
Si vous effectuez une mise à niveau depuis Opus 4.6 :
- [ ] Mettez à jour votre ID de modèle vers
claude-opus-4-7 - [ ] Remplacez
thinking: {"type": "enabled", "budget_tokens": N}parthinking: {"type": "adaptive"} - [ ] Supprimez les paramètres
temperature,top_pettop_k(ou définissez-les par défaut) - [ ] Si vous diffusez la réflexion aux utilisateurs, ajoutez
display: "summarized"à votre configuration de réflexion - [ ] Augmentez la marge de
max_tokenspour tenir compte du nouveau tokenizer (jusqu'à 35 % de tokens en plus) - [ ] Testez la mise en cache des prompts — le nombre de tokens sera différent
- [ ] Supprimez les échafaudages de prompts pour les comportements gérés nativement par Opus 4.7 (mises à jour de statut, auto-vérification)
- [ ] Exécutez votre suite de tests avec Apidog pour valider le comportement de bout en bout
Conclusion
Claude Opus 4.7 est le modèle le plus puissant d'Anthropic, disponible au grand public. La vision haute résolution, les budgets de tâches et le niveau d'effort xhigh le poussent davantage vers le territoire des agents autonomes. Les changements rédhibitoires (plus de budgets de réflexion étendus, pas de paramètres d'échantillonnage) nécessitent des mises à jour de code, mais le chemin de migration est clair.
Le nouveau tokenizer est la principale considération de coût. Les prix par token sont fixes, mais le même prompt peut coûter plus cher en raison d'un nombre plus élevé de tokens. Testez vos charges de travail avant de basculer le trafic de production.
Pour les développeurs créant des intégrations API, Apidog fournit l'environnement de test et de débogage dont vous avez besoin pour valider votre migration et comparer les performances des modèles entre les versions.
