En resumen
Claude Opus 4.7 es el modelo más capaz de Anthropic disponible de forma general, lanzado el 16 de abril de 2026. Introduce visión de alta resolución (hasta 3.75 megapíxeles), un nuevo nivel de esfuerzo xhigh, presupuestos de tareas para bucles de agentes y un nuevo tokenizador. Mantiene la ventana de contexto de 1M de tokens y el precio de $5/$25 por millón de tokens de Opus 4.6, pero presenta varios cambios importantes en la API, incluyendo la eliminación de presupuestos de pensamiento extendido y parámetros de muestreo.
Introducción
Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026. Reemplaza a Opus 4.6 como el modelo de gama alta en la línea Claude y está dirigido a desarrolladores que crean agentes autónomos, asistentes para trabajos de conocimiento y aplicaciones con gran carga visual.
El lanzamiento es importante por tres razones. Primero, es el primer modelo Claude con soporte de imágenes de alta resolución, triplicando el presupuesto de píxeles de 1.15 MP a 3.75 MP. Segundo, introduce presupuestos de tareas, una forma de dar al modelo una asignación de tokens para un bucle de agente completo en lugar de un solo turno. Tercero, presenta cambios importantes que requieren actualizaciones de código si está migrando desde Opus 4.6.
Especificaciones clave
| Especificación | Valor |
|---|---|
| ID de modelo API | claude-opus-4-7 |
| Ventana de contexto | 1,000,000 tokens |
| Máximo de tokens de salida | 128,000 tokens |
| Precio de entrada | $5 por millón de tokens |
| Precio de salida | $25 por millón de tokens |
| Precio de entrada por lotes | $2.50 por millón de tokens |
| Precio de salida por lotes | $12.50 por millón de tokens |
| Precio de lectura de caché | $0.50 por millón de tokens |
| Escritura de caché de 5 minutos | $6.25 por millón de tokens |
| Escritura de caché de 1 hora | $10 por millón de tokens |
| Fecha de lanzamiento | 16 de abril de 2026 |
| Disponibilidad | Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry |
Opus 4.7 utiliza un nuevo tokenizador que puede producir hasta un 35% más de tokens para el mismo texto en comparación con Opus 4.6. El precio por token no ha cambiado, pero su costo efectivo por solicitud puede aumentar dependiendo del contenido.

Novedades en Claude Opus 4.7
Soporte de imágenes de alta resolución
Esta es la adición principal. Los modelos Claude anteriores limitaban la entrada de imágenes a 1,568 píxeles en el lado largo (aproximadamente 1.15 megapíxeles). Opus 4.7 eleva eso a 2,576 píxeles en el lado largo (aproximadamente 3.75 megapíxeles).
El impacto práctico: las capturas de pantalla, maquetas de diseño, documentos y fotografías se transmiten con mucha mayor fidelidad. El mapeo de coordenadas ahora es 1:1 con los píxeles reales, eliminando las matemáticas del factor de escala que los flujos de trabajo de uso de computadora requerían anteriormente.
Opus 4.7 también mejora en subtareas de visión específicas:
- Percepción de bajo nivel: las tareas de señalar, medir y contar son más precisas
- Localización de imágenes: la detección de cuadros delimitadores y la localización de imágenes naturales muestran claras mejoras
Mayor resolución significa más tokens por imagen. Si su caso de uso no necesita la fidelidad adicional, reduzca el tamaño de las imágenes antes de enviarlas para ahorrar costos.
Nuevo nivel de esfuerzo xhigh
El parámetro de esfuerzo controla cuánto razonamiento invierte Claude en una respuesta. Opus 4.7 añade xhigh por encima de los niveles existentes high, medium y low.
Use xhigh para tareas de codificación y de agente donde la calidad importa más que la latencia. En este nivel, el modelo gasta significativamente más tokens en el razonamiento interno, lo que resulta en mejores resultados para problemas complejos. Use high como mínimo para trabajos sensibles a la inteligencia. Los niveles más bajos sacrifican precisión por velocidad y ahorro de costos.
Presupuestos de tareas (Beta)
Los presupuestos de tareas resuelven un problema que cualquier persona que construya agentes ha encontrado: ¿cómo se evita que un bucle de agente de múltiples turnos consuma un número ilimitado de tokens?
Con los presupuestos de tareas, le das a Claude un objetivo aproximado de tokens para todo el bucle, incluyendo el pensamiento, las llamadas a herramientas, los resultados de las herramientas y la salida final. El modelo ve una cuenta regresiva y la usa para priorizar el trabajo, omitir pasos de bajo valor y terminar elegantemente a medida que se agota el presupuesto.
Detalles clave:
- El presupuesto mínimo de tarea es de 20,000 tokens
- Es una recomendación, no un límite estricto. Claude intenta mantenerse dentro, pero puede excederlo
- Es diferente de
max_tokens, que es un límite estricto por solicitud que el modelo no ve - Requiere el encabezado beta
task-budgets-2026-03-13
Para tareas de agente de final abierto donde la calidad importa más, omita el presupuesto de tareas y deje que el modelo se ejecute. Reserve los presupuestos de tareas para cargas de trabajo donde necesite controlar el gasto total.
Pensamiento adaptativo como único modo de pensamiento
Se elimina el pensamiento extendido (donde se establece un budget_tokens fijo). Intentar establecer thinking: {"type": "enabled", "budget_tokens": N} devuelve un error 400.
El pensamiento adaptativo es el único modo de pensamiento activo. En las evaluaciones internas de Anthropic, superó consistentemente el enfoque de presupuesto fijo porque el modelo asigna tokens de razonamiento dinámicamente según la dificultad de la tarea.
Importante: el pensamiento adaptativo está desactivado por defecto. Debe establecer explícitamente thinking: {"type": "adaptive"} para activarlo.
Por defecto, el contenido del pensamiento también se omite de las respuestas. Si necesita ver el razonamiento del modelo (por ejemplo, para transmitir el progreso a los usuarios), establezca display: "summarized" en la configuración de pensamiento.
Memoria mejorada
Opus 4.7 es mejor escribiendo y leyendo desde la memoria basada en el sistema de archivos. Si su agente mantiene un bloc de notas, archivo de notas o almacén de memoria estructurada a lo largo de los turnos, hará un mejor trabajo actualizando y referenciando esas notas.
Esto es importante para agentes de codificación de larga duración, asistentes de investigación y cualquier flujo de trabajo donde el contexto se mantenga a través de sesiones.
Mejoras en el trabajo del conocimiento
Ganancias específicas en tareas de conocimiento del mundo real:
- Control de cambios de documentos: mejor en la producción y autocorrección de cambios registrados en archivos .docx
- Edición de diapositivas: precisión mejorada al generar y validar diseños .pptx
- Análisis de gráficos: mejor en el uso de bibliotecas de procesamiento de imágenes (como PIL) para analizar gráficos a nivel de píxel y transcribir datos de figuras

Qué cambió desde Opus 4.6
Cambios importantes en la API
Estos se aplican a la API de Mensajes. Si usa Claude Managed Agents, no hay cambios importantes.
| Cambio | Antes (Opus 4.6) | Después (Opus 4.7) |
|---|---|---|
| Pensamiento extendido | thinking: {"type": "enabled", "budget_tokens": 32000} |
Debe usar thinking: {"type": "adaptive"} |
| Parámetros de muestreo | temperature, top_p, top_k aceptados |
Valores no predeterminados devuelven error 400 |
| Visualización del pensamiento | Contenido del pensamiento incluido por defecto | Omitido por defecto; se activa con display: "summarized" |
| Tokenizador | Tokenizador estándar | Nuevo tokenizador (hasta un 35% más de tokens para el mismo texto) |
Cambios de comportamiento
Estos no rompen la API pero pueden afectar sus prompts:
- Seguimiento más literal de instrucciones. El modelo no generalizará silenciosamente las instrucciones de un elemento a otro
- La longitud de la respuesta se escala con la complejidad de la tarea en lugar de por defecto a una verbosidad fija
- Menos llamadas a herramientas por defecto, prefiriendo el razonamiento sobre la acción. Aumente el esfuerzo para incrementar el uso de herramientas
- Tono más directo y con más opinión con menos emojis y un lenguaje menos pro-validación
- Menos subagentes generados por defecto en flujos de trabajo de agentes
Si ha creado andamiajes de prompting para forzar a Claude a comportamientos específicos (como "revisar el diseño de la diapositiva" o "dar actualizaciones de estado"), intente eliminarlos. Opus 4.7 maneja muchos de estos patrones de forma nativa.
Desglose de precios
Opus 4.7 mantiene el mismo precio por token que Opus 4.6 y 4.5:
| Tipo de uso | Costo |
|---|---|
| Entrada estándar | $5 / MTok |
| Salida estándar | $25 / MTok |
| Entrada por lotes | $2.50 / MTok |
| Salida por lotes | $12.50 / MTok |
| Lectura de caché | $0.50 / MTok |
| Escritura de caché de 5 minutos | $6.25 / MTok |
| Escritura de caché de 1 hora | $10 / MTok |
| Entrada en modo rápido (solo Opus 4.6) | $30 / MTok |
| Residencia de datos en EE. UU. | Multiplicador de 1.1x |
El nuevo tokenizador es la variable de costo a observar. Debido a que puede producir hasta un 35% más de tokens para el mismo texto de entrada, su costo efectivo por solicitud podría aumentar aunque el precio por token no haya cambiado. Pruebe con el endpoint /v1/messages/count_tokens para medir el impacto en sus prompts específicos.
La ventana de contexto de 1M no tiene prima por contexto largo. Una solicitud de 900K tokens cuesta la misma tarifa por token que una solicitud de 9K tokens.
Dónde usar Opus 4.7
Casos de uso potentes
- Agentes de codificación autónomos: el nivel de esfuerzo
xhigh+ presupuestos de tareas le dan un control preciso sobre el comportamiento y el costo del agente - Uso de computadoras: el mapeo de coordenadas de píxeles 1:1 y la visión de 3.75 MP hacen que la interacción con la pantalla sea significativamente más confiable
- Procesamiento de documentos: análisis mejorado de .docx, .pptx y gráficos para la automatización del trabajo del conocimiento
- Recuperación de contexto largo: ventana de 1M de tokens con precios estándar para grandes bases de código, documentos legales o trabajos de investigación
- Agentes de múltiples sesiones: mejor memoria basada en archivos para flujos de trabajo que abarcan muchas conversaciones
Cuando Opus 4.7 puede ser excesivo
- Tareas simples de preguntas y respuestas o clasificación: Haiku 4.5 ($1/$5 por MTok) o Sonnet 4.6 ($3/$15 por MTok) ofrecen resultados sólidos a una fracción del costo
- Flujos de chatbot de baja latencia: la sobrecarga del pensamiento adaptativo y los altos niveles de esfuerzo añaden latencia
- Análisis por lotes de datos estructurados: la API por lotes con Sonnet suele ser más rentable
Cómo probar su integración de Claude Opus 4.7 con Apidog
Cambiar su ID de modelo de claude-opus-4-6 a claude-opus-4-7 es la parte fácil. La parte más difícil es validar que sus prompts existentes, definiciones de herramientas y manejo de errores sigan funcionando correctamente después de los cambios importantes.

Apidog lo hace sencillo:
Importe su esquema API. Inserte su especificación OpenAPI o defina manualmente sus endpoints de la API de Claude. Apidog genera automáticamente plantillas de solicitud para la API de Mensajes.
Cree escenarios de prueba. Configure conversaciones de múltiples turnos que prueben sus patrones específicos de uso de herramientas. Apidog le permite encadenar solicitudes, pasar contexto entre turnos y validar esquemas de respuesta.
Compare versiones del modelo. Ejecute los mismos escenarios de prueba contra claude-opus-4-6 y claude-opus-4-7 en paralelo. Verifique las diferencias en los recuentos de tokens, la estructura de la respuesta y la calidad de la salida.
Valide los cambios importantes. Confirme que su configuración thinking actualizada funciona, que los parámetros de muestreo eliminados no se reintroducen subrepticiamente y que el nuevo tokenizador no supera sus límites de max_tokens.
Depure cargas útiles de uso de herramientas. Inspeccione los cuerpos completos de solicitud y respuesta para conversaciones de uso de herramientas de múltiples turnos. La interfaz visual de Apidog facilita la detección de resultados de herramientas mal formados o referencias tool_use_id faltantes.
Lista de verificación para la migración
Si está actualizando desde Opus 4.6:
- [ ] Actualice su ID de modelo a
claude-opus-4-7 - [ ] Reemplace
thinking: {"type": "enabled", "budget_tokens": N}conthinking: {"type": "adaptive"} - [ ] Elimine los parámetros
temperature,top_pytop_k(o establezca los valores predeterminados) - [ ] Si está transmitiendo el pensamiento a los usuarios, añada
display: "summarized"a su configuración de pensamiento - [ ] Aumente el margen de
max_tokenspara tener en cuenta el nuevo tokenizador (hasta un 35% más de tokens) - [ ] Pruebe el almacenamiento en caché de prompts — los recuentos de tokens diferirán
- [ ] Elimine el andamiaje de prompts para comportamientos que Opus 4.7 maneja de forma nativa (actualizaciones de estado, auto-verificación)
- [ ] Ejecute su suite de pruebas con Apidog para validar el comportamiento de extremo a extremo
Conclusión
Claude Opus 4.7 es el modelo más potente de Anthropic disponible de forma general. La visión de alta resolución, los presupuestos de tareas y el nivel de esfuerzo xhigh lo impulsan aún más hacia el territorio de los agentes autónomos. Los cambios importantes (no más presupuestos de pensamiento extendido, no más parámetros de muestreo) requieren actualizaciones de código, pero la ruta de migración es clara.
El nuevo tokenizador es la principal consideración de costo. Los precios por token son fijos, pero el mismo prompt puede costar más debido a un mayor número de tokens. Pruebe sus cargas de trabajo antes de cambiar el tráfico de producción.
Para los desarrolladores que construyen integraciones de API, Apidog proporciona el entorno de prueba y depuración que necesita para validar su migración y comparar el rendimiento del modelo entre versiones.
