¿Qué es Claude Opus 4.7? Características, Pruebas, Precio y Todo lo que Debes Saber

En resumen

Claude Opus 4.7 es el modelo más capaz de Anthropic disponible de forma general, lanzado el 16 de abril de 2026. Introduce visión de alta resolución (hasta 3.75 megapíxeles), un nuevo nivel de esfuerzo xhigh, presupuestos de tareas para bucles de agentes y un nuevo tokenizador. Mantiene la ventana de contexto de 1M de tokens y el precio de $5/$25 por millón de tokens de Opus 4.6, pero presenta varios cambios importantes en la API, incluyendo la eliminación de presupuestos de pensamiento extendido y parámetros de muestreo.

Introducción

Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026. Reemplaza a Opus 4.6 como el modelo de gama alta en la línea Claude y está dirigido a desarrolladores que crean agentes autónomos, asistentes para trabajos de conocimiento y aplicaciones con gran carga visual.

El lanzamiento es importante por tres razones. Primero, es el primer modelo Claude con soporte de imágenes de alta resolución, triplicando el presupuesto de píxeles de 1.15 MP a 3.75 MP. Segundo, introduce presupuestos de tareas, una forma de dar al modelo una asignación de tokens para un bucle de agente completo en lugar de un solo turno. Tercero, presenta cambios importantes que requieren actualizaciones de código si está migrando desde Opus 4.6.

💡

Esta guía cubre lo que Opus 4.7 puede hacer, cómo se compara con su predecesor, cuánto cuesta y qué necesita cambiar si está actualizando. También verá cómo probar su integración de la API de Claude con Apidog, que maneja el formato de conversación de múltiples turnos y las cargas útiles de uso de herramientas en las que Opus 4.7 sobresale.

button

Especificaciones clave

Especificación	Valor
ID de modelo API	`claude-opus-4-7`
Ventana de contexto	1,000,000 tokens
Máximo de tokens de salida	128,000 tokens
Precio de entrada	$5 por millón de tokens
Precio de salida	$25 por millón de tokens
Precio de entrada por lotes	$2.50 por millón de tokens
Precio de salida por lotes	$12.50 por millón de tokens
Precio de lectura de caché	$0.50 por millón de tokens
Escritura de caché de 5 minutos	$6.25 por millón de tokens
Escritura de caché de 1 hora	$10 por millón de tokens
Fecha de lanzamiento	16 de abril de 2026
Disponibilidad	Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry

Opus 4.7 utiliza un nuevo tokenizador que puede producir hasta un 35% más de tokens para el mismo texto en comparación con Opus 4.6. El precio por token no ha cambiado, pero su costo efectivo por solicitud puede aumentar dependiendo del contenido.

Novedades en Claude Opus 4.7

Soporte de imágenes de alta resolución

Esta es la adición principal. Los modelos Claude anteriores limitaban la entrada de imágenes a 1,568 píxeles en el lado largo (aproximadamente 1.15 megapíxeles). Opus 4.7 eleva eso a 2,576 píxeles en el lado largo (aproximadamente 3.75 megapíxeles).

El impacto práctico: las capturas de pantalla, maquetas de diseño, documentos y fotografías se transmiten con mucha mayor fidelidad. El mapeo de coordenadas ahora es 1:1 con los píxeles reales, eliminando las matemáticas del factor de escala que los flujos de trabajo de uso de computadora requerían anteriormente.

Opus 4.7 también mejora en subtareas de visión específicas:

Percepción de bajo nivel: las tareas de señalar, medir y contar son más precisas
Localización de imágenes: la detección de cuadros delimitadores y la localización de imágenes naturales muestran claras mejoras

Mayor resolución significa más tokens por imagen. Si su caso de uso no necesita la fidelidad adicional, reduzca el tamaño de las imágenes antes de enviarlas para ahorrar costos.

Nuevo nivel de esfuerzo `xhigh`

El parámetro de esfuerzo controla cuánto razonamiento invierte Claude en una respuesta. Opus 4.7 añade xhigh por encima de los niveles existentes high, medium y low.

Use xhigh para tareas de codificación y de agente donde la calidad importa más que la latencia. En este nivel, el modelo gasta significativamente más tokens en el razonamiento interno, lo que resulta en mejores resultados para problemas complejos. Use high como mínimo para trabajos sensibles a la inteligencia. Los niveles más bajos sacrifican precisión por velocidad y ahorro de costos.

Presupuestos de tareas (Beta)

Los presupuestos de tareas resuelven un problema que cualquier persona que construya agentes ha encontrado: ¿cómo se evita que un bucle de agente de múltiples turnos consuma un número ilimitado de tokens?

Con los presupuestos de tareas, le das a Claude un objetivo aproximado de tokens para todo el bucle, incluyendo el pensamiento, las llamadas a herramientas, los resultados de las herramientas y la salida final. El modelo ve una cuenta regresiva y la usa para priorizar el trabajo, omitir pasos de bajo valor y terminar elegantemente a medida que se agota el presupuesto.

Detalles clave:

El presupuesto mínimo de tarea es de 20,000 tokens
Es una recomendación, no un límite estricto. Claude intenta mantenerse dentro, pero puede excederlo
Es diferente de max_tokens, que es un límite estricto por solicitud que el modelo no ve
Requiere el encabezado beta task-budgets-2026-03-13

Para tareas de agente de final abierto donde la calidad importa más, omita el presupuesto de tareas y deje que el modelo se ejecute. Reserve los presupuestos de tareas para cargas de trabajo donde necesite controlar el gasto total.

Pensamiento adaptativo como único modo de pensamiento

Se elimina el pensamiento extendido (donde se establece un budget_tokens fijo). Intentar establecer thinking: {"type": "enabled", "budget_tokens": N} devuelve un error 400.

El pensamiento adaptativo es el único modo de pensamiento activo. En las evaluaciones internas de Anthropic, superó consistentemente el enfoque de presupuesto fijo porque el modelo asigna tokens de razonamiento dinámicamente según la dificultad de la tarea.

Importante: el pensamiento adaptativo está desactivado por defecto. Debe establecer explícitamente thinking: {"type": "adaptive"} para activarlo.

Por defecto, el contenido del pensamiento también se omite de las respuestas. Si necesita ver el razonamiento del modelo (por ejemplo, para transmitir el progreso a los usuarios), establezca display: "summarized" en la configuración de pensamiento.

Memoria mejorada

Opus 4.7 es mejor escribiendo y leyendo desde la memoria basada en el sistema de archivos. Si su agente mantiene un bloc de notas, archivo de notas o almacén de memoria estructurada a lo largo de los turnos, hará un mejor trabajo actualizando y referenciando esas notas.

Esto es importante para agentes de codificación de larga duración, asistentes de investigación y cualquier flujo de trabajo donde el contexto se mantenga a través de sesiones.

Mejoras en el trabajo del conocimiento

Ganancias específicas en tareas de conocimiento del mundo real:

Control de cambios de documentos: mejor en la producción y autocorrección de cambios registrados en archivos .docx
Edición de diapositivas: precisión mejorada al generar y validar diseños .pptx
Análisis de gráficos: mejor en el uso de bibliotecas de procesamiento de imágenes (como PIL) para analizar gráficos a nivel de píxel y transcribir datos de figuras

Qué cambió desde Opus 4.6

Cambios importantes en la API

Estos se aplican a la API de Mensajes. Si usa Claude Managed Agents, no hay cambios importantes.

Cambio	Antes (Opus 4.6)	Después (Opus 4.7)
Pensamiento extendido	`thinking: {"type": "enabled", "budget_tokens": 32000}`	Debe usar `thinking: {"type": "adaptive"}`
Parámetros de muestreo	`temperature`, `top_p`, `top_k` aceptados	Valores no predeterminados devuelven error 400
Visualización del pensamiento	Contenido del pensamiento incluido por defecto	Omitido por defecto; se activa con `display: "summarized"`
Tokenizador	Tokenizador estándar	Nuevo tokenizador (hasta un 35% más de tokens para el mismo texto)

Cambios de comportamiento

Estos no rompen la API pero pueden afectar sus prompts:

Seguimiento más literal de instrucciones. El modelo no generalizará silenciosamente las instrucciones de un elemento a otro
La longitud de la respuesta se escala con la complejidad de la tarea en lugar de por defecto a una verbosidad fija
Menos llamadas a herramientas por defecto, prefiriendo el razonamiento sobre la acción. Aumente el esfuerzo para incrementar el uso de herramientas
Tono más directo y con más opinión con menos emojis y un lenguaje menos pro-validación
Menos subagentes generados por defecto en flujos de trabajo de agentes

Si ha creado andamiajes de prompting para forzar a Claude a comportamientos específicos (como "revisar el diseño de la diapositiva" o "dar actualizaciones de estado"), intente eliminarlos. Opus 4.7 maneja muchos de estos patrones de forma nativa.

Desglose de precios

Opus 4.7 mantiene el mismo precio por token que Opus 4.6 y 4.5:

Tipo de uso	Costo
Entrada estándar	$5 / MTok
Salida estándar	$25 / MTok
Entrada por lotes	$2.50 / MTok
Salida por lotes	$12.50 / MTok
Lectura de caché	$0.50 / MTok
Escritura de caché de 5 minutos	$6.25 / MTok
Escritura de caché de 1 hora	$10 / MTok
Entrada en modo rápido (solo Opus 4.6)	$30 / MTok
Residencia de datos en EE. UU.	Multiplicador de 1.1x

El nuevo tokenizador es la variable de costo a observar. Debido a que puede producir hasta un 35% más de tokens para el mismo texto de entrada, su costo efectivo por solicitud podría aumentar aunque el precio por token no haya cambiado. Pruebe con el endpoint /v1/messages/count_tokens para medir el impacto en sus prompts específicos.

La ventana de contexto de 1M no tiene prima por contexto largo. Una solicitud de 900K tokens cuesta la misma tarifa por token que una solicitud de 9K tokens.

Dónde usar Opus 4.7

Casos de uso potentes

Agentes de codificación autónomos: el nivel de esfuerzo xhigh + presupuestos de tareas le dan un control preciso sobre el comportamiento y el costo del agente
Uso de computadoras: el mapeo de coordenadas de píxeles 1:1 y la visión de 3.75 MP hacen que la interacción con la pantalla sea significativamente más confiable
Procesamiento de documentos: análisis mejorado de .docx, .pptx y gráficos para la automatización del trabajo del conocimiento
Recuperación de contexto largo: ventana de 1M de tokens con precios estándar para grandes bases de código, documentos legales o trabajos de investigación
Agentes de múltiples sesiones: mejor memoria basada en archivos para flujos de trabajo que abarcan muchas conversaciones

Cuando Opus 4.7 puede ser excesivo

Tareas simples de preguntas y respuestas o clasificación: Haiku 4.5 ($1/$5 por MTok) o Sonnet 4.6 ($3/$15 por MTok) ofrecen resultados sólidos a una fracción del costo
Flujos de chatbot de baja latencia: la sobrecarga del pensamiento adaptativo y los altos niveles de esfuerzo añaden latencia
Análisis por lotes de datos estructurados: la API por lotes con Sonnet suele ser más rentable

Cómo probar su integración de Claude Opus 4.7 con Apidog

Cambiar su ID de modelo de claude-opus-4-6 a claude-opus-4-7 es la parte fácil. La parte más difícil es validar que sus prompts existentes, definiciones de herramientas y manejo de errores sigan funcionando correctamente después de los cambios importantes.

Apidog lo hace sencillo:

Importe su esquema API. Inserte su especificación OpenAPI o defina manualmente sus endpoints de la API de Claude. Apidog genera automáticamente plantillas de solicitud para la API de Mensajes.

Cree escenarios de prueba. Configure conversaciones de múltiples turnos que prueben sus patrones específicos de uso de herramientas. Apidog le permite encadenar solicitudes, pasar contexto entre turnos y validar esquemas de respuesta.

Compare versiones del modelo. Ejecute los mismos escenarios de prueba contra claude-opus-4-6 y claude-opus-4-7 en paralelo. Verifique las diferencias en los recuentos de tokens, la estructura de la respuesta y la calidad de la salida.

Valide los cambios importantes. Confirme que su configuración thinking actualizada funciona, que los parámetros de muestreo eliminados no se reintroducen subrepticiamente y que el nuevo tokenizador no supera sus límites de max_tokens.

Depure cargas útiles de uso de herramientas. Inspeccione los cuerpos completos de solicitud y respuesta para conversaciones de uso de herramientas de múltiples turnos. La interfaz visual de Apidog facilita la detección de resultados de herramientas mal formados o referencias tool_use_id faltantes.

Lista de verificación para la migración

Si está actualizando desde Opus 4.6:

[ ] Actualice su ID de modelo a claude-opus-4-7
[ ] Reemplace thinking: {"type": "enabled", "budget_tokens": N} con thinking: {"type": "adaptive"}
[ ] Elimine los parámetros temperature, top_p y top_k (o establezca los valores predeterminados)
[ ] Si está transmitiendo el pensamiento a los usuarios, añada display: "summarized" a su configuración de pensamiento
[ ] Aumente el margen de max_tokens para tener en cuenta el nuevo tokenizador (hasta un 35% más de tokens)
[ ] Pruebe el almacenamiento en caché de prompts — los recuentos de tokens diferirán
[ ] Elimine el andamiaje de prompts para comportamientos que Opus 4.7 maneja de forma nativa (actualizaciones de estado, auto-verificación)
[ ] Ejecute su suite de pruebas con Apidog para validar el comportamiento de extremo a extremo

Conclusión

Claude Opus 4.7 es el modelo más potente de Anthropic disponible de forma general. La visión de alta resolución, los presupuestos de tareas y el nivel de esfuerzo xhigh lo impulsan aún más hacia el territorio de los agentes autónomos. Los cambios importantes (no más presupuestos de pensamiento extendido, no más parámetros de muestreo) requieren actualizaciones de código, pero la ruta de migración es clara.

El nuevo tokenizador es la principal consideración de costo. Los precios por token son fijos, pero el mismo prompt puede costar más debido a un mayor número de tokens. Pruebe sus cargas de trabajo antes de cambiar el tráfico de producción.

Para los desarrolladores que construyen integraciones de API, Apidog proporciona el entorno de prueba y depuración que necesita para validar su migración y comparar el rendimiento del modelo entre versiones.