Claude Sonnet 5 se lanzó el 30 de junio de 2026, y el precio es el titular. Obtiene un rendimiento cercano al de Opus 4.8 en tareas de agentes y uso de herramientas por una fracción del costo. Esta guía le brinda los números exactos: la tarifa de introducción, la tarifa estándar, la fecha en que cambian y un detalle del tokenizador que cambia discretamente su factura real. También verá cómo Sonnet 5 se compara con Opus 4.8 y Fable 5 para que pueda elegir el modelo adecuado según el costo, no solo la capacidad. Cuando empiece a llamar a la API, Apidog es donde envía esas solicitudes, las guarda y rastrea exactamente lo que está pagando.
Esto es lo que obtiene: la tarifa por token, un ejemplo de costo resuelto, una tabla comparativa modelo por modelo y una breve lista de verificación para estimar y monitorear el gasto antes de que lo sorprenda.

Precios de Claude Sonnet 5 de un vistazo
Sonnet 5 utiliza la misma tarifa por token que su predecesor, Sonnet 4.6. Nada cambió en el precio de etiqueta. Lo que cambió es el descuento introductorio que se aplica durante los primeros dos meses.
| Tarifa | Entrada (por 1M de tokens) | Salida (por 1M de tokens) | En vigor |
|---|---|---|---|
| Introductoria | $2 | $10 | Hasta el 31 de agosto de 2026 |
| Estándar | $3 | $15 | A partir del 1 de septiembre de 2026 |
El ID del modelo es claude-sonnet-5 sin sufijo de fecha. Esa única cadena es lo que envía en la solicitud de API, y se factura a estas tarifas.
Dos cosas que vale la pena tener en cuenta ahora:
- La tarifa introductoria (entrada de $2 / salida de $10) estará vigente hasta el 31 de agosto de 2026. Después de eso, pasará a la tarifa estándar de $3 / $15.
- La tarifa estándar es idéntica a la de Sonnet 4.6. Si ya estaba ejecutando Sonnet 4.6, su precio por token no aumenta al migrar.
Ese último punto suena como una victoria limpia. En su mayor parte lo es. Pero hay un detalle del tokenizador que cambia las matemáticas, y es fácil pasarlo por alto.
La trampa del tokenizador: misma tarifa, más tokens
Sonnet 5 se lanza con un nuevo tokenizador. El mismo texto de entrada produce aproximadamente un 30% más de tokens de los que producía en Sonnet 4.6, aproximadamente 1.3 veces. Esto no es un cambio de API. Las formas de solicitud, respuesta y transmisión son idénticas, y no escribe código nuevo. Pero cualquier cosa que mida o presupueste en tokens se desplaza.
Dado que usted paga por token, más tokens para el mismo texto significa un costo más alto para una solicitud equivalente, aunque la tarifa por token nunca se haya movido.
Aquí hay un ejemplo resuelto. Suponga que un prompt era de 10,000 tokens en Sonnet 4.6.
- En Sonnet 4.6 a $3 por millón de entrada: 10,000 tokens cuestan alrededor de $0.030.
- En Sonnet 5, el mismo texto es de aproximadamente 13,000 tokens. A la tarifa introductoria de $2 por millón de entrada: alrededor de $0.026.
- En Sonnet 5 a la tarifa estándar de $3 por millón de entrada (después del 31 de agosto): alrededor de $0.039.
Así que, durante el período introductorio, el descuento compensa aproximadamente los tokens adicionales, y puede pagar aproximadamente lo mismo o un poco menos. Una vez que la tarifa estándar entra en vigor, el mismo texto con 1.3 veces más tokens cuesta más de lo que costaba en Sonnet 4.6 a la misma tarifa por token. La tarifa es plana. La factura no lo es.
Esto afecta más que el costo:
- Los campos
usagey los resultados del recuento de tokens serán más altos para el mismo texto. Vuelva a contar con Sonnet 5. No reutilice sus antiguos recuentos de Sonnet 4.6. - La ventana de contexto de 1 millón de tokens contiene menos texto en promedio, ya que cada token ahora cubre menos texto.
- Los presupuestos de
max_tokensque ajustó cerca de su salida esperada pueden truncarse. Revíselos.
La conclusión es simple: modele sus cargas de trabajo reales con el recuento de tokens en Sonnet 5 antes de asumir una paridad plana. La documentación de recuento de tokens de Anthropic muestra cómo medir un prompt con el tokenizador actual. Para un recorrido completo de una primera llamada a la API y dónde leer el bloque usage, consulte nuestra guía de la API de Claude Sonnet 5.
Cómo se compara Sonnet 5 con Opus 4.8 y Fable 5
Sonnet 5 tiene un precio para ser el caballo de batalla de alto volumen. El caso de valor es más claro cuando lo alinea con los modelos superiores. Los tres comparten una ventana de contexto de 1 millón de tokens y una salida máxima de 128K, por lo que la diferencia aquí es el precio y dónde cada modelo justifica su existencia.
| Modelo | ID del modelo | Entrada (por 1M) | Salida (por 1M) |
|---|---|---|---|
| Sonnet 5 (introductorio) | claude-sonnet-5 |
$2 | $10 |
| Sonnet 5 (estándar) | claude-sonnet-5 |
$3 | $15 |
| Sonnet 4.6 | claude-sonnet-4-6 |
$3 | $15 |
| Opus 4.8 | claude-opus-4-8 |
$5 | $25 |
| Fable 5 | claude-fable-5 |
$10 | $50 |
Lea esa tabla teniendo en cuenta los puntos de referencia. En tareas de agentes y uso de herramientas, las cifras de lanzamiento de Anthropic sitúan a Sonnet 5 a una distancia de entre 1 y 3 puntos de Opus 4.8. Los números reportados incluyen SWE-bench Pro con 63.2% para Sonnet 5 versus 69.2% para Opus 4.8, Terminal-Bench 2.1 con 80.4% versus 82.7%, y OSWorld-Verified con 81.2% versus 83.4%. Opus se adelanta en unos 6 puntos en razonamiento puro sin depender de nada más.
Así que la decisión de costo se reduce a esto:
- A la tarifa estándar, Sonnet 5 es un 40% más barato en la entrada y un 40% más barato en la salida que Opus 4.8, para un rendimiento cercano al de Opus en trabajos intensivos en herramientas.
- Fable 5 tiene un precio de $10 / $50, más del triple de la tarifa de entrada estándar de Sonnet 5. Lo usará cuando necesite el modelo más capaz de Anthropic ampliamente lanzado, no para bucles de agentes de alto volumen.
- En comparación con Sonnet 4.6, paga lo mismo por token por mejores puntuaciones de codificación y agente, con la salvedad del tokenizador mencionada anteriormente.
Si está sopesando la capacidad frente al precio para un trabajo específico, nuestro análisis de Sonnet 5 vs Opus 4.8 desglosa la decisión tarea por tarea. Para el lado de la escalera de Fable 5, consulte la guía de precios de Fable 5.
Pruebe y rastree las solicitudes por las que está pagando con Apidog
Cada dólar de su factura de Sonnet 5 se asigna a una solicitud HTTP: un POST a la API de Mensajes con un cuerpo JSON, una clave de API y una respuesta por la que paga por token. Si está adivinando esas solicitudes, está adivinando su costo.

Apidog le brinda un lugar para hacer que esas solicitudes sean reales y repetibles:
- Envíe una solicitud de Sonnet 5 y vea la respuesta exacta, incluido el bloque
usageque le indica el recuento de tokens de entrada y salida por llamada. Ese es su costo, por solicitud, antes de escalarlo. - Guarde la solicitud en una colección para que su equipo ejecute la misma llamada, no otras ligeramente diferentes que facturan de manera distinta.
- Almacene su clave de API como una variable de entorno y cambie entre claves de prueba y producción sin editar la solicitud.
- Agregue aserciones automatizadas para que un cambio de prompt que duplique la longitud de la salida se detecte en CI, no en la factura.
- Simule el punto final para que pueda construir y probar su integración sin gastar tokens reales en cada ejecución de desarrollo.
Aquí hay una primera solicitud con la forma de la API de Mensajes de Anthropic. Envíela en Apidog, lea los campos usage en la respuesta y tendrá un número de costo real por llamada para multiplicar.
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in two sentences."}
]
}'
La respuesta incluye un objeto usage con input_tokens y output_tokens. Multiplíquelos por las tarifas de la tabla anterior y tendrá el costo de esa llamada exacta. Haga eso para sus prompts reales y su estimación dejará de ser una suposición.
Descargue Apidog para enviar solicitudes de Sonnet 5, inspeccionar el uso de tokens y organizar las llamadas por las que está facturando en un solo espacio de trabajo.
Preguntas frecuentes
¿Cuánto cuesta la API de Claude Sonnet 5?
Durante el período introductorio hasta el 31 de agosto de 2026, cuesta $2 por millón de tokens de entrada y $10 por millón de tokens de salida. A partir del 1 de septiembre de 2026, pasará a la tarifa estándar de $3 por millón de entrada y $15 por millón de salida.
¿Es Sonnet 5 más barato que Sonnet 4.6?
La tarifa por token es la misma que la de Sonnet 4.6 en el nivel estándar ($3 / $15), y más baja durante el período introductorio. Pero el nuevo tokenizador de Sonnet 5 produce aproximadamente un 30% más de tokens para el mismo texto, por lo que el costo de una solicitud equivalente puede ser mayor a la tarifa estándar. Cuente los tokens en Sonnet 5 para ver su número real. Nuestra comparación de Sonnet 5 vs Sonnet 4.6 cubre los detalles de la migración.
¿Por qué el mismo prompt cuesta más en Sonnet 5 que en Sonnet 4.6?
La tarifa por token no cambió, pero el nuevo tokenizador divide el mismo texto en aproximadamente 1.3 veces más tokens. Más tokens a la misma tarifa significa un costo más alto para un texto equivalente, más visible una vez que finaliza el descuento introductorio.
¿Cómo se compara el precio de Sonnet 5 con Opus 4.8?
Opus 4.8 cuesta $5 por millón de entrada y $25 por millón de salida, versus la tarifa estándar de Sonnet 5 de $3 / $15. Sonnet 5 se sitúa entre 1 y 3 puntos de Opus 4.8 en los puntos de referencia de agentes informados por Anthropic, por lo que obtiene un rendimiento cercano en tareas intensivas en herramientas a un precio más bajo.
¿Existen formas más baratas de ejecutar Sonnet 5?
Sí. El procesamiento por lotes y el almacenamiento en caché de prompts reducen la tarifa efectiva para cargas de trabajo adecuadas. Las tarifas con descuento exactas se encuentran en la página de precios de Anthropic. Dimensionar max_tokens correctamente y mantener los prompts concisos también reduce el costo de salida, que es 5 veces la tarifa de entrada.
