OpenAI duplicó el precio por token en la línea GPT-5 con el lanzamiento de GPT-5.5 el 23 de abril de 2026. La entrada pasa de $2.50 a $5.00 por millón de tokens. La salida pasa de $15.00 a $30.00 por millón. El precio Pro se mantiene fijo en $30 / $180. Ese es el titular; los detalles son donde reside el costo real.
Esta guía cubre todas las superficies de precios: API estándar, Batch, Flex y Priority; precios Pro; límites de Codex por plan; y cómo calcular el costo de su carga de trabajo real antes de comprometerse con un cambio de modelo predeterminado.
Para la descripción general del modelo, consulte Qué es GPT-5.5. Para la guía para desarrolladores, consulte Cómo usar la API de GPT-5.5.
En resumen
| Superficie | Entrada / M | Salida / M |
|---|---|---|
| API estándar de GPT-5.5 | $5.00 | $30.00 |
| API Pro de GPT-5.5 | $30.00 | $180.00 |
| GPT-5.5 por lotes (50 % de descuento) | $2.50 | $15.00 |
| GPT-5.5 flexible (50 % de descuento) | $2.50 | $15.00 |
| GPT-5.5 prioritario (2.5×) | $12.50 | $75.00 |
| API estándar de GPT-5.4 | $2.50 | $15.00 |
| API de GPT-5.4-mini | $0.25 | $2.00 |
Efecto neto: GPT-5.5 es 2× GPT-5.4 a nivel de token, pero OpenAI afirma un aumento neto del Índice de Inteligencia de ~20 % una vez que se tiene en cuenta la eficiencia del token.
Los números principales
OpenAI publicó los precios en la página de precios de la API el mismo día del lanzamiento.
- GPT-5.5: $5.00 por millón de tokens de entrada, $30.00 por millón de tokens de salida.
- GPT-5.5 Pro: $30.00 por millón de tokens de entrada, $180.00 por millón de tokens de salida.
- Ventana de contexto: 1 millón de tokens en ambas variantes. Los tokens de razonamiento cuentan para la ventana y para la facturación de salida.
Batch, Flex y Priority
OpenAI ofrece tres niveles alternativos que reconfiguran el precio estándar.
API por lotes
Ponga en cola las solicitudes a través del punto final Batch y se ejecutarán al 50 % del precio estándar. El tiempo de respuesta es inferior a 24 horas. Bueno para:
- Evaluaciones nocturnas de un conjunto de datos completo.
- Rellenos y reprocesamiento histórico.
- Cualquier flujo de trabajo donde el presupuesto de latencia se mide en horas, no en segundos.
Con el precio por lotes, GPT-5.5 cuesta $2.50 / $15.00 por millón de tokens; idéntico al precio estándar de GPT-5.4. Para cargas de trabajo sin conexión, la duplicación de precios desaparece.
Procesamiento flexible
Flex también le ofrece un 50 % de descuento sobre las tarifas estándar, pero el tiempo de espera es variable; desde segundos hasta varios minutos, dependiendo de la carga. Utilice Flex cuando pueda tolerar una latencia impredecible y desee precios a nivel de Batch con respuestas casi síncronas.
Procesamiento prioritario
El procesamiento prioritario cuesta 2.5× la tarifa estándar ($12.50 / $75.00 por millón de tokens en GPT-5.5) y le brinda un rendimiento más rápido que el predeterminado, límites de tasa más altos y un tiempo de cola casi nulo. Resérvelo para experiencias en vivo orientadas al usuario donde la latencia de cola afecta las métricas de retención.
Cálculo de costos del modo de pensamiento
El modo de pensamiento de GPT-5.5 es la misma ID de modelo con un reasoning.effort más alto. No cambia el precio por token; cambia la cantidad de tokens que utiliza una sola solicitud. Espere que el multiplicador se divida en tres bandas.
| Esfuerzo | Multiplicador de tokens de salida | Cuándo usar |
|---|---|---|
bajo (predeterminado) |
1× | La mayoría de las llamadas rutinarias |
medio |
1.3–2× | Codificación de varios pasos, generación estructurada |
alto |
2–4× | Investigación profunda, revisión crítica de la corrección |
muy alto |
3–8× | Bucles de agente con cadenas de herramientas, planificación densa |
Una sola llamada muy alta con un prompt largo puede consumir fácilmente 20 K tokens de razonamiento; a $30 por millón, eso es $0.60 solo por el razonamiento, además de lo que cuesten los tokens de salida finales.
Presupueste por carga de trabajo, no por solicitud.
Precios de Codex
El acceso a Codex está vinculado al plan de ChatGPT, no a la facturación por token. El 23 de abril de 2026, la estructura es la siguiente.
| Plan | Acceso a Codex | GPT-5.5 | Notas |
|---|---|---|---|
| Gratis | Sí (tiempo limitado) | Sí | Límites semanales estrictos |
| Go | Sí (tiempo limitado) | Sí | 2× los límites del plan Gratis |
| Plus ($20 / mes) | Sí | Sí | Límites estándar |
| Pro ($200 / mes) | Sí | Sí + Modo de pensamiento + Pro (en ChatGPT) | Límites más altos por usuario |
| Business | Sí | Sí | Basado en asientos |
| Empresarial / Educativo | Sí | Sí | Basado en contrato |
Para los usuarios que pasan la mayor parte de su tiempo dentro de un flujo de trabajo de codificación en terminal, Plus o Pro es la forma más económica de ejecutar GPT-5.5; la tarifa mensual fija supera incluso los precios por lotes una vez que supera unos pocos cientos de miles de tokens al día. La guía de ruta gratuita cubre el punto de entrada sin costo.
Comparación: GPT-5.5 vs el resto de la línea
¿Cuándo paga por GPT-5.5 y cuándo mantiene GPT-5.4 o GPT-5.4-mini? El cálculo de costos depende de la intensidad de salida de su carga de trabajo.
| Modelo | Entrada / M | Salida / M | Costo por 1 K tokens de salida |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
Un flujo de decisión aproximado:
- Salida de alto volumen y bajo riesgo (clasificación, resumen, chat simple): GPT-5.4-mini.
- Tráfico de producción general donde 5.4 ya supera los estándares de calidad: GPT-5.4.
- Codificación compleja, trabajo agéntico de varios pasos, cadenas de investigación: GPT-5.5.
- Salida crítica para la corrección donde una respuesta incorrecta es costosa de detectar en etapas posteriores: GPT-5.5 Pro.
Un ejemplo práctico: costo del agente de codificación por tarea
Una sesión típica de codificación agéntica a través de la API en GPT-5.5 con reasoning.effort: "medium" se ve así.
- Tokens de entrada por tarea (contexto del repositorio + prompt del usuario): ~15,000
- Tokens de salida por tarea (código + explicaciones): ~3,000
- Tokens de razonamiento por tarea (esfuerzo medio): ~6,000
Costo por tarea con precios estándar:
- Entrada: 15 K × $5.00 / M = $0.075
- Salida: (3 K + 6 K) × $30.00 / M = $0.27
- Total: $0.345 por tarea de codificación completada.
Ejecutando la misma carga de trabajo en GPT-5.4:
- Entrada: 15 K × $2.50 / M = $0.0375
- Salida: 9 K × $15.00 / M = $0.135
- Total: $0.1725 por tarea de codificación completada.
GPT-5.5 es exactamente 2× el costo por tarea con el mismo esfuerzo de razonamiento. La actualización se amortiza cuando la brecha SWE-bench (88.7 % frente a aproximadamente 74 %) cierra suficientes tareas con éxito para eliminar un segundo viaje de ida y vuelta. Si una de cada ocho tareas en GPT-5.4 necesita una reescritura manual, GPT-5.5 es más barato en general.
Controles de costos que vale la pena implementar el primer día
Cinco palancas para mantener las facturas de GPT-5.5 bajo control.
- Límites estrictos de
max_output_tokens. Cada llamada, siempre. Predetermine 2,000 a menos que necesite explícitamente una salida larga. - Esquemas JSON estrictos. Una salida mal formada significa reintentos; los reintentos son una llamada con precio completo.
- Enrute por dificultad. Clasifique las solicitudes fáciles a GPT-5.4-mini; escale las difíciles a GPT-5.5. Un enrutador de 10 líneas ahorra más que cualquier optimización a nivel de prompt.
- Use Batch para cualquier cosa sin conexión. Evaluaciones, rellenos, generación de informes nocturnos; todo con un 50 % de descuento.
- Monitoree
usage.reasoning_tokens. La sorpresa de facturación en GPT-5.5 es casi siempre el gasto de tokens de razonamiento con alto esfuerzo. Genere una alerta al respecto.
Estimación de costo mensual por plan
Si está eligiendo un nivel de ChatGPT para el acceso a GPT-5.5, aquí tiene lo que cuesta cada plan.
| Plan | Precio mensual | Mejor opción |
|---|---|---|
| Gratis | $0 | Probar GPT-5.5 a través de Codex antes de comprometerse |
| Go | $4 / mes | Estudiantes y usuarios ligeros que desean 2× los límites del plan Gratis |
| Plus | $20 / mes | Desarrolladores individuales que usan Codex + ChatGPT diariamente |
| Pro | $200 / mes | Usuarios avanzados que desean el Modo de pensamiento y Pro en ChatGPT |
| Business | $25 / asiento / mes | Equipos que necesitan espacios de trabajo compartidos |
| Empresarial / Educativo | Personalizado | Basado en contrato con SLA |
Para cualquiera que ejecute más de ~4 millones de tokens de salida al mes en la API, Pro en ChatGPT más la CLI de Codex resulta más económico que la facturación de API de pago por uso, siempre y cuando la carga de trabajo encaje dentro de la ventana de contexto de 400 K de la CLI.
Señales de cambio de precios a observar
Dos señales que vale la pena seguir si está elaborando un presupuesto a largo plazo.
- La disponibilidad general (GA) de la API de GPT-5.5. Los precios podrían bajar a medida que OpenAI responda a la presión competitiva de Anthropic Claude Mythos, Gemini 3.5 y los modelos de peso abierto (open-weight) referenciados en la tabla de clasificación de Vellum.
- Democratización del modelo Pro. Históricamente, OpenAI ha bajado los precios del nivel Pro entre 3 y 6 meses después de cada lanzamiento. No asuma que los $30 / $180 actuales son permanentes; tampoco asuma que bajarán.
Preguntas frecuentes
- ¿El almacenamiento en caché reduce el costo de entrada?Sí. Los tokens de entrada almacenados en caché en GPT-5.5 se facturan a una fracción de la tarifa estándar; la página de precios de OpenAI tiene el multiplicador exacto. Almacene en caché cualquier cosa que reutilice en más de una solicitud (prompts del sistema, esquemas de herramientas, contexto del repositorio).
- ¿Hay un descuento por volumen?No uno publicado. Los contratos empresariales a menudo incluyen tarifas personalizadas, y OpenAI ajusta los precios en respuesta a un uso sostenido. Hable con ventas si supera los siete dígitos de gasto anual.
- ¿El modo de pensamiento tiene un costo adicional además del precio por token?No. Cuesta más porque usa más tokens, no porque cambie la tarifa por token.
- ¿El uso de la CLI de Codex se factura por separado del uso de la API?Solo si inicia sesión con una clave API. Los inicios de sesión de ChatGPT facturan la tarifa del plan; los inicios de sesión con clave API facturan la cuenta basada en el uso.
- ¿Cuál es la forma más económica de probar GPT-5.5?El plan Gratis o Go más la CLI de Codex. Consulte nuestra guía de ruta gratuita para ver todas las opciones sin costo.
