Qué es el Código de Estado 504: Gateway Timeout y Cómo Solucionarlo

Estás navegando por un sitio web y, en lugar de que la página cargue, te encuentras con un mensaje que dice "504 Gateway Timeout". El icono de carga ha estado girando durante lo que parece una eternidad. Intentas actualizar, pero aparece el mismo error. El sitio web no está técnicamente "caído", pero algo en su infraestructura ha dejado de esperar una respuesta.

Esta experiencia frustrante es causada por uno de los errores del lado del servidor más comunes en la web moderna: el código de estado 504 Gateway Timeout.

A diferencia de los errores del cliente como 404 Not Found, que suelen ser "culpa" del usuario, o los errores del servidor como 500 Internal Server Error, que ocurren dentro de la aplicación, el 504 es una interrupción de la comunicación entre servidores. Es el equivalente digital de un intermediario que se rinde y dice: "He estado esperando demasiado tiempo a la persona con la que realmente quieres hablar, y me rindo".

¿Pero qué es exactamente el Código de Estado HTTP 504: Gateway Timeout, y por qué ocurre? Más importante aún, ¿cómo puedes solucionarlo o evitar que aparezca en tu aplicación, API o sitio web?

Si eres desarrollador, administrador de sistemas o simplemente un usuario web curioso, comprender qué causa un error 504 y cómo solucionarlo es increíblemente valioso.

Cubriremos todo eso en detalle, desde lo que significa este código, hasta las causas comunes y las soluciones prácticas.

💡

Al construir o probar sistemas distribuidos con múltiples dependencias de servicio, necesitas una herramienta que te ayude a identificar estos problemas de tiempo de espera. Descarga Apidog gratis; es una plataforma API todo en uno que te ayuda a probar el rendimiento de la API, configurar el monitoreo de endpoints lentos y depurar dependencias de servicios complejos antes de que causen errores 504 a tus usuarios.

button

Ahora, exploremos qué sucede tras bambalinas cuando te encuentras con un 504 Gateway Timeout.

La Arquitectura Web Moderna: Nunca es Solo un Servidor

Para entender el 504, necesitamos comprender cómo se construyen los sitios web y las aplicaciones modernas. Muy pocas aplicaciones se ejecutan ya en un solo servidor. La mayoría utiliza una arquitectura de múltiples capas que se ve así:

Navegador del Usuario: Realiza la solicitud inicial.
Balanceador de Carga / Proxy Inverso: Distribuye el tráfico a múltiples servidores backend (por ejemplo, NGINX, HAProxy, AWS ALB).
Servidores Web/de Aplicaciones: Ejecutan el código real de la aplicación (por ejemplo, Node.js, Python/Django, PHP).
Servicios Backend / APIs: Manejan tareas específicas como autenticación, pagos o procesamiento de datos (a menudo microservicios).
Base de Datos / Caché: Almacenan y recuperan datos.

El error 504 suele ocurrir entre los pasos 2 y 3, o entre los pasos 3 y 4. El "gateway" (puerta de enlace) en "Gateway Timeout" se refiere al servidor que actúa como intermediario: el balanceador de carga o el proxy inverso.

¿Qué Significa Realmente HTTP 504 Gateway Timeout?

El código de estado 504 Gateway Timeout indica que un servidor que actúa como puerta de enlace o proxy no recibió una respuesta a tiempo de un servidor ascendente al que necesitaba acceder para completar la solicitud.

En términos más simples: "Yo (la puerta de enlace) pedí ayuda a otro servidor, pero ese servidor tardó demasiado en responderme, así que me rindo y te digo que hay un problema."

Una respuesta 504 típica es bastante mínima:

HTTP/1.1 504 Gateway TimeoutContent-Type: text/htmlContent-Length: 125
<html><head><title>504 Gateway Timeout</title></head><body><center><h1>504 Gateway Timeout</h1></center></body></html>

A diferencia de otros errores, normalmente no hay un cuerpo personalizado porque la propia puerta de enlace es a menudo una pieza de infraestructura simple que no sabe cómo generar páginas de error elegantes.

Piénsalo de esta manera:

Le pides a tu amigo que compruebe si un restaurante está abierto. Tu amigo llama al restaurante, pero nadie contesta. Después de esperar un rato, tu amigo te dice:

“Lo siento, no contestaron, obtuve un tiempo de espera agotado.”

Eso es exactamente lo que sucede con un 504 Gateway Timeout.

La puerta de enlace (generalmente un proxy inverso como NGINX o un balanceador de carga) intenta conectarse a un servidor ascendente (como tu aplicación web o base de datos). Si ese servidor ascendente tarda demasiado en responder, la puerta de enlace arroja un 504 y aborta la solicitud.

La Cadena de Responsabilidad: Cómo Ocurre un 504

Veamos un ejemplo concreto utilizando una arquitectura de comercio electrónico común.

1. La Solicitud: Un usuario busca un producto. Su navegador envía una solicitud a https://shop.example.com/search?q=laptop.

2. El Rol del Balanceador de Carga: La solicitud llega primero a un balanceador de carga (la puerta de enlace). El trabajo del balanceador de carga es reenviar esta solicitud a uno de varios servidores de aplicaciones disponibles. El balanceador de carga tiene una configuración de tiempo de espera de, digamos, 30 segundos.

3. La Tarea del Servidor de Aplicaciones: El servidor de aplicaciones recibe la solicitud. Para cumplirla, necesita llamar a otros dos servicios:

Llama al Servicio de Búsqueda para obtener resultados de productos.
Llama al Servicio de Perfil de Usuario para obtener recomendaciones personalizadas.

4. El Problema: El Servicio de Perfil de Usuario está experimentando una carga alta o un interbloqueo de base de datos. Se queda atascado y no responde.

5. El Tiempo de Espera Agotado: El servidor de aplicaciones espera... 25 segundos... 28 segundos... 29 segundos... El balanceador de carga, aún esperando una respuesta del servidor de aplicaciones, alcanza su límite de tiempo de espera de 30 segundos.

6. La Respuesta 504: El balanceador de carga se rinde. No puede devolver los resultados de la búsqueda porque nunca los recibió del servidor de aplicaciones. Así que devuelve un 504 Gateway Timeout al navegador del usuario.

La clave aquí es que el servidor de aplicaciones podría seguir funcionando, intentando obtener una respuesta del Servicio de Perfil de Usuario. Pero el balanceador de carga ya ha cancelado la solicitud desde su perspectiva.

Cuándo Esperar un 504

Los 504 son más comunes en escenarios donde:

Tu aplicación depende de múltiples servicios o microservicios descendentes.
El servicio ascendente no está disponible temporalmente debido a mantenimiento o alta carga.
Una API o base de datos de terceros es lenta o no responde.
Las rutas de red experimentan latencia transitoria o pérdida de paquetes.

Dado que el 504 suele ser temporal, las estrategias de reintento y los disyuntores suelen entrar en juego como parte de un plan de resiliencia robusto.

Cuándo un 504 Podría Ser Aceptable

Hay casos legítimos en los que se espera o es aceptable un tiempo de espera de la puerta de enlace:

Ventanas de mantenimiento donde los servicios ascendentes se ralentizan o desconectan intencionalmente.
Picos temporales de tráfico que los servicios ascendentes no pueden absorber de inmediato.
Problemas de dependencia intermitentes que se están revirtiendo o mitigando.

En estos casos, la comunicación transparente y las políticas de reintento bien diseñadas ayudan a minimizar el impacto en el usuario.

Ejemplo de la Vida Real de un 504 Gateway Timeout

Imagina que estás construyendo un sitio web de comercio electrónico. Tu proceso de pago llama a múltiples APIs: pago, inventario, envío y autenticación de usuario.

Ahora, si la API de pago de repente se ralentiza o deja de estar disponible, tu servidor (que actúa como puerta de enlace) espera una respuesta. Si no la obtiene dentro del límite de tiempo de espera (digamos, 30 segundos), arroja:

504 Gateway Timeout

Para los usuarios, parece que tu sitio web está roto. Pero técnicamente, el problema reside en la cadena de comunicación entre servicios.

504 vs. Otros Errores 5xx: Conociendo la Diferencia

Es fácil confundir los errores del servidor, pero cada uno cuenta una historia diferente sobre lo que salió mal.

504 Gateway Timeout vs. 502 Bad Gateway:

504 significa "El servidor ascendente tardó demasiado en responder." (Problema de tiempo de espera)
502 significa "El servidor ascendente me envió algo inválido o basura." (La respuesta estaba mal formada o la conexión fue rechazada por completo).

504 Gateway Timeout vs. 500 Internal Server Error:

504 ocurre a nivel de infraestructura entre servidores.
500 ocurre a nivel de aplicación dentro de tu código (por ejemplo, una excepción no manejada en tu código Python o JavaScript).

504 Gateway Timeout vs. 408 Request Timeout:

504 es un tiempo de espera agotado del lado del servidor: una puerta de enlace agotó el tiempo de espera esperando a otro servidor.
408 es un tiempo de espera agotado del lado del cliente: un servidor agotó el tiempo de espera esperando que el cliente enviara la solicitud completa.

Causas Comunes del 504 Gateway Timeout

Comprender las causas es el primer paso hacia la prevención y resolución.

1. Servidores Backend Sobrecargados

Esta es la causa más común. Tus servidores de aplicaciones podrían estar bajo una carga pesada, lo que hace que respondan lentamente o no respondan en absoluto. Esto podría deberse a:

Un pico de tráfico
Consultas de base de datos ineficientes
Recursos de servidor insuficientes (CPU, RAM)

2. Problemas de Red

Los problemas de conectividad entre tu puerta de enlace y tus servidores backend pueden causar tiempos de espera agotados.

Congestión de la red
Reglas de firewall que bloquean el tráfico
Problemas de resolución de DNS

3. Operaciones Intensivas en Recursos

Algunas operaciones, naturalmente, tardan mucho tiempo:

Generación de informes complejos
Procesamiento de cargas de archivos grandes
Ejecución de inferencia de aprendizaje automático

Si estas operaciones exceden el umbral de tiempo de espera de tu puerta de enlace, causarán errores 504.

4. Dependencias del Servicio

Si tu aplicación depende de APIs externas o microservicios que son lentos o están caídos, tu servidor de aplicaciones esperará por ellos, lo que podría activar el tiempo de espera de la puerta de enlace.

5. Tiempos de Espera Mal Configurados

A veces, los tiempos de espera simplemente se configuran demasiado bajos. Una puerta de enlace podría tener un tiempo de espera de 10 segundos, pero una operación compleja legítima podría tardar 15 segundos.

Pruebas y Depuración de APIs con Apidog

Identificar la causa raíz de los errores 504 intermitentes puede ser como buscar una aguja en un pajar. Al depurar 504, los desarrolladores a menudo luchan con la visibilidad para determinar qué servidor, servicio o solicitud tiene la culpa. Apidog ofrece varias características que facilitan mucho esto.

Con Apidog, puedes:

Pruebas de Rendimiento: Usa Apidog para enviar múltiples solicitudes concurrentes a tu API y medir los tiempos de respuesta. Esto puede ayudarte a identificar si ciertos endpoints son lentos bajo carga, lo que podría conducir a 504s.
Configurar Monitoreo: Crea monitores automatizados en Apidog que verifiquen periódicamente tus endpoints. Si una solicitud tarda más de un umbral que establezcas (por ejemplo, 25 segundos cuando tu tiempo de espera de puerta de enlace es de 30), Apidog puede alertarte antes de que los usuarios empiecen a ver 504s.
Probar Dependencias de Servicio: Si tu API llama a otros servicios, usa Apidog para probar esas dependencias de forma independiente. Esto te ayuda a aislar si el problema está en tu aplicación o en un servicio descendente.
Simular Respuestas Lentas: Usa los servidores simulados de Apidog para simular respuestas lentas del backend. Esto te permite probar cómo tu puerta de enlace y aplicación manejan los tiempos de espera sin sobrecargar realmente tu sistema de producción.
Documentar Expectativas de Tiempo de Espera: Usa las funciones de documentación de Apidog para anotar qué endpoints se espera que sean de larga duración, ayudando a tu equipo a establecer valores de tiempo de espera apropiados en la infraestructura.

button

Y sí, puedes descargar Apidog gratis. No es solo otra alternativa a Postman, es un ecosistema completo para el diseño, prueba y monitoreo del rendimiento de APIs.

Resolución de Problemas y Solución de Errores 504

Pasos Inmediatos:

Verificar Recursos del Servidor: Revisa la CPU, memoria y E/S de disco en tus servidores de aplicaciones.
Revisar Registros (Logs): Consulta los registros de tu aplicación y puerta de enlace en busca de errores en el momento en que ocurrieron los 504s.
Verificar Dependencias Externas: Asegúrate de que cualquier API o servicio de terceros que utilice tu aplicación esté funcionando correctamente.

Soluciones a Largo Plazo:

Optimizar el Rendimiento de la Aplicación: Identifica y corrige consultas lentas de bases de datos, optimiza el código e implementa el almacenamiento en caché.
Ajustar la Configuración de Tiempos de Espera: Aumenta los valores de tiempo de espera en tu puerta de enlace si tienes operaciones legítimas de larga duración.
Implementar Disyuntores (Circuit Breakers): Utiliza patrones que detengan las llamadas a un servicio fallido después de múltiples fallos, evitando tiempos de espera en cascada.
Escalar tu Infraestructura: Agrega más servidores de aplicaciones o actualiza a instancias más potentes.
Implementar Procesamiento Asíncrono: Para tareas de larga duración, utiliza una cola de trabajos (como Redis Queue o AWS SQS) y devuelve inmediatamente un 202 Accepted, luego notifica al usuario cuando la tarea esté completa.

Mejores Prácticas para Prevenir Errores 504 a Largo Plazo

Concluyamos la parte técnica con algunas estrategias preventivas que te ahorrarán dolores de cabeza en el futuro.

1. Usa el Almacenamiento en Caché Siempre que Sea Posible

El almacenamiento en caché de las respuestas (a nivel de aplicación, CDN o proxy) reduce la carga del backend y el tiempo de respuesta.

2. Optimiza las Consultas de Base de Datos

Las consultas SQL mal optimizadas a menudo causan cuellos de botella en el backend; ajusta los índices y evita las uniones grandes.

3. Monitorea la Salud de la API

Utiliza herramientas como Apidog, Datadog o Pingdom para monitorear continuamente el tiempo de actividad y el rendimiento de la API.

4. Implementa Disyuntores (Circuit Breakers)

Agrega un patrón de disyuntor en tu API para detener temporalmente las solicitudes a servicios fallidos.

5. Escala Automáticamente

Utiliza el autoescalado en entornos de nube como AWS o Azure para manejar picos de tráfico repentinos.

6. Registra Todo

El registro centralizado te ayuda a detectar endpoints lentos antes de que se conviertan en interrupciones completas.

El Lado Humano: Comunicación Durante Interrupciones

La comunicación transparente durante los tiempos de espera de la puerta de enlace es importante. Informa a los usuarios cuando un servicio experimenta retrasos, ofrece un tiempo de recuperación esperado si es posible y proporciona actualizaciones de estado. Un plan de respuesta a incidentes bien gestionado reduce la frustración del usuario y genera confianza.

Patrones Arquitectónicos para Mitigar las Puertas de Enlace

Malla de servicios con políticas de tiempo de espera: Centraliza las configuraciones de tiempo de espera y el manejo de fallos.
Tiempos de espera por salto: Configura tiempos de espera apropiados en cada salto de la cadena de solicitud para evitar esperas prolongadas.
Contrapresión y colas: Almacena solicitudes en búfer durante la congestión para suavizar los picos.
Despliegues Canary: Implementa los cambios gradualmente para reducir el riesgo de retrasos ascendentes generalizados.
Servicios ascendentes redundantes: Proporciona servicios alternativos para reducir los puntos únicos de fallo.

Estos patrones te ayudan a contener el impacto de los retrasos ascendentes y a mantener intacta la experiencia del usuario.

Conclusión: El Precio de los Sistemas Distribuidos

El código de estado HTTP 504 Gateway Timeout es una consecuencia natural de la arquitectura web moderna y distribuida. Aunque frustrante para los usuarios, cumple un propósito importante: evitar que las solicitudes se queden colgadas indefinidamente y asegurar que el sistema general siga siendo responsivo.

Comprender que un 504 es fundamentalmente un problema de comunicación entre servidores, no necesariamente un error de aplicación, es la clave para una resolución de problemas efectiva. Al monitorear el rendimiento, optimizar las operaciones lentas y configurar correctamente tu infraestructura, puedes minimizar estos errores y proporcionar una mejor experiencia a tus usuarios.

La próxima vez que veas un error 504, sabrás que es la historia de un servidor de puerta de enlace paciente que finalmente tuvo que rendirse de esperar. Y cuando estés construyendo los sistemas que necesitan evitar estos tiempos de espera, una herramienta como Apidog puede ser tu mejor aliado para identificar cuellos de botella de rendimiento y asegurar que tus APIs respondan de manera oportuna.

button