En resumen
El agente interno de codificación de IA de Google, Agent Smith, ahora genera más del 25% del nuevo código de producción de la compañía. A diferencia de las herramientas de autocompletado como Copilot, Agent Smith trabaja asincrónicamente en segundo plano, escribiendo, probando e iterando código sin interacción humana. Para los equipos de API, esto plantea preguntas sobre la estabilidad de los contratos, la cobertura de pruebas, la desactualización de la documentación y los flujos de trabajo de revisión cuando una cuarta parte de su base de código es generada por máquina.
Introducción
Durante una llamada de ganancias en marzo de 2026, el CEO de Google, Sundar Pichai, reveló una cifra que hizo que toda la industria del software se detuviera: el código generado por IA ahora representa más del 25% del nuevo código producido en Google.
Esto no es autocompletado. No son sugerencias de Copilot aceptadas por desarrolladores. Es código que se envía a producción después de ser generado por IA. La herramienta detrás de esto, internamente llamada Agent Smith (un guiño al antagonista autorreplicante de The Matrix), se volvió tan popular entre los más de 180,000 empleados de Google que la compañía tuvo que restringir el acceso para gestionar la tensión de la infraestructura.
Agent Smith representa una categoría diferente de las herramientas de codificación de IA que la mayoría de los desarrolladores utilizan hoy en día. Mientras que Copilot y Claude Code asisten en tiempo real, Agent Smith trabaja en segundo plano. Los ingenieros asignan tareas, se ausentan y regresan más tarde para revisar el trabajo completado.
Para los equipos de desarrollo de API, este cambio de código "asistido por IA" a "generado por IA" plantea preguntas prácticas. Cuando el 25% de su base de código es escrita por un agente autónomo, ¿cómo mantiene estables los contratos de API? ¿Cómo se asegura de que las pruebas cubran los puntos finales generados por máquina? ¿Cómo evita que la documentación se desactualice?
Este artículo desglosa qué hace Agent Smith, cómo difiere de otras herramientas de codificación de IA y para qué deben prepararse los equipos de API.
Qué hace Agent Smith
Codificación autónoma asincrónica
Agent Smith no se sienta en su IDE esperando a que escriba. Opera asincrónicamente en segundo plano. Así es el flujo de trabajo:
- Un ingeniero describe una tarea en lenguaje natural
- Agent Smith descompone la tarea en subtareas
- Escribe código en varios archivos
- Ejecuta pruebas e itera sobre los fallos
- El ingeniero revisa el trabajo completado
Esto es fundamentalmente diferente de las sugerencias en línea de Copilot o las sesiones interactivas de Claude Code. Agent Smith es más parecido a un desarrollador junior que toma un ticket, desaparece por unas horas y regresa con una solicitud de extracción (pull request).
Los ingenieros pueden delegar tareas y verificar el progreso a través de la plataforma de chat interna de Google, incluso desde dispositivos móviles. La herramienta accede automáticamente a los perfiles de los empleados y a la documentación relevante, extrayendo contexto de la base de conocimientos interna de Google.
Construido sobre Gemini y Antigravity
Agent Smith funciona con la familia de modelos Gemini de Google, aumentada con sistemas de recuperación que le dan acceso a la vasta base de código y documentación interna de Google. Está construido sobre Antigravity, la plataforma de codificación de agentes existente de Google, pero la extiende con descomposición y ejecución autónoma de tareas.
La recuperación aumentada es clave. Agent Smith no genera código de forma aislada. Busca en la base de código interna de Google patrones similares, referencias a implementaciones existentes y sigue las convenciones de codificación internas. Esta conciencia del contexto es lo que permite una salida de calidad de producción a la escala del 25%.
Qué significa "25% de código nuevo"
La cifra de Pichai necesita contexto. "25% de código nuevo" se refiere a código que:
- Es generado por IA, no autocompletado
- Pasa la revisión de código (los ingenieros humanos aún revisan la salida de Agent Smith)
- Se envía a sistemas de producción
- Se mide en toda la producción de ingeniería de Google
Esto no significa que el 25% de la base de código total de Google sea generada por IA. Significa que el 25% del código nuevo que se escribe hoy proviene de Agent Smith. La distinción importa porque el código nuevo es aditivo a una base de código existente escrita por humanos. Pero la trayectoria es clara: el porcentaje está creciendo, y Pichai lo destacó como una ventaja estratégica.
Cómo Agent Smith difiere de otras herramientas de codificación de IA
El espectro de herramientas de codificación de IA
| Herramienta | Modo | Interacción | Alcance | ¿Código de producción? |
|---|---|---|---|---|
| GitHub Copilot | Autocompletado en tiempo real | En línea en el IDE | Nivel de línea/función | Después de la aceptación humana |
| Claude Code | Sesión interactiva | Conversacional | Cambios de varios archivos | Después de la revisión humana |
| Cursor Agent | Fondo + interactivo | Integrado en el IDE | Nivel de proyecto | Después de la revisión humana |
| Agent Smith | Autónomo asincrónico | Delegación de tareas | Implementación de características completas | Después de la revisión humana |
| KAIROS (no lanzado) | Daemon siempre activo | Monitoreo en segundo plano | A nivel de repositorio | Por determinar |
Agent Smith se encuentra en el extremo autónomo de este espectro. El único paso más allá sería un despliegue completamente autónomo sin revisión humana, lo cual ninguna herramienta importante hace todavía (y no debería).
Por qué la asincronía es importante para los equipos de API
Las herramientas de codificación de IA en tiempo real (Copilot, Claude Code) funcionan dentro del flujo del desarrollador. El desarrollador ve lo que escribe la IA, entiende el contexto y realiza correcciones en el momento.
Los agentes asincrónicos cambian esta dinámica. Cuando Agent Smith escribe un punto final de API, el desarrollador lo revisa después. La revisión está separada del contexto de creación. Esto significa que:
- Es posible que el desarrollador no entienda por qué el agente eligió un formato de respuesta particular
- Los cambios en el contrato de la API pueden no ser obvios en una revisión de código estándar
- Los artefactos relacionados (pruebas, documentación, simulacros) pueden no haber sido actualizados
- Los cambios drásticos podrían pasar desapercibidos si el revisor no verifica el impacto completo
Qué se rompe cuando la IA escribe el código de su API
Desactualización del contrato de API
Un contrato de API es el acuerdo entre su servicio y sus consumidores: puntos finales, esquemas de solicitud/respuesta, códigos de estado, formatos de error. Cuando un desarrollador humano modifica una API, generalmente actualiza la especificación OpenAPI, notifica a los consumidores y versiona el cambio.
Cuando un agente autónomo modifica una API, esos pasos de coordinación no ocurren automáticamente. Agent Smith escribe código que pasa las pruebas. Pero las pruebas solo cubren lo que se escribió previamente. Si el agente cambia un esquema de respuesta de una manera que pasa las pruebas existentes pero rompe a los consumidores descendentes, la ruptura aparece en producción.
Escenario de ejemplo:
- A Agent Smith se le encarga "Agregar preferencias de usuario al punto final del perfil"
- Agrega un campo
preferencesa la respuestaGET /api/users/{id} - Las pruebas existentes pasan porque no afirman la ausencia de campos adicionales
- Los tipos TypeScript del equipo de front-end no incluyen
preferences - El análisis JSON estricto de la aplicación móvil falla con el campo inesperado
El código es correcto. Las pruebas pasan. El contrato está roto.
Brechas en la cobertura de pruebas
El código generado por IA viene con pruebas generadas por IA, y los agentes de IA tienden a escribir pruebas que validan lo que construyeron, no pruebas que protegen contra regresiones. Esto crea un punto ciego: las pruebas confirman que el nuevo comportamiento funciona, pero no confirman que el comportamiento existente se conserva.
Para los puntos finales de API, esto significa que:
- Es posible que no se prueben los puntos de referencia de tiempo de respuesta
- Los formatos de respuesta de error pueden diferir de su esquema de error estándar
- Es posible que no se valide el comportamiento de limitación de velocidad
- Es posible que no se cubran los casos extremos de autenticación
- El comportamiento de paginación puede diferir de los puntos finales existentes
Desactualización de la documentación
Si la documentación de su API se genera a partir de anotaciones de código o especificaciones OpenAPI, el código modificado por el agente debería propagarse a la documentación automáticamente. Pero muchos equipos mantienen la documentación por separado. Cuando Agent Smith agrega un punto final o modifica un esquema de respuesta, la actualización de la documentación es una tarea separada que el agente puede o no realizar.
Incluso con documentación generada automáticamente, las descripciones, ejemplos y notas de uso requieren un contexto humano que un agente de IA no tiene. El agente puede documentar lo que hace un punto final. No puede documentar por qué existe, quién lo usa o qué compensaciones llevaron a su diseño.
Fatiga de revisión
Cuando el 25% del código es generado por IA, el 25% de las revisiones de código están revisando la salida de la IA. El código generado por IA es sintácticamente consistente y bien estructurado, lo que lo hace parecer "bien" a primera vista. Pero parecer bien no es lo mismo que ser correcto en contexto.
Los revisores se enfrentan a un nuevo desafío: el código se lee bien, pero puede no alinearse con las decisiones arquitectónicas, las convenciones del equipo o los requisitos no expresados que existen en la mente del revisor pero no en la solicitud del agente. Con el tiempo, la fatiga de revisión para el código generado por IA puede llevar a la aprobación automática (rubber-stamping), que es el punto en el que los errores comienzan a enviarse.
Cómo construir flujos de trabajo de API a prueba de agentes
1. Hacer de los contratos de API la fuente de verdad
El desarrollo de API "design-first" (primero el diseño) es la defensa más fuerte contra la desactualización inducida por agentes. Cuando la especificación OpenAPI es la fuente de verdad, cualquier cambio de código que rompa el contrato es detectable.
Sin "design-first":
Cambio de código → Pruebas pasan → Despliegue → Contrato roto
Con "design-first":
La especificación define el contrato → El código debe coincidir con la especificación → La validación del contrato detecta la desactualización
El diseñador visual de API de Apidog le permite definir puntos finales, esquemas y formatos de respuesta antes de que se escriba cualquier código. Cuando Agent Smith (o cualquier agente) genera código, usted lo valida contra la especificación, no contra las pruebas existentes que pueden estar incompletas.
2. Usar pruebas de contrato, no pruebas unitarias
Las pruebas unitarias validan el comportamiento interno. Las pruebas de contrato validan el acuerdo entre servicios. Cuando un agente de IA modifica su API, las pruebas de contrato detectan cambios que las pruebas unitarias pasan por alto.
Ejemplo de prueba de contrato:
// Esta prueba falla si la forma de la respuesta cambia,
// incluso si la nueva forma es "válida"
describe("GET /api/users/:id contract", async () => {
it("returns expected schema", async () => {
const response = await request(app).get("/api/users/123");
expect(response.body).toMatchSchema({
type: "object",
required: ["id", "name", "email", "created_at"],
properties: {
id: { type: "string" },
name: { type: "string" },
email: { type: "string", format: "email" },
created_at: { type: "string", format: "date-time" }
},
additionalProperties: false // Esto detecta campos inesperados
});
});
});
La línea additionalProperties: false es crítica. Sin ella, un agente que agrega campos a la respuesta pasa todas las pruebas. Con ella, cualquier cambio de esquema requiere actualizaciones explícitas del contrato.
Apidog automatiza las pruebas de contrato desde la especificación de su API. Defina su esquema una vez, y Apidog validará cada respuesta contra él tanto en pruebas manuales como en ejecuciones de CI/CD.
3. Restringir despliegues por validación de especificaciones
Agregue la validación de la especificación de la API a su pipeline de CI/CD. Antes de que cualquier código (humano o generado por IA) se despliegue, verifique que coincida con el contrato declarado:
# Paso del pipeline de CI/CD
- name: Validar contrato de API
run: |
# Comparar la especificación actual con la implementación en ejecución
apidog run --test-scenario-id CONTRACT_TESTS
# Fallar si se encuentran violaciones de contrato
if [ $? -ne 0 ]; then
echo "Violación de contrato de API detectada. Revisar cambios."
exit 1
fi
Esto detecta los cambios que rompen el contrato de Agent Smith antes de que lleguen a producción.
4. Requerir actualizaciones de la especificación para cambios en la API
Cree una regla de desarrollo: cualquier PR (Pull Request) que modifique el comportamiento de la API debe incluir una actualización correspondiente de la especificación OpenAPI. Para los PR generados por IA, esto significa que el agente debe actualizar la especificación, o un humano debe hacerlo antes de fusionar.
En Apidog, los cambios en la especificación se propagan automáticamente a:
- Documentación de la API
- Respuestas del servidor simulado (mock server)
- Afirmaciones de prueba
- Tipos de SDK de cliente
Esta cascada asegura que ningún artefacto se desvíe cuando el contrato cambia.
5. Monitorear el comportamiento de la API en producción
Incluso con pruebas de contrato y validación de especificaciones, el monitoreo de producción detecta lo que las pruebas de preproducción pasan por alto. Rastree:
- Violaciones de esquema de respuesta: Registre cuando las respuestas no coincidan con el esquema declarado
- Aparición de nuevos campos: Alerta sobre campos de respuesta que no están en la especificación
- Cambios en la tasa de error: Los puntos finales generados por IA pueden tener diferentes distribuciones de error
- Cambios en la latencia: El código escrito por agentes puede tener diferentes características de rendimiento
- Cambios en el patrón de tráfico: Los nuevos puntos finales pueden recibir patrones de tráfico inesperados
6. Separar la revisión de la API de la revisión de código
La revisión de código estándar pregunta: "¿Funciona este código?". La revisión de API pregunta: "¿Este cambio afecta a los consumidores?".
Para los cambios de API generados por IA, cree una lista de verificación de revisión separada:
- ¿Este cambio rompe algún consumidor existente?
- ¿Está actualizada la especificación OpenAPI?
- ¿Se han versionado los cambios incompatibles con versiones anteriores?
- ¿Las respuestas de error son consistentes con el formato de error existente?
- ¿Están documentados los nuevos puntos finales con ejemplos?
- ¿Se ha notificado a los equipos descendentes?
La trayectoria: hacia dónde se dirige la codificación autónoma
Agent Smith hoy vs. mañana
Agent Smith con un 25% es el punto de partida. Sergey Brin calificó a los agentes de IA como un "gran foco" durante una reunión de ventas en marzo de 2026. La cifra del 25% crecerá a medida que la herramienta mejore, las restricciones de acceso se relajen y los flujos de trabajo se adapten.
Otras compañías están construyendo sistemas similares:
- KAIROS de Claude Code (filtrado en el código fuente): daemon siempre activo con suscripciones a webhooks de GitHub y trabajadores en segundo plano
- Modo Agente de GitHub Copilot: tareas de codificación de varios pasos con edición autónoma de archivos
- CodeWhisperer de Amazon: expandiéndose desde el autocompletado hacia flujos de trabajo de agentes
La tendencia de la industria es clara: las herramientas de codificación de IA están pasando de "asistente" a "colaborador autónomo" a "infraestructura en segundo plano". Dentro de unos años, la pregunta no será si la IA escribe el código de su API, sino cuánto de él.
Para qué deben prepararse los equipos de API ahora
El diseño "design-first" ya no es opcional. Cuando los agentes escriben código, la especificación de la API es el único artefacto estable. Conviértala en la fuente de verdad ahora, antes de que la adopción de agentes lo haga urgente.
Invierta en infraestructura de pruebas de contrato. Las pruebas unitarias no son suficientes cuando el autor del código no entiende sus convenciones no escritas. Las pruebas de contrato codifican esas convenciones explícitamente.
Elija herramientas que mantengan los artefactos sincronizados. Las herramientas desconectadas (cliente de API separado, ejecutor de pruebas separado, servidor simulado separado, generador de documentos separado) crean oportunidades de desactualización que los agentes explotan. Las plataformas integradas como Apidog mantienen todo sincronizado.
Construya procesos de revisión para el código generado por IA. La revisión de código estándar no detecta violaciones de contrato de API. Cree listas de verificación y validación automatizada específicamente para cambios de API.
Pruebe Apidog gratis para construir flujos de trabajo de API que se mantengan consistentes, ya sea que su próximo cambio de código provenga de un desarrollador humano, Agent Smith o cualquier herramienta de codificación autónoma que venga después.
Preguntas frecuentes
¿Qué es Google Agent Smith?
Agent Smith es el agente interno de codificación de IA de Google, construido sobre la familia de modelos Gemini y la plataforma Antigravity. Trabaja asincrónicamente en segundo plano: los ingenieros asignan tareas, y Agent Smith escribe, prueba e itera código sin interacción humana en tiempo real. Generó más del 25% del nuevo código de producción de Google a partir de marzo de 2026.
¿Está Agent Smith disponible fuera de Google?
No. Agent Smith es una herramienta interna restringida a los empleados de Google. Google no ha anunciado planes para un lanzamiento público. La tecnología es similar al modo Agente de Copilot y a Claude Code, pero está más profundamente integrada con la base de código y los sistemas de documentación internos de Google.
¿El código generado por IA rompe los contratos de API?
Puede hacerlo. Los agentes de IA escriben código que pasa las pruebas, pero es posible que las pruebas no cubran todos los aspectos de su contrato de API. Los cambios de esquema, los nuevos campos de respuesta, los diferentes formatos de error y las modificaciones de comportamiento pueden pasar desapercibidos en las pruebas mientras rompen a los consumidores descendentes. Las pruebas de contrato y el desarrollo "design-first" previenen esto.
¿Deberían preocuparse los equipos de API por Agent Smith?
No por Agent Smith específicamente, ya que es interno de Google. Pero sí por la tendencia que representa. Herramientas de codificación autónoma similares (modo Agente de Copilot, KAIROS y otras) llegarán a su equipo. Preparar su flujo de trabajo de API ahora, con desarrollo "design-first", pruebas de contrato y herramientas integradas, lo posiciona para adoptar agentes autónomos de forma segura.
¿Cómo evito que los agentes de IA rompan mis API?
Utilice el desarrollo "design-first" con la especificación OpenAPI como fuente de verdad. Agregue pruebas de contrato con additionalProperties: false para detectar cambios inesperados en el esquema. Restrinja los despliegues con la validación de la especificación. Utilice una plataforma integrada como Apidog que sincroniza las especificaciones, pruebas, simulacros y documentos automáticamente.
¿Cuál es la diferencia entre el código asistido por IA y el código generado por IA?
El código asistido por IA (sugerencias de Copilot, sesiones de Claude Code) se escribe en tiempo real con supervisión humana. El desarrollador ve y aprueba cada cambio. El código generado por IA (Agent Smith) se produce asincrónicamente sin intervención humana en tiempo real. El desarrollador revisa el trabajo completado después del hecho. Esta diferencia cambia la dinámica de revisión y aumenta el riesgo de violaciones de contrato no detectadas.
¿Los agentes de IA reemplazarán a los desarrolladores de API?
No. Agent Smith todavía requiere definición de tareas humanas, revisión de código y aprobación de despliegue. Un estudio del MIT de marzo de 2026 confirmó que la IA aumenta la productividad del desarrollador, pero no reemplaza el juicio, la conciencia del contexto y el pensamiento arquitectónico que proporcionan los humanos. El rol cambia de escribir código a definir tareas, revisar la salida y mantener la coherencia del sistema.
Conclusiones clave
- Agent Smith de Google genera el 25% del nuevo código de producción mediante una operación autónoma y asincrónica
- Esto representa un cambio de código asistido por IA a código generado por IA, cambiando la dinámica de revisión para los equipos de API
- La desactualización del contrato de API es el riesgo principal cuando los agentes autónomos modifican los puntos finales y los esquemas
- El desarrollo "design-first" con las especificaciones OpenAPI como fuente de verdad previene la ruptura de contratos
- Las pruebas de contrato con validación estricta de esquemas detectan cambios que las pruebas unitarias pasan por alto
- Las plataformas integradas como Apidog sincronizan especificaciones, pruebas, simulacros y documentos para evitar la desactualización
- La tendencia hacia los agentes de codificación autónomos se está acelerando; prepare sus flujos de trabajo de API ahora
Agent Smith con un 25% es el principio. Las empresas que construyan flujos de trabajo de API a prueba de agentes hoy serán las que adopten herramientas de codificación autónoma de forma segura mañana.
