Agente Smith de Google Escribe el 25% del Código: Lo que los Equipos API Deben Saber

En resumen

El agente interno de codificación de IA de Google, Agent Smith, ahora genera más del 25% del nuevo código de producción de la compañía. A diferencia de las herramientas de autocompletado como Copilot, Agent Smith trabaja asincrónicamente en segundo plano, escribiendo, probando e iterando código sin interacción humana. Para los equipos de API, esto plantea preguntas sobre la estabilidad de los contratos, la cobertura de pruebas, la desactualización de la documentación y los flujos de trabajo de revisión cuando una cuarta parte de su base de código es generada por máquina.

Introducción

Durante una llamada de ganancias en marzo de 2026, el CEO de Google, Sundar Pichai, reveló una cifra que hizo que toda la industria del software se detuviera: el código generado por IA ahora representa más del 25% del nuevo código producido en Google.

Esto no es autocompletado. No son sugerencias de Copilot aceptadas por desarrolladores. Es código que se envía a producción después de ser generado por IA. La herramienta detrás de esto, internamente llamada Agent Smith (un guiño al antagonista autorreplicante de The Matrix), se volvió tan popular entre los más de 180,000 empleados de Google que la compañía tuvo que restringir el acceso para gestionar la tensión de la infraestructura.

Agent Smith representa una categoría diferente de las herramientas de codificación de IA que la mayoría de los desarrolladores utilizan hoy en día. Mientras que Copilot y Claude Code asisten en tiempo real, Agent Smith trabaja en segundo plano. Los ingenieros asignan tareas, se ausentan y regresan más tarde para revisar el trabajo completado.

Para los equipos de desarrollo de API, este cambio de código "asistido por IA" a "generado por IA" plantea preguntas prácticas. Cuando el 25% de su base de código es escrita por un agente autónomo, ¿cómo mantiene estables los contratos de API? ¿Cómo se asegura de que las pruebas cubran los puntos finales generados por máquina? ¿Cómo evita que la documentación se desactualice?

💡

La plataforma integrada del ciclo de vida de las API de Apidog mantiene el diseño, las pruebas, los simulacros y la documentación sincronizados, independientemente de si un humano o un agente de IA realiza el cambio. Pruebe Apidog gratis para construir flujos de trabajo de API a prueba de agentes.

botón

Este artículo desglosa qué hace Agent Smith, cómo difiere de otras herramientas de codificación de IA y para qué deben prepararse los equipos de API.

Qué hace Agent Smith

Codificación autónoma asincrónica

Agent Smith no se sienta en su IDE esperando a que escriba. Opera asincrónicamente en segundo plano. Así es el flujo de trabajo:

Un ingeniero describe una tarea en lenguaje natural
Agent Smith descompone la tarea en subtareas
Escribe código en varios archivos
Ejecuta pruebas e itera sobre los fallos
El ingeniero revisa el trabajo completado

Esto es fundamentalmente diferente de las sugerencias en línea de Copilot o las sesiones interactivas de Claude Code. Agent Smith es más parecido a un desarrollador junior que toma un ticket, desaparece por unas horas y regresa con una solicitud de extracción (pull request).

Los ingenieros pueden delegar tareas y verificar el progreso a través de la plataforma de chat interna de Google, incluso desde dispositivos móviles. La herramienta accede automáticamente a los perfiles de los empleados y a la documentación relevante, extrayendo contexto de la base de conocimientos interna de Google.

Construido sobre Gemini y Antigravity

Agent Smith funciona con la familia de modelos Gemini de Google, aumentada con sistemas de recuperación que le dan acceso a la vasta base de código y documentación interna de Google. Está construido sobre Antigravity, la plataforma de codificación de agentes existente de Google, pero la extiende con descomposición y ejecución autónoma de tareas.

La recuperación aumentada es clave. Agent Smith no genera código de forma aislada. Busca en la base de código interna de Google patrones similares, referencias a implementaciones existentes y sigue las convenciones de codificación internas. Esta conciencia del contexto es lo que permite una salida de calidad de producción a la escala del 25%.

Qué significa "25% de código nuevo"

La cifra de Pichai necesita contexto. "25% de código nuevo" se refiere a código que:

Es generado por IA, no autocompletado
Pasa la revisión de código (los ingenieros humanos aún revisan la salida de Agent Smith)
Se envía a sistemas de producción
Se mide en toda la producción de ingeniería de Google

Esto no significa que el 25% de la base de código total de Google sea generada por IA. Significa que el 25% del código nuevo que se escribe hoy proviene de Agent Smith. La distinción importa porque el código nuevo es aditivo a una base de código existente escrita por humanos. Pero la trayectoria es clara: el porcentaje está creciendo, y Pichai lo destacó como una ventaja estratégica.

Cómo Agent Smith difiere de otras herramientas de codificación de IA

El espectro de herramientas de codificación de IA

Herramienta	Modo	Interacción	Alcance	¿Código de producción?
GitHub Copilot	Autocompletado en tiempo real	En línea en el IDE	Nivel de línea/función	Después de la aceptación humana
Claude Code	Sesión interactiva	Conversacional	Cambios de varios archivos	Después de la revisión humana
Cursor Agent	Fondo + interactivo	Integrado en el IDE	Nivel de proyecto	Después de la revisión humana
Agent Smith	Autónomo asincrónico	Delegación de tareas	Implementación de características completas	Después de la revisión humana
KAIROS (no lanzado)	Daemon siempre activo	Monitoreo en segundo plano	A nivel de repositorio	Por determinar

Agent Smith se encuentra en el extremo autónomo de este espectro. El único paso más allá sería un despliegue completamente autónomo sin revisión humana, lo cual ninguna herramienta importante hace todavía (y no debería).

Por qué la asincronía es importante para los equipos de API

Las herramientas de codificación de IA en tiempo real (Copilot, Claude Code) funcionan dentro del flujo del desarrollador. El desarrollador ve lo que escribe la IA, entiende el contexto y realiza correcciones en el momento.

Los agentes asincrónicos cambian esta dinámica. Cuando Agent Smith escribe un punto final de API, el desarrollador lo revisa después. La revisión está separada del contexto de creación. Esto significa que:

Es posible que el desarrollador no entienda por qué el agente eligió un formato de respuesta particular
Los cambios en el contrato de la API pueden no ser obvios en una revisión de código estándar
Los artefactos relacionados (pruebas, documentación, simulacros) pueden no haber sido actualizados
Los cambios drásticos podrían pasar desapercibidos si el revisor no verifica el impacto completo

Qué se rompe cuando la IA escribe el código de su API

Desactualización del contrato de API

Un contrato de API es el acuerdo entre su servicio y sus consumidores: puntos finales, esquemas de solicitud/respuesta, códigos de estado, formatos de error. Cuando un desarrollador humano modifica una API, generalmente actualiza la especificación OpenAPI, notifica a los consumidores y versiona el cambio.

Cuando un agente autónomo modifica una API, esos pasos de coordinación no ocurren automáticamente. Agent Smith escribe código que pasa las pruebas. Pero las pruebas solo cubren lo que se escribió previamente. Si el agente cambia un esquema de respuesta de una manera que pasa las pruebas existentes pero rompe a los consumidores descendentes, la ruptura aparece en producción.

Escenario de ejemplo:

A Agent Smith se le encarga "Agregar preferencias de usuario al punto final del perfil"
Agrega un campo preferences a la respuesta GET /api/users/{id}
Las pruebas existentes pasan porque no afirman la ausencia de campos adicionales
Los tipos TypeScript del equipo de front-end no incluyen preferences
El análisis JSON estricto de la aplicación móvil falla con el campo inesperado

El código es correcto. Las pruebas pasan. El contrato está roto.

Brechas en la cobertura de pruebas

El código generado por IA viene con pruebas generadas por IA, y los agentes de IA tienden a escribir pruebas que validan lo que construyeron, no pruebas que protegen contra regresiones. Esto crea un punto ciego: las pruebas confirman que el nuevo comportamiento funciona, pero no confirman que el comportamiento existente se conserva.

Para los puntos finales de API, esto significa que:

Es posible que no se prueben los puntos de referencia de tiempo de respuesta
Los formatos de respuesta de error pueden diferir de su esquema de error estándar
Es posible que no se valide el comportamiento de limitación de velocidad
Es posible que no se cubran los casos extremos de autenticación
El comportamiento de paginación puede diferir de los puntos finales existentes

Desactualización de la documentación

Si la documentación de su API se genera a partir de anotaciones de código o especificaciones OpenAPI, el código modificado por el agente debería propagarse a la documentación automáticamente. Pero muchos equipos mantienen la documentación por separado. Cuando Agent Smith agrega un punto final o modifica un esquema de respuesta, la actualización de la documentación es una tarea separada que el agente puede o no realizar.

Incluso con documentación generada automáticamente, las descripciones, ejemplos y notas de uso requieren un contexto humano que un agente de IA no tiene. El agente puede documentar lo que hace un punto final. No puede documentar por qué existe, quién lo usa o qué compensaciones llevaron a su diseño.

Fatiga de revisión

Cuando el 25% del código es generado por IA, el 25% de las revisiones de código están revisando la salida de la IA. El código generado por IA es sintácticamente consistente y bien estructurado, lo que lo hace parecer "bien" a primera vista. Pero parecer bien no es lo mismo que ser correcto en contexto.

Los revisores se enfrentan a un nuevo desafío: el código se lee bien, pero puede no alinearse con las decisiones arquitectónicas, las convenciones del equipo o los requisitos no expresados que existen en la mente del revisor pero no en la solicitud del agente. Con el tiempo, la fatiga de revisión para el código generado por IA puede llevar a la aprobación automática (rubber-stamping), que es el punto en el que los errores comienzan a enviarse.

Cómo construir flujos de trabajo de API a prueba de agentes

1. Hacer de los contratos de API la fuente de verdad

El desarrollo de API "design-first" (primero el diseño) es la defensa más fuerte contra la desactualización inducida por agentes. Cuando la especificación OpenAPI es la fuente de verdad, cualquier cambio de código que rompa el contrato es detectable.

Sin "design-first":

Cambio de código → Pruebas pasan → Despliegue → Contrato roto

Con "design-first":

La especificación define el contrato → El código debe coincidir con la especificación → La validación del contrato detecta la desactualización

El diseñador visual de API de Apidog le permite definir puntos finales, esquemas y formatos de respuesta antes de que se escriba cualquier código. Cuando Agent Smith (o cualquier agente) genera código, usted lo valida contra la especificación, no contra las pruebas existentes que pueden estar incompletas.

2. Usar pruebas de contrato, no pruebas unitarias

Las pruebas unitarias validan el comportamiento interno. Las pruebas de contrato validan el acuerdo entre servicios. Cuando un agente de IA modifica su API, las pruebas de contrato detectan cambios que las pruebas unitarias pasan por alto.

Ejemplo de prueba de contrato:

// Esta prueba falla si la forma de la respuesta cambia,
// incluso si la nueva forma es "válida"
describe("GET /api/users/:id contract", async () => {
  it("returns expected schema", async () => {
    const response = await request(app).get("/api/users/123");

    expect(response.body).toMatchSchema({
      type: "object",
      required: ["id", "name", "email", "created_at"],
      properties: {
        id: { type: "string" },
        name: { type: "string" },
        email: { type: "string", format: "email" },
        created_at: { type: "string", format: "date-time" }
      },
      additionalProperties: false  // Esto detecta campos inesperados
    });
  });
});

La línea additionalProperties: false es crítica. Sin ella, un agente que agrega campos a la respuesta pasa todas las pruebas. Con ella, cualquier cambio de esquema requiere actualizaciones explícitas del contrato.

Apidog automatiza las pruebas de contrato desde la especificación de su API. Defina su esquema una vez, y Apidog validará cada respuesta contra él tanto en pruebas manuales como en ejecuciones de CI/CD.

3. Restringir despliegues por validación de especificaciones

Agregue la validación de la especificación de la API a su pipeline de CI/CD. Antes de que cualquier código (humano o generado por IA) se despliegue, verifique que coincida con el contrato declarado:

# Paso del pipeline de CI/CD
- name: Validar contrato de API
  run: |
    # Comparar la especificación actual con la implementación en ejecución
    apidog run --test-scenario-id CONTRACT_TESTS
    
    # Fallar si se encuentran violaciones de contrato
    if [ $? -ne 0 ]; then
      echo "Violación de contrato de API detectada. Revisar cambios."
      exit 1
    fi

Esto detecta los cambios que rompen el contrato de Agent Smith antes de que lleguen a producción.

4. Requerir actualizaciones de la especificación para cambios en la API

Cree una regla de desarrollo: cualquier PR (Pull Request) que modifique el comportamiento de la API debe incluir una actualización correspondiente de la especificación OpenAPI. Para los PR generados por IA, esto significa que el agente debe actualizar la especificación, o un humano debe hacerlo antes de fusionar.

En Apidog, los cambios en la especificación se propagan automáticamente a:

Documentación de la API
Respuestas del servidor simulado (mock server)
Afirmaciones de prueba
Tipos de SDK de cliente

Esta cascada asegura que ningún artefacto se desvíe cuando el contrato cambia.

5. Monitorear el comportamiento de la API en producción

Incluso con pruebas de contrato y validación de especificaciones, el monitoreo de producción detecta lo que las pruebas de preproducción pasan por alto. Rastree:

Violaciones de esquema de respuesta: Registre cuando las respuestas no coincidan con el esquema declarado
Aparición de nuevos campos: Alerta sobre campos de respuesta que no están en la especificación
Cambios en la tasa de error: Los puntos finales generados por IA pueden tener diferentes distribuciones de error
Cambios en la latencia: El código escrito por agentes puede tener diferentes características de rendimiento
Cambios en el patrón de tráfico: Los nuevos puntos finales pueden recibir patrones de tráfico inesperados

6. Separar la revisión de la API de la revisión de código

La revisión de código estándar pregunta: "¿Funciona este código?". La revisión de API pregunta: "¿Este cambio afecta a los consumidores?".

Para los cambios de API generados por IA, cree una lista de verificación de revisión separada:

¿Este cambio rompe algún consumidor existente?
¿Está actualizada la especificación OpenAPI?
¿Se han versionado los cambios incompatibles con versiones anteriores?
¿Las respuestas de error son consistentes con el formato de error existente?
¿Están documentados los nuevos puntos finales con ejemplos?
¿Se ha notificado a los equipos descendentes?

La trayectoria: hacia dónde se dirige la codificación autónoma

Agent Smith hoy vs. mañana

Agent Smith con un 25% es el punto de partida. Sergey Brin calificó a los agentes de IA como un "gran foco" durante una reunión de ventas en marzo de 2026. La cifra del 25% crecerá a medida que la herramienta mejore, las restricciones de acceso se relajen y los flujos de trabajo se adapten.

Otras compañías están construyendo sistemas similares:

KAIROS de Claude Code (filtrado en el código fuente): daemon siempre activo con suscripciones a webhooks de GitHub y trabajadores en segundo plano
Modo Agente de GitHub Copilot: tareas de codificación de varios pasos con edición autónoma de archivos
CodeWhisperer de Amazon: expandiéndose desde el autocompletado hacia flujos de trabajo de agentes

La tendencia de la industria es clara: las herramientas de codificación de IA están pasando de "asistente" a "colaborador autónomo" a "infraestructura en segundo plano". Dentro de unos años, la pregunta no será si la IA escribe el código de su API, sino cuánto de él.

Para qué deben prepararse los equipos de API ahora

El diseño "design-first" ya no es opcional. Cuando los agentes escriben código, la especificación de la API es el único artefacto estable. Conviértala en la fuente de verdad ahora, antes de que la adopción de agentes lo haga urgente.

Invierta en infraestructura de pruebas de contrato. Las pruebas unitarias no son suficientes cuando el autor del código no entiende sus convenciones no escritas. Las pruebas de contrato codifican esas convenciones explícitamente.

Elija herramientas que mantengan los artefactos sincronizados. Las herramientas desconectadas (cliente de API separado, ejecutor de pruebas separado, servidor simulado separado, generador de documentos separado) crean oportunidades de desactualización que los agentes explotan. Las plataformas integradas como Apidog mantienen todo sincronizado.

Construya procesos de revisión para el código generado por IA. La revisión de código estándar no detecta violaciones de contrato de API. Cree listas de verificación y validación automatizada específicamente para cambios de API.

Pruebe Apidog gratis para construir flujos de trabajo de API que se mantengan consistentes, ya sea que su próximo cambio de código provenga de un desarrollador humano, Agent Smith o cualquier herramienta de codificación autónoma que venga después.

botón

Preguntas frecuentes

¿Qué es Google Agent Smith?

Agent Smith es el agente interno de codificación de IA de Google, construido sobre la familia de modelos Gemini y la plataforma Antigravity. Trabaja asincrónicamente en segundo plano: los ingenieros asignan tareas, y Agent Smith escribe, prueba e itera código sin interacción humana en tiempo real. Generó más del 25% del nuevo código de producción de Google a partir de marzo de 2026.

¿Está Agent Smith disponible fuera de Google?

No. Agent Smith es una herramienta interna restringida a los empleados de Google. Google no ha anunciado planes para un lanzamiento público. La tecnología es similar al modo Agente de Copilot y a Claude Code, pero está más profundamente integrada con la base de código y los sistemas de documentación internos de Google.

¿El código generado por IA rompe los contratos de API?

Puede hacerlo. Los agentes de IA escriben código que pasa las pruebas, pero es posible que las pruebas no cubran todos los aspectos de su contrato de API. Los cambios de esquema, los nuevos campos de respuesta, los diferentes formatos de error y las modificaciones de comportamiento pueden pasar desapercibidos en las pruebas mientras rompen a los consumidores descendentes. Las pruebas de contrato y el desarrollo "design-first" previenen esto.

¿Deberían preocuparse los equipos de API por Agent Smith?

No por Agent Smith específicamente, ya que es interno de Google. Pero sí por la tendencia que representa. Herramientas de codificación autónoma similares (modo Agente de Copilot, KAIROS y otras) llegarán a su equipo. Preparar su flujo de trabajo de API ahora, con desarrollo "design-first", pruebas de contrato y herramientas integradas, lo posiciona para adoptar agentes autónomos de forma segura.

¿Cómo evito que los agentes de IA rompan mis API?

Utilice el desarrollo "design-first" con la especificación OpenAPI como fuente de verdad. Agregue pruebas de contrato con additionalProperties: false para detectar cambios inesperados en el esquema. Restrinja los despliegues con la validación de la especificación. Utilice una plataforma integrada como Apidog que sincroniza las especificaciones, pruebas, simulacros y documentos automáticamente.

¿Cuál es la diferencia entre el código asistido por IA y el código generado por IA?

El código asistido por IA (sugerencias de Copilot, sesiones de Claude Code) se escribe en tiempo real con supervisión humana. El desarrollador ve y aprueba cada cambio. El código generado por IA (Agent Smith) se produce asincrónicamente sin intervención humana en tiempo real. El desarrollador revisa el trabajo completado después del hecho. Esta diferencia cambia la dinámica de revisión y aumenta el riesgo de violaciones de contrato no detectadas.

¿Los agentes de IA reemplazarán a los desarrolladores de API?

No. Agent Smith todavía requiere definición de tareas humanas, revisión de código y aprobación de despliegue. Un estudio del MIT de marzo de 2026 confirmó que la IA aumenta la productividad del desarrollador, pero no reemplaza el juicio, la conciencia del contexto y el pensamiento arquitectónico que proporcionan los humanos. El rol cambia de escribir código a definir tareas, revisar la salida y mantener la coherencia del sistema.

Conclusiones clave

Agent Smith de Google genera el 25% del nuevo código de producción mediante una operación autónoma y asincrónica
Esto representa un cambio de código asistido por IA a código generado por IA, cambiando la dinámica de revisión para los equipos de API
La desactualización del contrato de API es el riesgo principal cuando los agentes autónomos modifican los puntos finales y los esquemas
El desarrollo "design-first" con las especificaciones OpenAPI como fuente de verdad previene la ruptura de contratos
Las pruebas de contrato con validación estricta de esquemas detectan cambios que las pruebas unitarias pasan por alto
Las plataformas integradas como Apidog sincronizan especificaciones, pruebas, simulacros y documentos para evitar la desactualización
La tendencia hacia los agentes de codificación autónomos se está acelerando; prepare sus flujos de trabajo de API ahora

Agent Smith con un 25% es el principio. Las empresas que construyan flujos de trabajo de API a prueba de agentes hoy serán las que adopten herramientas de codificación autónoma de forma segura mañana.