Flujos de Trabajo Dinámicos de Código Claude: Ejecutando Cientos de Subagentes Paralelos con Opus 4.8

Claude Opus 4.8 se lanzó con una característica destacada para Claude Code: Flujos de Trabajo Dinámicos. En una sola sesión, un agente orquestador puede desplegar cientos de subagentes paralelos para abordar una tarea grande y ramificada: refactorizar docenas de archivos, ejecutar una amplia matriz de pruebas o explorar varias rutas de solución a la vez. Parece magia en la terminal. Bajo el capó, son dos piezas concretas trabajando juntas.

Esta guía desglosa cómo funcionan realmente los Flujos de Trabajo Dinámicos, cuándo utilizarlos y cómo construir el mismo patrón de orquestación a través de la API en bruto. Para el modelo en sí, consulte qué es Claude Opus 4.8. Para el contexto de la arquitectura de agentes, nuestro desglose de la arquitectura del arnés de agentes de Claude Code es la lectura complementaria.

botón

Qué son realmente los Flujos de Trabajo Dinámicos

En Claude Code, los Flujos de Trabajo Dinámicos aparecen como un modo llamado ultracode en el menú de esfuerzo. Aquí está la parte que vale la pena entender: ultracode no es un nuevo nivel de esfuerzo de la API. Es una combinación de dos cosas que ya existen en Opus 4.8:

El nivel de esfuerzo xhigh
Mensajes del sistema a mitad de conversación

Visualización de cómo los Flujos de Trabajo Dinámicos combinan el esfuerzo xhigh y los mensajes del sistema a mitad de conversación para habilitar la orquestación de agentes.

Juntos, estos le dan a un agente orquestador la profundidad de razonamiento para planificar un trabajo grande y el permiso permanente para lanzar agentes trabajadores a medida que se desarrolla el trabajo. Ese es todo el truco. Todo lo demás es el cableado de Claude Code.

Ingrediente 1: esfuerzo xhigh

El parámetro effort controla cuántos tokens Opus 4.8 gasta en una respuesta, incluidas las llamadas a herramientas. xhigh es el nivel que Anthropic recomienda para la codificación a largo plazo y el trabajo de agentes; está ajustado para ejecuciones que se extienden más allá de los 30 minutos con presupuestos de tokens en millones.

Para un Flujo de Trabajo Dinámico, esa profundidad importa porque el orquestador tiene que hacer una planificación real: dividir la tarea en unidades independientes, decidir cuántos trabajadores generar y fusionar sus resultados. Los niveles de esfuerzo más bajos reducen el alcance del trabajo y realizan menos llamadas a herramientas, lo cual es lo opuesto a lo que necesita un orquestador. Cuando ejecute xhigh, establezca un max_tokens grande (64K es un punto de partida sensato) para que el modelo tenga espacio para pensar y coordinar.

Ingrediente 2: mensajes del sistema a mitad de conversación

Esta es la nueva capacidad de la API de Mensajes que hace posible todo. Antes de Opus 4.8, una indicación del sistema se ubicaba al inicio de una conversación y permanecía fija. Ahora puede colocar una entrada del sistema a mitad del array de messages, inyectando nuevas instrucciones o permisos a mitad de tarea.

Eso es lo que le otorga a un orquestador el permiso permanente para lanzar flujos de trabajo multiagente después de que la conversación ha comenzado, en lugar de negociarlo de antemano. Anthropic documenta el mecanismo en mensajes del sistema a mitad de conversación. Es un pequeño cambio en la API con una gran consecuencia: los agentes ahora pueden adquirir capacidades en medio de una ejecución basándose en lo que descubren.

Activación en Claude Code

En Claude Code, los Flujos de Trabajo Dinámicos residen detrás de la opción ultracode en el menú de esfuerzo. Seleccionarlo establece el esfuerzo xhigh y otorga a la sesión permiso para generar subagentes paralelos a través de mensajes del sistema a mitad de conversación. A partir de ahí, usted describe una tarea grande y deja que el orquestador la distribuya.

Menú de esfuerzo en Claude Code con la opción ultracode seleccionada, indicando que se ha activado la orquestación dinámica.

Algunas cosas suceden automáticamente:

Claude planifica la tarea y decide cómo dividirla
Lanza trabajadores en paralelo, cada uno con un alcance limitado a una parte del trabajo
Los resultados se transmiten y se fusionan en la sesión principal

Si ha configurado Claude Code con un plan, nuestra guía de configuración de Claude Agent SDK con plan de Claude cubre la configuración circundante.

Cuándo usar Flujos de Trabajo Dinámicos (y cuándo no)

Los Flujos de Trabajo Dinámicos brillan en trabajos amplios y paralelizados:

Refactorizar un patrón en muchos archivos a la vez
Generar y ejecutar una gran matriz de pruebas
Explorar varios enfoques de implementación en paralelo y luego compararlos
Análisis de bases de código a gran escala donde cada trabajador toma un módulo

Son la herramienta equivocada para tareas estrechas y secuenciales. Generar cientos de subagentes para un cambio en un solo archivo consume tokens sin beneficio, y los trabajadores paralelos no pueden ayudar cuando cada paso depende del anterior. El costo es real: cientos de subagentes xhigh significan millones de tokens. Adapte el patrón a la forma del trabajo.

Construyendo lo mismo a través de la API

No necesita Claude Code para construir orquestación. Los mismos dos ingredientes están disponibles en la API de Mensajes en bruto, y Anthropic proporciona un ejemplo práctico en construir un modo de orquestación. La forma es:

Ejecute una llamada de orquestador con esfuerzo xhigh que planifique la tarea
Use mensajes del sistema a mitad de conversación para otorgar al orquestador permiso para despachar trabajadores
Distribuya las llamadas de los trabajadores en paralelo, cada una con un alcance limitado a una unidad de trabajo
Recoja los resultados y devuélvaselos al orquestador para que los fusione

import anthropic

client = anthropic.Anthropic()

orchestrator = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=64000,
    output_config={"effort": "xhigh"},
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Planifica una refactorización del módulo de autenticación en los 14 servicios."},
    ],
)

Cada trabajador es una llamada de Mensajes separada que puede ejecutar concurrentemente, a menudo con un nivel de esfuerzo más bajo ya que su trabajo es limitado. Si está sopesando esto frente a la infraestructura de agentes alojada de Anthropic, la guía agentes gestionados frente a SDK de Agentes presenta las ventajas y desventajas.

Costo y control

Los subagentes paralelos multiplican rápidamente el gasto de tokens. Un Flujo de Trabajo Dinámico que lanza 200 trabajadores, cada uno gastando decenas de miles de tokens en xhigh, genera un costo real. Tres hábitos lo mantienen bajo control:

Limitar estrictamente el alcance de los trabajadores y ejecutarlos con esfuerzo medium o low cuando la subtarea lo permita.
Establecer un límite de max_tokens por trabajador para que un agente descontrolado no agote su presupuesto.
Almacenar en caché el contexto compartido para que la indicación del sistema repetida no se facture a tarifa completa en cada trabajador.

El desglose de precios de Opus 4.8 tiene los cálculos sobre los niveles de esfuerzo y el almacenamiento en caché. La versión corta: la orquestación es poderosa, pero la factura escala con el número de agentes, así que trate el paralelismo como una elección deliberada.

Probando su orquestación con Apidog

Cuando construye la orquestación a través de la API, la parte difícil de depurar es la distribución (fan-out): ¿los trabajadores están obteniendo el contexto de alcance correcto, las formas de sus respuestas son las que espera su paso de fusión, y su mensaje del sistema a mitad de conversación se envía correctamente? No querrá descubrir un error después de 200 llamadas de trabajadores en vivo.

Apidog le permite probar las piezas de forma aislada:

Guarde la solicitud del orquestador e inspeccione el desglose de la tarea planificada antes de enviar cualquier cosa.
Simule el endpoint del trabajador para que pueda probar su lógica de distribución y fusión sin gastar tokens en cientos de llamadas reales.
Agregue aserciones sobre la forma de la respuesta del trabajador para que una carga útil que se desvíe falle ruidosamente.
Reproduzca una única llamada de trabajador en diferentes niveles de effort para ajustar el costo por trabajador.

Descargue Apidog, construya las solicitudes del orquestador y del trabajador contra https://api.anthropic.com/v1/messages, y valide el bucle primero con simulaciones. La guía de la API de Opus 4.8 tiene la solicitud base para empezar. Una vez que la lógica sea sólida en las simulaciones, cambie al endpoint en vivo.

botón

Preguntas frecuentes

¿Qué son los Flujos de Trabajo Dinámicos en Claude Code? Una característica que permite a una sesión lanzar cientos de subagentes paralelos para manejar tareas grandes y ramificadas. Funciona con esfuerzo xhigh más mensajes del sistema a mitad de conversación en Opus 4.8.

¿Es ultracode un nivel de esfuerzo separado? No. Ultracode es el nombre de Claude Code para el esfuerzo xhigh combinado con el permiso permanente para lanzar flujos de trabajo multiagente. Los niveles de esfuerzo de la API siguen siendo low, medium, high, xhigh y max.

¿Qué son los mensajes del sistema a mitad de conversación? Un cambio en la API de Mensajes de Opus 4.8 que le permite colocar una entrada del sistema a mitad de la conversación, inyectando nuevas instrucciones o permisos a mitad de tarea. Es lo que permite a un orquestador generar trabajadores después de que comienza una ejecución.

¿Puedo construir Flujos de Trabajo Dinámicos sin Claude Code? Sí. Use esfuerzo xhigh más mensajes del sistema a mitad de conversación en la API de Mensajes en bruto. Anthropic publica un ejemplo práctico de orquestación en su documentación.

¿Los Flujos de Trabajo Dinámicos cuestan mucho? Pueden. Cientos de subagentes xhigh suman millones de tokens. Limite estrictamente el alcance de los trabajadores, reduzca su esfuerzo cuando pueda y almacene en caché el contexto compartido para controlar el gasto.

¿Cuándo debo evitar los Flujos de Trabajo Dinámicos? En tareas estrechas o estrictamente secuenciales. Los trabajadores paralelos no añaden valor cuando cada paso depende del anterior, y desperdician tokens en trabajos pequeños.