Claude Code Dynamische Workflows: Hunderte parallele Subagenten mit Opus 4.8 ausführen

Claude Opus 4.8 wurde mit einer Hauptfunktion für Claude Code ausgeliefert: Dynamische Workflows. In einer Sitzung kann ein orchestrierender Agent Hunderte von parallelen Sub-Agenten starten, um eine große, verzweigte Aufgabe zu bewältigen: Refactoring über Dutzende von Dateien hinweg, Ausführung einer breiten Testmatrix oder gleichzeitiges Erkunden mehrerer Lösungswege. Im Terminal sieht es wie Magie aus. Unter der Haube sind es zwei konkrete Bausteine, die zusammenarbeiten.

Dieser Leitfaden erklärt, wie Dynamische Workflows tatsächlich funktionieren, wann sie eingesetzt werden sollten und wie man dasselbe Orchestrierungsmuster über die rohe API aufbaut. Zum Modell selbst siehe was ist Claude Opus 4.8. Für den Hintergrund der Agentenarchitektur ist unser Überblick über die Claude Code Agent Harness-Architektur die ergänzende Lektüre.

Schaltfläche

Was Dynamische Workflows tatsächlich sind

In Claude Code erscheinen Dynamische Workflows als Modus namens ultracode im Aufwandsmenü. Hier ist der wichtige Punkt: ultracode ist kein neues API-Aufwandslevel. Es ist eine Kombination aus zwei Dingen, die bereits in Opus 4.8 existieren:

Das xhigh Aufwandslevel
Systemmeldungen mitten im Gespräch

Zusammengenommen verleihen diese einem orchestrierenden Agenten sowohl die Argumentationstiefe, um eine große Aufgabe zu planen, als auch die ständige Berechtigung, Worker-Agenten zu starten, während die Aufgabe abläuft. Das ist der ganze Trick. Alles andere ist Claude Code Verdrahtung.

Bestandteil 1: xhigh Aufwand

Der effort-Parameter steuert, wie viele Tokens Opus 4.8 für eine Antwort, einschließlich Tool-Aufrufe, ausgibt. xhigh ist das Niveau, das Anthropic für langfristige Kodierungs- und Agentenarbeiten empfiehlt; es ist auf Ausführungen abgestimmt, die länger als 30 Minuten dauern und Token-Budgets im Millionenbereich umfassen.

Für einen Dynamischen Workflow ist diese Tiefe wichtig, da der Orchestrator eine echte Planung durchführen muss: die Aufgabe in unabhängige Einheiten aufteilen, entscheiden, wie viele Worker gestartet werden sollen, und deren Ergebnisse zusammenführen. Niedrigere Aufwandslevel begrenzen den Arbeitsumfang und führen zu weniger Tool-Aufrufen, was das Gegenteil dessen ist, was ein Orchestrator benötigt. Wenn Sie xhigh verwenden, legen Sie einen großen Wert für max_tokens fest (64K ist ein vernünftiger Ausgangspunkt), damit das Modell Raum zum Denken und Koordinieren hat.

Bestandteil 2: Systemmeldungen mitten im Gespräch

Dies ist die neue Fähigkeit der Messages API, die das Ganze erst ermöglicht. Vor Opus 4.8 befand sich eine Systemaufforderung am Anfang einer Konversation und blieb fest. Jetzt können Sie einen System-Eintrag mitten in das messages-Array einfügen, wodurch neue Anweisungen oder Berechtigungen während der Aufgabe eingefügt werden.

Das ist es, was einem Orchestrator die ständige Berechtigung erteilt, Multi-Agenten-Workflows nach Beginn der Konversation zu starten, anstatt dies im Voraus zu verhandeln. Anthropic dokumentiert den Mechanismus in Systemmeldungen mitten im Gespräch. Es ist eine kleine API-Änderung mit einer großen Konsequenz: Agenten können jetzt mitten in einem Durchlauf Fähigkeiten basierend auf dem, was sie entdecken, erlangen.

Aktivierung in Claude Code

In Claude Code befinden sich Dynamische Workflows hinter der Option 'ultracode' im Aufwandsmenü. Die Auswahl dieser Option setzt den xhigh-Aufwand und erteilt der Sitzung die Berechtigung, parallele Sub-Agenten über Systemmeldungen mitten im Gespräch zu starten. Von dort aus beschreiben Sie eine große Aufgabe und lassen den Orchestrator diese verteilen.

Einige Dinge geschehen automatisch:

Claude plant die Aufgabe und entscheidet, wie sie aufgeteilt werden soll
Es startet Worker parallel, wobei jeder auf einen Teilbereich der Aufgabe zugeschnitten ist
Ergebnisse werden zurückgestreamt und in der Hauptsitzung zusammengeführt

Wenn Sie Claude Code mit einem Plan eingerichtet haben, deckt unser Einrichtungsleitfaden für das Claude Agent SDK mit Claude Plan die zugehörige Konfiguration ab.

Wann Dynamische Workflows verwendet werden sollten (und wann nicht)

Dynamische Workflows brillieren bei breiten, parallelisierbaren Aufgaben:

Refactoring eines Musters über viele Dateien gleichzeitig
Generieren und Ausführen einer großen Testmatrix
Parallel mehrere Implementierungsansätze erkunden und dann vergleichen
Großangelegte Codebasis-Analyse, bei der jeder Worker ein Modul übernimmt

Sie sind das falsche Werkzeug für enge, sequentielle Aufgaben. Das Starten von Hunderten von Sub-Agenten für eine Änderung an einer einzelnen Datei verbraucht Tokens ohne Nutzen, und parallele Worker können nicht helfen, wenn jeder Schritt vom vorherigen abhängt. Die Kosten sind real: Hunderte von xhigh-Sub-Agenten bedeuten Millionen von Tokens. Passen Sie das Muster der Arbeitsform an.

Dasselbe über die API aufbauen

Sie benötigen Claude Code nicht, um Orchestrierung aufzubauen. Dieselben zwei Bestandteile sind über die rohe Messages API verfügbar, und Anthropic bietet ein ausführliches Beispiel in einen Orchestrierungsmodus aufbauen. Das Schema ist:

Führen Sie einen Orchestrator-Aufruf mit xhigh Aufwand aus, der die Aufgabe plant
Verwenden Sie Systemmeldungen mitten im Gespräch, um dem Orchestrator die Berechtigung zum Starten von Workern zu erteilen
Verteilen Sie Worker-Aufrufe parallel, wobei jeder auf eine Arbeitseinheit zugeschnitten ist
Sammeln Sie Ergebnisse und führen Sie sie dem Orchestrator zur Zusammenführung zu

import anthropic

client = anthropic.Anthropic()

orchestrator = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=64000,
    output_config={"effort": "xhigh"},
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Plan a refactor of the auth module across all 14 services."},
    ],
)

Jeder Worker ist ein separater Messages-Aufruf, den Sie gleichzeitig ausführen können, oft mit einem geringeren Aufwand, da seine Aufgabe eng begrenzt ist. Wenn Sie dies mit der gehosteten Agenten-Infrastruktur von Anthropic vergleichen, legt der Leitfaden verwaltete Agenten vs. Agent SDK die Kompromisse dar.

Kosten und Kontrolle

Parallele Sub-Agenten vervielfachen den Token-Verbrauch schnell. Ein Dynamischer Workflow, der 200 Worker startet, von denen jeder Zehntausende von Tokens mit xhigh verbraucht, kostet richtig Geld. Drei Gewohnheiten halten es im Rahmen:

Worker eng begrenzen und sie mit medium oder low Aufwand ausführen, wo die Unteraufgabe dies zulässt
max_tokens pro Worker begrenzen, damit ein außer Kontrolle geratener Agent Ihr Budget nicht aufbrauchen kann
Gemeinsamen Kontext cachen, damit die wiederholte Systemaufforderung nicht bei jedem Worker zum vollen Tarif abgerechnet wird

Die Opus 4.8 Preisaufschlüsselung enthält die Berechnungen zu Aufwandsstufen und Caching. Die Kurzfassung: Orchestrierung ist leistungsstark, aber die Rechnung skaliert mit der Anzahl der Agenten, behandeln Sie Parallelität also als bewusste Entscheidung.

Ihre Orchestrierung mit Apidog testen

Wenn Sie Orchestrierung über die API aufbauen, ist der schwierigste Teil beim Debuggen die Verteilung (Fan-Out): Erhalten die Worker den richtig begrenzten Kontext, haben ihre Antworten die Form, die Ihr Zusammenführungsschritt erwartet, und kommt Ihre Systemmeldung mitten im Gespräch korrekt an? Sie möchten keinen Fehler nach 200 Live-Worker-Aufrufen entdecken.

Apidog ermöglicht es Ihnen, die Teile isoliert zu testen:

Speichern Sie die Orchestrator-Anfrage und überprüfen Sie die geplante Aufgabenaufteilung, bevor Sie etwas versenden
Mocken Sie den Worker-Endpunkt, damit Sie Ihre Verteilungs- und Zusammenführungslogik testen können, ohne Tokens für Hunderte von realen Aufrufen auszugeben
Fügen Sie Assertions zur Form der Worker-Antwort hinzu, damit eine abweichende Nutzlast lautstark fehlschlägt
Wiederholen Sie einen einzelnen Worker-Aufruf mit verschiedenen effort-Levels, um die Kosten pro Worker anzupassen

Laden Sie Apidog herunter, erstellen Sie die Orchestrator- und Worker-Anfragen an https://api.anthropic.com/v1/messages und validieren Sie den Ablauf zuerst mit Mocks. Der Opus 4.8 API-Leitfaden enthält die Basisanfrage, von der Sie ausgehen können. Sobald die Logik mit Mocks solide ist, wechseln Sie zum Live-Endpunkt.

Schaltfläche

FAQ

Was sind Dynamische Workflows in Claude Code? Eine Funktion, die es einer Sitzung ermöglicht, Hunderte von parallelen Sub-Agenten zu starten, um große, verzweigte Aufgaben zu bewältigen. Sie wird durch xhigh Aufwand plus Systemmeldungen mitten im Gespräch in Opus 4.8 angetrieben.

Ist ultracode ein separates Aufwandslevel? Nein. Ultracode ist der Name von Claude Code für den xhigh-Aufwand in Verbindung mit der ständigen Berechtigung, Multi-Agenten-Workflows zu starten. Die API-Aufwandslevel sind weiterhin low, medium, high, xhigh und max.

Was sind Systemmeldungen mitten im Gespräch? Eine Änderung der Messages API in Opus 4.8, die es Ihnen ermöglicht, einen System-Eintrag mitten in der Konversation zu platzieren, wodurch neue Anweisungen oder Berechtigungen während der Aufgabe eingefügt werden. Das ermöglicht einem Orchestrator, Worker nach dem Start eines Durchlaufs zu starten.

Kann ich Dynamische Workflows ohne Claude Code erstellen? Ja. Verwenden Sie xhigh Aufwand plus Systemmeldungen mitten im Gespräch auf der rohen Messages API. Anthropic veröffentlicht ein ausgearbeitetes Orchestrierungsbeispiel in seiner Dokumentation.

Kosten Dynamische Workflows viel? Das können sie. Hunderte von xhigh-Sub-Agenten summieren sich zu Millionen von Tokens. Begrenzen Sie Worker eng, reduzieren Sie ihren Aufwand, wo möglich, und cachen Sie den gemeinsamen Kontext, um die Ausgaben zu kontrollieren.

Wann sollte ich Dynamische Workflows vermeiden? Bei engen oder streng sequenziellen Aufgaben. Parallele Worker bieten keinen Mehrwert, wenn jeder Schritt vom vorherigen abhängt, und sie verschwenden Tokens bei kleinen Aufgaben.