Jedes große KI-Labor hat in den letzten sechs Wochen dieselbe primitive Funktion ausgeliefert. Anthropic hat /goal zu Claude Code hinzugefügt. OpenAI hat es in die Codex CLI und die Codex Desktop-App integriert. Nous Research hat es in Hermes eingebaut. Die Namensgebung ist bewusst konsistent; dies ist die Branche, die sich auf eine gemeinsame Schnittstelle für eine Sache einigt: einen Agenten, der in einer geschlossenen Schleife läuft, bis ein messbarer Endzustand erreicht ist, ohne Sie bei jedem Schritt um Erlaubnis zu fragen.
Wenn Sie den manuellen "Genehmigen, Prompt senden, Agenten zum Fortfahren auffordern, wiederholen"-Tanz gemacht haben, ist /goal der Slash-Befehl, der dem ein Ende setzt. Sie geben dem Agenten ein Ziel, er arbeitet auf dieses Ziel hin und kehrt zurück, wenn das Ziel erreicht ist.
Dieser Leitfaden richtet sich an Entwickler und API-Builder. Wir werden behandeln, was /goal tatsächlich unter der Haube tut, wie man es in Codex und Claude Code einrichtet, eine Prompt-Struktur, die echte Ergebnisse anstelle von Endlosschleifen produziert, und wie man das Ganze mit Apidog in Ihren API-Workflow einbindet.
Laden Sie Apidog herunter, wenn Sie später im Leitfaden die API-Beispiele nachvollziehen möchten.
Was /goal tatsächlich tut
Kurz gesagt: /goal lässt einen KI-Agenten eine Aufgabe in einer Schleife bearbeiten, bis eine Abbruchbedingung eintritt, ohne für jede Genehmigung zu Ihnen zurückzukommen.
Der Mechanismus darunter ist einfach. Ein kleines, schnelles Validator-Modell läuft nach jedem Schritt, den der Hauptagent ausführt, und beantwortet eine Frage: „Wurde das Ziel erreicht?“ Wenn nein, fährt das Hauptmodell fort. Wenn ja, schließt sich die Schleife und der Agent meldet sich zurück. Dies ist dasselbe Muster, das die "Ralph-Schleife" Anfang 2026 populär gemacht hat, nur dass es jetzt als erstklassiger Befehl in den offiziellen Tools ausgeliefert wird.
Der Kontrast zur normalen Agentennutzung:
- Ohne
/goal: Sie sind die Schleife. Sie lesen die Ausgabe, entscheiden, ob sie korrekt ist, geben den nächsten Schritt vor, genehmigen einen Tool-Aufruf und so weiter. Jede Iteration kostet Sie Aufmerksamkeit. - Mit
/goal: Der Agent besitzt die Schleife. Er plant, führt aus, validiert sich selbst und meldet sich nur, wenn er fertig ist, eine Einschränkung erreicht hat oder das Budget erschöpft ist.
Ein konkretes Beispiel: Wenn man Claude Code /goal create a landing page sagt, löst dies Recherche, Gerüstbau, Styling, Debugging und eine abschließende Vorschau aus, alles in einem kontinuierlichen Durchlauf. Sie gehen weg, kommen zurück und veröffentlichen es entweder oder wiederholen die Schritte.
Warum das plötzlich überall ist
Der Grund, warum /goal derzeit von allen Anbietern ausgeliefert wird, ist, dass Langzeit-Agentenaufgaben auf zwei vorhersehbare Weisen scheiterten:
- Abweichung (Drift). Ohne einen Validator, der das ursprüngliche Ziel überprüft, würden Modelle abschweifen und selbstbewusste, aber falsche Ergebnisse produzieren.
- Bevormundung (Babysitting). Selbst wenn das Modell die Arbeit erledigen konnte, mussten Benutzer jede Iteration beaufsichtigen, was den Sinn eines Agenten zunichtemachte.
Ein zweites Validator-Modell behebt beides. Es ist günstig (kleines Modell, präziser Prompt) und gibt der Schleife eine feste Abbruchbedingung. Das ist der ganze Trick. Sobald die Labore erkannten, dass dieses Muster funktionierte, lieferten sie es alle innerhalb weniger Wochen unter demselben Namen aus.
Einrichten von /goal in Codex
Die Codex CLI bietet Ihnen die meiste Kontrolle. Hier ist die minimale Einrichtung:
- Ziele in der Desktop-App aktivieren: Öffnen Sie Codex Desktop, gehen Sie zu Einstellungen → Konfiguration und setzen Sie
goals = true. Die CLI erbt dies. - Starten Sie die CLI im Vollautomatik-Modus, damit Sie keine Genehmigungsaufforderungen mehr sehen:
codex --approval-mode full-auto
- Ein Ziel festlegen:
/goal [Ihr Ziel hier]
Das ist alles. Codex druckt eine Bestätigung, dass das Ziel registriert ist, und beginnt dann mit der Ausführung.

Wenn Sie nicht technisch versiert sind, beginnen Sie stattdessen in der Codex Desktop-App anstelle der CLI. Die Funktionalität ist dieselbe, aber Sie erhalten eine Benutzeroberfläche zum Anhalten, Löschen und Überwachen der Token-Nutzung.
Einrichten von /goal in Claude Code
Die Claude Code CLI funktioniert nahezu identisch. Starten Sie die CLI, tippen Sie /goal ein und folgen Sie mit der Aufgabenbeschreibung. Offizielle Dokumentation finden Sie auf der Claude Code Dokumentationsseite.

Wenn Sie beim Starten von Claude Code auf Einrichtungs- oder Konfigurationsfehler stoßen, deckt die Behebung ungültiger custom3p Enterprise-Konfigurationsfehler den häufigsten Fehlerfall ab. Für einen tieferen Einblick, wie man Claude Code mit Multi-Agenten-Workflows zusammen mit /goal steuert, siehe unsere Analyse von Ruflo, einer Multi-Agenten-Schicht über Claude Code.
Ein Tipp, der leicht zu übersehen ist: /goal zeigt Ihnen die Live-Token-Anzahl und einen Fortschrittsbalken für die laufende Aufgabe in Claude Code an. Beobachten Sie die Token-Anzahl, nicht nur die Ausgabe. Ein Ziel, das Tokens verbrennt, ohne Fortschritt zu machen, ist ein Zeichen dafür, dass der Validator nicht konvergiert, und Sie sollten /pause oder /goal clear verwenden.
Die Prompt-Struktur, die tatsächlich funktioniert
Die Syntax für /goal ist trivial. Der schwierige Teil ist, einen Prompt zu schreiben, der ein brauchbares Ergebnis liefert, anstatt einen Agenten, der zwei Stunden lang läuft und Ihnen etwas subtil Falsches liefert.
Jeder effektive /goal-Prompt hat drei Komponenten:
- Die Aufgabe: Was Sie erledigen möchten, in einer Zeile.
- Der messbare Endzustand: Wie „erledigt“ aussieht, in einer Form, die der Validator überprüfen kann.
- Die Einschränkungen: Regeln, die durchweg gelten müssen.
Das Grundgerüst:
/goal [Aufgabe erledigen] bis [messbarer Endzustand] ohne [Einschränkungen, die gelten müssen]
Ein echtes Beispiel für eine Programmieraufgabe:
/goal alle fehlschlagenden Tests beheben, bis npm test mit 0 beendet wird, ohne Dateien außerhalb des Verzeichnisses /auth zu ändern
Der Endzustand ist überprüfbar (npm test Exit-Code), und die Einschränkung ist eine feste Grenze, die der Validator bei jeder Iteration durchsetzen kann. Der Agent kann die Fertigstellung nicht vortäuschen, da der Validator den Testbefehl ausführt.
Bei mehrdeutigen Aufgaben („diese Benutzeroberfläche modern wirken lassen“) schneidet /goal schlecht ab, da der Endzustand nicht messbar ist. Entweder formulieren Sie das Ziel neu, um es messbar zu machen („bis der Lighthouse-Zugänglichkeitsscore 90+ beträgt“), oder Sie bleiben bei einem normalen Prompt.
Fortgeschrittene Struktur für längere Aufgaben
Für größere Ziele erweitern Sie das Grundgerüst in vier Blöcke:
/goal
Ziel: [Einzeiliges Ziel]
Erfolgskriterien:
- [messbares Kriterium 1]
- [messbares Kriterium 2]
Einschränkungen:
- [Grenze 1]
- [Grenze 2]
Kontext:
- [Dateien, Repos, API-Schlüssel, die der Agent kennen sollte]
Dieses Format gibt dem Validator konkrete Dinge, die er bei jeder Schleifeniteration überprüfen kann. Ohne Erfolgskriterien greift der Validator auf eine unscharfe semantische Übereinstimmung zurück, wodurch es zu Abweichungen (Drift) kommt.
Beispiele, die es wert sind, übernommen zu werden
/goal ist nicht nur zum Schreiben von Code da. Ein paar Muster, die gut funktionieren:
Forschung
/goal alle öffentlichen Benchmarks für Claude Opus 4.7 sammeln, die seit April 2026 veröffentlicht wurden, Quellen speichern und eine nach Datum sortierte Markdown-Tabelle erstellen, bis die Tabelle mindestens 10 verschiedene Benchmarks abdeckt
Repo-Wartung
/goal toten Code, ungenutzte Abhängigkeiten und veraltete Dateien in diesem Repo finden, dann einen PR-Beschreibungsvorschlag mit sicheren Entfernungen erstellen, bis jeder Punkt eine Begründung hat
Dokumentation
/goal README.md so umschreiben, dass ein neuer Mitwirkender das Projekt installieren, ausführen, testen und verstehen kann, bis jeder dieser vier Schritte einen funktionierenden Befehl und eine erwartete Ausgabe hat
Feature-Arbeit
/goal einen Dark-/Light-Theme-Umschalter hinzufügen, die Auswahl in localStorage speichern, Stile für beide Themes aktualisieren und im Browser überprüfen, bis der Umschalter ohne Seitenneuladen funktioniert und einen Refresh überlebt
Das gemeinsame Muster: Jedes Beispiel legt einen überprüfbaren Endzustand fest. Das ist die Grenze zwischen einem Ziel, das abgeschlossen wird, und einem Ziel, das sich im Kreis dreht.
Kombinieren von /goal mit API-Entwicklungs-Workflows
Die meisten bisherigen Berichte über /goal drehten sich um generische Programmieraufgaben. Der interessantere Anwendungsfall für Backend- und Plattform-Ingenieure ist die API-Arbeit, bei der der Endzustand fast immer testbar ist.
API-Endpunkte eignen sich perfekt für /goal, da „erledigt“ eindeutig ist: die Anfrage gibt 200 zurück, das Antwortschema stimmt überein und der Vertrag ist dokumentiert. Sie können ein Ziel festlegen, das besagt „diesen Endpunkt seine Tests bestehen lassen“, und der Validator hat ein konkretes Signal zum Auslesen.
Ein Workflow, der sich in der Praxis bewährt:
- Entwerfen Sie den Vertrag zuerst in Apidog. Definieren Sie den Endpunkt, das Anfrage-Schema, das Antwort-Schema und Beispiel-Payloads in Apidog. Dies wird zur Quelle der Wahrheit.
- Exportieren Sie die Spezifikation. Apidog exportiert OpenAPI 3.x, die Sie Codex oder Claude Code als Kontext übergeben.
- Führen Sie
/goalaus. Sagen Sie dem Agenten: „Implementiere den Endpunkt, bis jeder Apidog-Testfall bestanden ist.“ - Der Validator überprüft den Test-Runner. Bei jeder Schleifeniteration führt der Validator die Apidog CLI-Tests gegen den laufenden Dienst aus. Der Agent beendet seine Arbeit erst, wenn alle Fälle „grün“ sind.
Dies ist wesentlich besser, als den Agenten eigene Tests erfinden zu lassen, da der Vertrag bereits festgelegt ist. Der Agent kann keine erfolgreiche Testsuite liefern, die Randfälle übersieht, die die Spezifikation abgedeckt hat.
Wenn Sie Apidog noch nicht verwendet haben: Die API-Plattform kombiniert Design, Mocking, Testen und Dokumentation in einem Tool, was hier wichtig ist, da /goal am besten funktioniert, wenn der Validator nur einen Befehl ausführen muss, um den Status zu überprüfen. Unser Leitfaden zum „Design-First API Workflow“ behandelt die „Contract-First“-Einrichtung ausführlich, und die Übersicht über API-Testtools für QA-Ingenieure zeigt, wie die Testfälle strukturiert werden, gegen die der Agent iterieren wird.
Wenn Sie mit MCP-Servern arbeiten (dem Protokoll, das die meisten KI-Programmierwerkzeuge jetzt zum Aufrufen externer Tools verwenden), gilt dasselbe Muster. Siehe MCP-Server-Tests mit Apidog für die Einrichtung, die /goal-Agenten einen sicheren Betrieb mit Ihrem lokalen MCP-Server ermöglicht.
Profi-Tipps aus dem produktiven Einsatz von /goal
Einige Dinge, die man erst nach dem Einsatz von /goal in der Praxis lernt:
- Ein Ziel nach dem anderen. Sowohl Codex als auch Claude Code beschränken Sie auf ein einzelnes aktives Ziel. Der Versuch, sie zu stapeln, führt zu einem merkwürdigen Zustand. Verwenden Sie
/goal clearzwischen den Läufen. - Kombinieren Sie es mit
/plan. Ein nützlicher Workflow ist zuerst/plan, dann den Plan überprüfen und anschließend/goalmit dem Plan als Kontext. Dies halbiert die Iterationsanzahl, da der Agent den Ansatz nicht mitten in der Schleife neu gestaltet. - Verwenden Sie Markdown-Dateien als Notizblöcke. Weisen Sie den Agenten an, eine
progress.md-Datei zu pflegen. Sie erhalten einen lesbaren Prüfbericht und der Agent erhält über Iterationen hinweg einen persistenten Kontext. - Lassen Sie das Modell sein eigenes Ziel schreiben. Geben Sie Ihre grobe Idee in einen normalen Prompt ein und bitten Sie das Modell, daraus einen
/goal-Aufruf mit Erfolgskriterien zu machen. Das Modell schreibt bessere Ziel-Prompts als Sie, weil es weiß, was der Validator tatsächlich überprüfen kann. - Beobachten Sie den Validator, nicht das Hauptmodell. Wenn die Schleife nicht geschlossen wird, liegt das Problem fast immer daran, dass die Erfolgskriterien nicht messbar sind. Verschärfen Sie die Kriterien, versuchen Sie nicht dasselbe Ziel erneut.
/goalist für Langzeitaufgaben. Für eine einzeilige Refaktorierung ist ein normaler Prompt schneller. Die autonome Schleife hat Overhead.
Wann /goal Sie im Stich lassen wird
Ehrliche Einschränkungen, die man beachten sollte:
- Kosten. Eine Schleife, die eine Stunde läuft, verbraucht mehr Tokens als dieselbe Aufgabe, die manuell erledigt wird. Legen Sie ein Budget fest.
- Aufgaben ohne klares Signal. UX-Feinschliff, Sprachstil, Designgeschmack; nichts davon hat einen sauberen Validator. Der Agent wird entweder aufgeben oder eine falsche Abbruchbedingung erfinden.
- Externe Nebeneffekte. Ein Ziel, das das Senden von E-Mails, das Tätigen von Zahlungen oder das Aufrufen von Produktions-APIs beinhaltet, erfordert strenge Einschränkungen. Der Agent wird von sich aus keine Vorsicht walten lassen. Wenn Sie noch dabei sind, die Zugriffskontrolle für KI-Agenten, die Ihre APIs aufrufen, aufzubauen, beschreibt der GitHub Copilot Nutzungs- und Abrechnungs-API für Teams Artikel, wie die großen Anbieter damit umgehen.
- Veralteter Kontext. Lang laufende Ziele können vom ursprünglichen Spezifikationsdokument abweichen, wenn sich die Codebasis während der Schleife ändert. Pausieren und zurücksetzen, anstatt sie mit altem Kontext fortsetzen zu lassen.
Was dies für Ihre Entwicklung mit KI bedeutet
/goal ist die Verschiebung von „KI als Autovervollständigung“ hin zu „KI als Mitarbeiter, den Sie anleiten und überprüfen“. Die Schnittstellenänderung ist gering (ein Slash-Befehl), aber die Auswirkung ist groß: Ihre Arbeit als Entwickler verlagert sich hin zum Schreiben besserer Erfolgskriterien und Einschränkungen und weg vom Tippen der eigentlichen Codezeilen.
Die Teams, die am meisten davon profitieren, sind diejenigen, die bereits testbare Verträge, eine starke CI und klare Spezifikationen haben. Wenn Ihre API ein definiertes OpenAPI-Dokument und eine Testsuite besitzt, können Sie einem /goal-Agenten einen Endpunkt und eine Frist geben. Wenn Ihre API nur im Kopf einer Person existiert, hat der Agent nichts zu validieren, und die Schleife bricht zusammen.
Hier werden API-Plattformen zu einer tragenden Infrastruktur für KI-Workflows. Apidog ist auf „Design-First API Development“ ausgelegt, und das wird viel nützlicher, wenn der Agent, der die Implementierung vornimmt, Ihre Spezifikation lesen und seine eigene Arbeit anhand Ihrer Testfälle überprüfen kann. Laden Sie Apidog herunter, wenn Sie den oben beschriebenen „Contract-First Workflow“ einrichten möchten.
FAQ
Funktioniert /goal in der Codex Web-App? Ja. Es funktioniert in der Codex CLI, Codex Desktop, der Codex App und der Claude Code CLI. Hermes unterstützt ebenfalls denselben Befehl. Feature-Parität über Anbieter hinweg ist der Sinn der Sache.
Wie unterscheidet sich /goal von einem normalen Prompt? Ein normaler Prompt läuft einmal und stoppt. /goal läuft in einer geschlossenen Schleife mit einem Validator-Modell, das nach jedem Schritt die Abbruchbedingung überprüft. Der Agent entscheidet, wann er stoppt, nicht Sie.
Kann der Agent die von mir festgelegten Einschränkungen durchbrechen? Der Validator erzwingt die Einschränkungen bei jeder Iteration, daher sollte der Agent sie nicht verletzen. In der Praxis gilt: Je lockerer die Formulierung der Einschränkung, desto mehr Spielraum hat der Agent, sie zu interpretieren. Seien Sie explizit: „ohne Dateien außerhalb von /auth zu ändern“ ist durchsetzbar; „ohne etwas kaputt zu machen“ ist es nicht.
Wird /goal mehr kosten als eine normale Claude- oder Codex-Sitzung? Ja. Rechnen Sie damit, mehr Tokens auszugeben. Der Validator läuft auf einem günstigeren, kleineren Modell, aber das Hauptmodell erledigt immer noch die Arbeit, und es tut dies autonomer. Legen Sie ein Budget fest oder verwenden Sie /pause, um die Ausgaben zu kontrollieren.
Was ist, wenn ich die Ausgabe des Agenten gegen eine echte API testen möchte? Verwenden Sie ein Tool wie Apidog, um den API-Vertrag zu fixieren und echte Testfälle gegen die Implementierung auszuführen. Der Validator des Agenten kann die Apidog CLI aufrufen, was Ihnen einen messbaren Endzustand liefert. Siehe den Leitfaden zur kostenlosen Claude API, wenn Sie einen von Claude unterstützten Dienst mit begrenztem Budget bootstrappen.
