Claude Code Richtig Nutzen: Ruflo Macht's Besser

Ashley Innocent

Ashley Innocent

7 May 2026

Claude Code Richtig Nutzen: Ruflo Macht's Besser

Wenn Sie das Claude Code-Ökosystem verfolgen, ist Ihnen wahrscheinlich ein Projekt aufgefallen, das still und leise von einem „interessanten npm-Paket“ zur „Standard-Koordinationsschicht für ernsthafte Claude Code-Teams“ wurde. Es heißt Ruflo, wird von rUv gepflegt und ist aus der ursprünglichen claude-flow-Bemühung hervorgegangen. Das Konzept ist einfach: Claude Code selbst führt einen Agenten nach dem anderen aus. Ruflo verwandelt es in einen Schwarm.

Dieser Leitfaden erklärt, was Ruflo leistet, wie es sich von einem Stapel von MCP-Servern unterscheidet, wann sich die Installation lohnt und wie man die Agenten und den MCP-Verkehr darunter mit Apidog testet. Wenn Sie gerade erst mit dem Agentendateiformat beginnen, das Claude Code beim Start liest, ist unser agents.md-Leitfaden die erforderliche Lektüre.

Schaltfläche

TL;DR

Was Ruflo tatsächlich tut

Standardmäßig ist Claude Code ein Single-Agent-Loop: Sie sprechen mit einem Modell, es bearbeitet einen Arbeitsbereich, es merkt sich nichts über Sitzungen hinweg. Das funktioniert für kurze Aufgaben. Es bricht zusammen, wenn Sie einen Schwarm von Spezialagenten benötigen, um eine Refaktorisierung anzugehen, oder wenn die Erkenntnisse eines Agenten die nächste Sitzung beeinflussen sollen, oder wenn zwei Maschinen koordiniert werden sollen.

Ruflo integriert sich in Claude Code als Koordinationsschicht. Nach init wird jede Aufgabe, die Sie Claude geben, über einen Router geleitet, der entscheidet, ob er:

Die README beschreibt es als „Claude Code mit einem Nervensystem“. Das trifft die Form: Ruflo ersetzt Claude Code nicht, es fügt die Schicht hinzu, die 100 spezialisierte Agenten wie ein einziges Werkzeug wirken lässt.

Die Architektur in einem Diagramm

Der vereinfachte Fluss aus der README:

Benutzer -> Ruflo (CLI/MCP) -> Router -> Schwarm -> Agenten -> Speicher -> LLM-Anbieter
                       ^                          |
                       +---- Lernschleife <------+

Fünf Komponenten sind für das Testen wichtig.

CLI/MCP-Eintritt. Sie können Ruflo über die Befehlszeile oder über die MCP-Integration von Claude Code steuern. Beide Oberflächen sprechen darunter das gleiche Protokoll.

Router. Ein kleiner Klassifikator (konfigurierbar, kann ein lokales Modell sein) entscheidet, welchen Pfad die Aufgabe nimmt. Schwarm vs. Einzelagent vs. Fortsetzen vs. Föderieren.

Schwarm. Ein Pool spezialisierter Agenten mit fokussierten Prompts und Toolsets. Das Spawnen eines Schwarms entspricht der Crew von CrewAI, ist aber enger in den eigenen Kontext von Claude Code integriert.

Speicher. Persistiert über Sitzungen hinweg, abfragbar durch zukünftige Agenten. Hier läuft die „Lernschleife“: Erfolgreiche Muster werden bewertet und wiederverwendet.

LLM-Anbieter. Ruflo ist anbieterunabhängig. Claude ist der Standard; OpenAI, DeepSeek, Gemini und lokale Ollama funktionieren über die Standard-Anbieterkonfiguration.

Es gibt zwei Installationspfade; wählen Sie basierend darauf, wie viel davon Sie tatsächlich wünschen.

Installationspfade und was jeder bietet

Die README ist explizit über einen Kompromiss, der Erstbenutzer stolpern lässt.

Pfad A: Claude Code Plugin (Lite). Sie installieren über den Claude Code Marketplace: /plugin install ruflo-core@ruflo. Dies fügt nur Slash-Befehle und Agenten-Definitionen hinzu. Der Ruflo MCP-Server ist nicht registriert, was bedeutet, dass Tools wie memory_store, swarm_init und agent_spawn nicht von Claude aufgerufen werden können. Gut, um die Befehle eines einzelnen Plugins auszuprobieren, ohne sich festzulegen.

Pfad B: CLI-Installation (vollständig). Sie führen npx ruvflo init in Ihrem Projekt aus. Dies richtet .claude/, .claude-flow/, CLAUDE.md, Hilfsskripte und den MCP-Server ein. Hooks werden bei jeder Claude Code-Interaktion ausgelöst. Der Speicher persistiert. Die 98 Agenten, über 60 Befehle, 30 Skills und die Föderation sind alle miteinander verbunden.

Die README warnt: „Nach der Initialisierung verwenden Sie Claude Code einfach normal; das Hooks-System leitet Aufgaben automatisch weiter.“ Das ist der Punkt. Sie sollten nicht 314 MCP-Tools auswendig lernen müssen. Das Framework übernimmt das Routing.

Für die meisten Engineering-Teams, die Claude Code ernsthaft nutzen, ist Pfad B das, was Sie wollen. Pfad A dient der isolierten Bewertung eines einzelnen Plugins.

Was im Lieferumfang enthalten ist

Einige herausragende Komponenten aus dem Plugin-Katalog.

ruflo-core. Speicher, Schwarm-Initialisierung, Agenten-Spawn-Grundlagen. Die Basis, auf der jedes andere Plugin aufbaut.

ruflo-swarm. Multi-Agenten-Koordination mit Rollenspezialisierung. Spawnen Sie einen Code-Review-Schwarm mit einem Sicherheitsagenten, einem Performance-Agenten, einem Dokumentationsagenten und einem Synthesizer.

ruflo-autopilot. Lang laufende Aufgabenautomatisierung. Übergibt dem Framework ein Ziel und lässt es bis zur Erledigung iterieren, mit Checkpoints.

ruflo-federation. Sichere Agent-zu-Agent-Kommunikation über Maschinen hinweg. Die Föderationsschicht verschlüsselt Nutzdaten, sodass zwei Organisationen Agenten zusammenarbeiten lassen können, ohne die Quelle preiszugeben.

RuVector. Der Vektorspeicher und das Graph-Backend, die von der Speicherschicht verwendet werden. Optional, aber empfohlen, sobald Ihr Projekt mehr als ein paar hundert Sitzungen mit akkumuliertem Kontext hat.

Der Plugin-Marktplatz bietet auch Spezialpakete für Tests, Sicherheit, Refactoring und Beobachtbarkeit. Das Muster ist konsistent: Ein Plugin entspricht einer fokussierten Fähigkeit, die alle auf den grundlegenden Speicher- und Schwarm-Primitiven aufbaut.

Warum die MCP-Schicht wichtig ist

Der MCP-Server von Ruflo ist das, was das Framework mit der Laufzeit von Claude Code verbindet. Jedes Spawnen eines Schwarms, jede Speicherbeschreibung und jede föderierte Übergabe ist ein JSON-RPC-Aufruf an den lokalen MCP-Server.

Das macht die MCP-Oberfläche zum wichtigsten Element, das getestet werden muss. Wenn tools/list eine Regression erfährt, sieht Claude Code die Schwarm-Primitive nicht mehr, und Ihr Team fällt stillschweigend in den Einzelagentenmodus zurück. Wenn memory_store die falsche Form zurückgibt, beginnen die Agenten, Kontext zu halluzinieren.

Dies ist dasselbe Problem, das wir in dem MCP-Server-Test-Playbook behandelt haben. Der Ruflo MCP-Server ist eine JSON-RPC-API; behandeln Sie ihn auch so.

Testen des Ruflo MCP-Servers mit Apidog

Ein Start-Testplan, der sich bei der ersten gefangenen Regression bezahlt macht.

Schritt 1: Erfassen Sie die kanonischen Anfragen. Führen Sie npx ruvflo init in einem Scratch-Projekt aus. Führen Sie ein paar repräsentative Aufgaben durch Claude Code mit aktivem Ruflo. Öffnen Sie den MCP-Inspektor von Claude Code und erfassen Sie die JSON-RPC-Frames für initialize, tools/list, tools/call mit swarm_init und tools/call mit memory_store.

Schritt 2: Fügen Sie sie in Apidog ein. Erstellen Sie ein neues Projekt, setzen Sie die Basis-URL auf Ihren lokalen Ruflo MCP-Server (Pfad B installiert ihn als registrierten MCP) und speichern Sie jeden erfassten Frame als Anfrage. Apidog verarbeitet JSON-RPC-Bodies nativ.

Schritt 3: Fügen Sie Assertions hinzu.

Schritt 4: Simulieren Sie die LLM-Anbieter. Ruflo ruft Claude (oder jeden von Ihnen konfigurierten Anbieter) für jede Agentenentscheidung auf. CI-Läufe sollten nicht bei jedem Commit einen echten Anbieter treffen. Apidog simuliert den OpenAI-kompatiblen Endpunkt mit realistischen Antworten; weisen Sie die Anbieterkonfiguration von Ruflo während der Tests auf den Mock. Das Muster ist dasselbe, das wir in API-Tests ohne Postman dokumentiert haben.

Schritt 5: Führen Sie die Suite in CI aus. Der CLI-Runner von Apidog beendet sich mit einem Nicht-Null-Wert bei einem Assertion-Fehler. Binden Sie ihn in GitHub Actions ein, und das nächste Mal, wenn jemand Ruflo aktualisiert und die MCP-Form bricht, schlägt Ihr PR fehl, bevor er landet.

Wo Apidog in den täglichen Ruflo-Workflow passt

Neben CI gibt es drei alltägliche Momente, in denen Apidog mit Ruflo seinen Wert unter Beweis stellt.

Wenn ein Schwarm sich falsch verhält. Spielen Sie die genaue Reihenfolge der tools/call-Frames wieder ab, die Claude Code gesendet hat. Vergleichen Sie sie mit einem bekannten, guten Durchlauf. Der Unterschied zeigt normalerweise ein Tool-Argument, das sich verschoben hat, weil die Prompt-Vorlage geändert wurde.

Wenn Sie Ruflo aktualisieren. Neue Version, neue Tool-Oberfläche. Führen Sie zuerst die Testsuite aus; der Unterschied zur vorherigen Version zeigt Ihnen, welche Tools umbenannt, entfernt oder in ihrer Form geändert wurden. Wir verwenden denselben Workflow für den Vergleich von API-Verträgen in der Vertrag-zuerst-API-Entwicklung.

Wenn die Föderation streikt. Föderierte Agenten kommunizieren über einen verschlüsselten Kanal; das Debuggen des Handshakes ohne Instrumentierung ist mühsam. Apidog kann den Föderationsverkehr aufzeichnen, wenn Sie es auf den lokalen Proxy-Port richten; das Anforderungsprotokoll macht den Fehler offensichtlich.

Häufige Fallstricke

Muster, die in den GitHub-Issues und im Discord auftauchen.

Installation des Plugin-Pfads und Erwartung des vollständigen Loops. Die README ist klar; die Plugins sind nur Slash-Befehle. Wenn swarm_init von Claude nicht aufrufbar ist, haben Sie den Lite-Pfad installiert. Führen Sie npx ruvflo init erneut für die vollständige Installation aus.

Überspringen der Hooks-Schicht. Pfad B installiert Hooks, die Aufgaben automatisch weiterleiten. Wenn Sie diese deinstallieren oder überschreiben, wird der Router nie ausgelöst und Sie verlieren die Schwarmkoordination. Belassen Sie die Standardeinstellungen, bis Sie einen Grund haben.

Unkontrolliertes Wachstum des Speichers. Der Speicher ist standardmäßig persistent und unbegrenzt. Nach einigen Wochen intensiver Nutzung wird der Index groß genug, um Schwarm-Spawns zu verlangsamen. Konfigurieren Sie die Aufbewahrung; die Einstellungsseite der README behandelt die Optionen.

Die Behandlung als reines Claude-Tool. Ruflo ist anbieterunabhängig. Standard ist Claude, aber Sie können für kostensensible Schwärme zu DeepSeek V4 wechseln oder für Offline-Läufe zu einem lokalen Llama 5.1. Unser DeepSeek V4 API-Leitfaden und der Beitrag Die besten lokalen LLMs von 2026 behandeln die Anbieterkonfiguration für beide.

Vergessen, dass die Föderation Vertrauensgrenzen überschreitet. Wenn Sie sich mit einer anderen Maschine föderieren, senden Sie Nutzdaten (potenziell einschließlich Code) an diesen Endpunkt. Die Verschlüsselungsschicht ist solide; die Richtlinienarbeit liegt bei Ihnen. Definieren Sie, welche Projekte föderieren können, bevor Sie es aktivieren.

Wie Ruflo im Vergleich zu anderen Agenten-Frameworks abschneidet

Drei Frameworks tauchen immer wieder in denselben Gesprächen auf.

LangGraph. Auf niedrigerer Ebene, generisch. Sie bauen die Orchestrierung selbst. Wählen Sie LangGraph, wenn Sie die volle Kontrolle wünschen und Ihr Workflow nicht Claude Code-förmig ist. Wir haben LangGraph in unserem TradingAgents-Beitrag angesprochen.

CrewAI. Multi-Agenten, Framework-agnostisch, stärker auf Konfiguration ausgelegt. Wählen Sie es für Nicht-Claude-Workflows, bei denen Python die Heimatsprache ist.

MCP-Server manuell gestapelt. Rollen Sie Ihre eigene Lösung. Leichter als Ruflo, schwieriger zu koordinieren. Gut für zwei oder drei Server; mühsam jenseits von fünf.

Ruflo's Nische ist „Claude Code, aber mit einem Schwarm“. Wenn Ihr täglicher Treiber Claude Code ist und Sie Koordination wünschen, ohne 600 Zeilen MCP-Boilerplate zu schreiben, lohnt sich die Installation.

Anmerkungen zu Leistung und Skalierung

Zwei operative Beobachtungen von Teams, die Ruflo seit einigen Monaten betreiben.

Das Spawnen eines Schwarms hat einen festen Kostenaufwand von zwei bis vier Sekunden für die Router-Entscheidung plus Tool-Registrierung. Für sehr kurze Aufgaben (eine Ein-Zeiler-Bearbeitung) dominiert dieser Overhead; Sie möchten, dass der Router diese Aufgaben über den Einzelagentenpfad sendet, nicht in einen Schwarm. Das Standard-Routing erledigt dies normalerweise korrekt; wenn nicht, ist die Hooks-Konfiguration der Ort, an dem Sie den Schwellenwert anpassen.

Speicherabfragen werden langsamer, wenn der Speicher wächst. SQLite handhabt einige tausend Sitzungen gut; darüber hinaus wechseln Sie zu Postgres oder RuVector. Ein Team, das Ruflo über sechs Ingenieure und 18 Monate Historie betreibt, berichtet über einen Median von 40 ms für Speicherabfragen auf Postgres im Vergleich zu 600 ms auf dem Standard-SQLite bei gleichem Volumen.

Anwendungsfälle in der Praxis

Ein Plattformteam nutzt Ruflo's Föderationsschicht, um Sicherheitsprüfungen für ein Repository durchzuführen, während ein Refactoring-Schwarm auf einem anderen läuft, beide koordiniert durch einen gemeinsamen Speicher. Sie leiten widersprüchliche Empfehlungen an einen menschlichen Gutachter weiter.

Ein Solo-Entwickler verbindet Ruflo's Autopilot-Modus mit einer Linear-Ticketwarteschlange: „Nimm ein P3-Ticket, check es aus, schlage eine Lösung vor, öffne einen PR, mach weiter.“ Der Autopilot läuft über Nacht; der Entwickler überprüft am Morgen.

Eine Forschungsgruppe verwendet das Multi-Agenten-Code-Review-Muster von Ruflo, um die PR-Qualität über drei Repositories hinweg zu bewerten. Die gesamten LLM-Ausgaben liegen unter 50 US-Dollar pro Woche auf Claude Sonnet, verglichen mit einem einzelnen menschlichen Prüfer für 80 US-Dollar pro Stunde.

Fazit

Ruflo ist eine ernsthafte Antwort auf die Frage: „Wie skaliere ich Claude Code über einen Agenten gleichzeitig hinaus?“ Die CLI-Installation fügt Speicher, Schwärme, Föderation und einen MCP-Server mit über 100 Tools in einem einzigen Befehl hinzu. Der Plugin-Marktplatz unterteilt die Funktionen sauber, sodass Sie schrittweise einführen können.

Fünf Erkenntnisse:

Nächster Schritt: Führen Sie npx ruvflo init in einem Scratch-Projekt aus, erfassen Sie die MCP-Frames im Claude Code-Inspektor und fügen Sie sie in ein Apidog-Projekt ein. Die erste Regression, die Sie erwischen, wird die Einrichtung amortisieren.

FAQ

Ist Ruflo dasselbe wie claude-flow?

Ja. Ruflo ist das umbenannte claude-flow, das von rUv (dem gleichen Autor) gepflegt wird. Das npm-Paket ist ruvflo; das GitHub-Repo ist ruvnet/ruflo. Bestehende claude-flow-Konfigurationen funktionieren weiterhin.

Benötige ich sowohl das Plugin als auch die CLI-Installation?

Nein. Wählen Sie eines. Plugins bieten Slash-Befehle; die CLI-Installation bietet die vollständige Koordinationsschicht. Die meisten Teams wünschen die CLI-Installation.

Kann ich Ruflo ohne Claude verwenden?

Ja. Ruflo ist anbieterunabhängig. Konfigurieren Sie DeepSeek V4, GPT-5.5, Gemini oder ein lokales Modell in der Anbieterkonfiguration. Claude ist der Standard, da das Framework aus claude-flow hervorgegangen ist.

Wo befindet sich der Speicher?

In einer lokalen SQLite- oder Postgres-Datenbank, abhängig von Ihrer Konfiguration. Das optionale RuVector-Backend fügt die Vektorsuche für die semantische Abfrage hinzu. Der Speicher gelangt nicht an einen Drittanbieterdienst, es sei denn, Sie konfigurieren dies explizit.

Wie teste ich den MCP-Server in CI?

Erfassen Sie kanonische Anfragen mit dem MCP-Inspektor, fügen Sie sie in Apidog ein, fügen Sie JSONPath-Assertions hinzu, führen Sie apidog run in CI aus. Das vollständige Muster finden Sie in dem MCP-Server-Test-Playbook.

Ist die Föderation über Organisationen hinweg sicher?

Die Verschlüsselungsschicht ist solide. Die Richtlinienebene liegt in Ihrer Verantwortung: Definieren Sie, welche Projekte föderieren dürfen, bereinigen Sie die Nutzdaten vor dem Senden von Geheimnissen und überprüfen Sie das Audit-Protokoll regelmäßig.

Was kostet es?

Das Framework ist MIT-lizenziert und kostenlos. Die Kosten sind LLM-Tokens für die Agenten und jeder von Ihnen gewählte gehostete Vektorspeicher. Ein starker Nutzer berichtet von unter 200 US-Dollar pro Monat für Claude Sonnet für den täglichen Ruflo-Gebrauch.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen