Estás Usando Mal Claude: Ruflo Lo Soluciona

Ashley Innocent

Ashley Innocent

7 May 2026

Estás Usando Mal Claude: Ruflo Lo Soluciona

Si ha estado observando el ecosistema de Claude Code, probablemente haya notado un proyecto que pasó discretamente de ser un "interesante paquete npm" a "la capa de coordinación predeterminada para equipos serios de Claude Code". Se llama Ruflo, mantenido por rUv, y surgió del esfuerzo original de claude-flow. La propuesta es simple: Claude Code por sí solo ejecuta un agente a la vez. Ruflo lo convierte en un enjambre.

Esta guía explica qué hace Ruflo, cómo se diferencia de una pila de servidores MCP, cuándo justifica su instalación y cómo probar los agentes y el tráfico MCP subyacente con Apidog. Si recién está comenzando con el formato de archivo de agente que Claude Code lee al iniciarse, nuestra guía agents.md es la lectura previa indispensable.

botón

En resumen

Qué hace Ruflo realmente

Por defecto, Claude Code es un bucle de agente único: usted habla con un modelo, este edita un espacio de trabajo, no recuerda nada entre sesiones. Eso funciona para tareas cortas. Se rompe cuando desea que un enjambre de agentes especialistas aborde una refactorización, o cuando quiere que los hallazgos de un agente informen la siguiente sesión, o cuando desea que dos máquinas se coordinen.

Ruflo se conecta a Claude Code como una capa de coordinación. Después de init, cada tarea que le asigna a Claude se enruta a través de un enrutador que decide si:

El README lo describe como "Claude Code con un sistema nervioso". Eso captura la forma: Ruflo no reemplaza a Claude Code, añade la capa que hace que 100 agentes especialistas se sientan como una única herramienta.

La arquitectura en un diagrama

El flujo simplificado del README:

Usuario -> Ruflo (CLI/MCP) -> Enrutador -> Enjambre -> Agentes -> Memoria -> Proveedores LLM
                       ^                          |
                       +---- Bucle de aprendizaje <------+

Cinco componentes son importantes para las pruebas.

Entrada CLI/MCP. Puede controlar Ruflo desde la línea de comandos o desde la integración MCP de Claude Code. Ambas interfaces hablan el mismo protocolo subyacente.

Enrutador. Un pequeño clasificador (configurable, puede ser un modelo local) decide qué ruta toma la tarea. Enjambre vs. agente único vs. reanudar vs. federar.

Enjambre. Un grupo de agentes especialistas con prompts y conjuntos de herramientas enfocados. Generar un enjambre es el equivalente a la "crew" de CrewAI, pero más integrado con el propio contexto de Claude Code.

Memoria. Persistente entre sesiones, consultable por futuros agentes. Aquí es donde se ejecuta el "bucle de aprendizaje": los patrones exitosos se puntúan y reutilizan.

Proveedores LLM. Ruflo es agnóstico al proveedor. Claude es el predeterminado; OpenAI, DeepSeek, Gemini y Ollama local funcionan a través de la configuración estándar del proveedor.

Existen dos rutas de instalación; elija en función de cuánto de esto realmente desea.

Rutas de instalación y lo que cada una le ofrece

El README es explícito sobre un compromiso que confunde a los usuarios primerizos.

Ruta A: Plugin de Claude Code (ligero). Se instala a través del marketplace de Claude Code: /plugin install ruflo-core@ruflo. Esto añade solo comandos de barra y definiciones de agente. El servidor MCP de Ruflo no está registrado, lo que significa que herramientas como memory_store, swarm_init y agent_spawn no son invocables desde Claude. Es bueno para probar los comandos de un solo plugin sin comprometerse.

Ruta B: Instalación CLI (completa). Ejecuta npx ruvflo init en su proyecto. Esto configura .claude/, .claude-flow/, CLAUDE.md, scripts de ayuda y el servidor MCP. Los ganchos se activan en cada interacción de Claude Code. La memoria persiste. Los 98 agentes, más de 60 comandos, 30 habilidades y la federación están todos conectados.

El README advierte: "después de init, simplemente use Claude Code normalmente; el sistema de ganchos enruta automáticamente las tareas". Ese es el punto. No debería tener que memorizar 314 herramientas MCP. El framework se encarga del enrutamiento.

Para la mayoría de los equipos de ingeniería que utilizan Claude Code de forma seria, la Ruta B es lo que desean. La Ruta A es para evaluar un solo plugin de forma aislada.

Qué incluye el paquete

Algunos componentes destacados del catálogo de plugins.

ruflo-core. Almacén de memoria, inicialización de enjambre, primitivas de generación de agentes. La base sobre la que se construyen todos los demás plugins.

ruflo-swarm. Coordinación multiagente con especialización de roles. Genere un enjambre de revisión de código con un agente de seguridad, un agente de rendimiento, un agente de documentación y un sintetizador.

ruflo-autopilot. Automatización de tareas de larga duración. Entrega un objetivo al framework y le permite iterar hasta completarlo, con puntos de control.

ruflo-federation. Comunicación segura de agente a agente entre máquinas. La capa de federación cifra las cargas útiles para que dos organizaciones puedan permitir que los agentes colaboren sin filtrar el código fuente.

RuVector. El almacén vectorial y el backend de grafos utilizados por la capa de memoria. Opcional pero recomendado una vez que su proyecto tenga más de unas pocas cientos de sesiones de contexto acumulado.

El marketplace de plugins también ofrece paquetes especializados para pruebas, seguridad, refactorización y observabilidad. El patrón es consistente: un plugin equivale a una capacidad enfocada, todo construido sobre las primitivas básicas de memoria y enjambre.

Por qué la capa MCP es importante

El servidor MCP de Ruflo es lo que hace que el framework se conecte al tiempo de ejecución de Claude Code. Cada generación de enjambre, escritura en memoria y transferencia federada es una llamada JSON-RPC contra el servidor MCP local.

Eso convierte la superficie MCP en lo más importante a probar. Si tools/list experimenta una regresión, Claude Code deja de ver las primitivas del enjambre y su equipo vuelve silenciosamente al modo de agente único. Si memory_store devuelve una forma incorrecta, los agentes comienzan a alucinar el contexto.

Este es el mismo problema que abordamos en el manual de pruebas del servidor MCP. El servidor MCP de Ruflo es una API JSON-RPC; trátelo como tal.

Prueba del servidor MCP de Ruflo con Apidog

Un plan de prueba inicial que se amortiza con la primera regresión que detecta.

Paso 1: capture las solicitudes canónicas. Ejecute npx ruvflo init en un proyecto de prueba. Ejecute algunas tareas representativas a través de Claude Code con Ruflo activo. Abra el inspector MCP de Claude Code y capture los frames JSON-RPC para initialize, tools/list, tools/call con swarm_init, y tools/call con memory_store.

Paso 2: péguelos en Apidog. Cree un nuevo proyecto, establezca la URL base en su servidor MCP de Ruflo local (la Ruta B lo instala como un MCP registrado) y guarde cada frame capturado como una solicitud. Apidog maneja los cuerpos JSON-RPC de forma nativa.

Paso 3: añada aserciones.

Paso 4: simule los proveedores de LLM. Ruflo llama a Claude (o al proveedor que configure) para cada decisión del agente. Las ejecuciones de CI no deberían acceder a un proveedor real en cada commit. Apidog simula el endpoint compatible con OpenAI con respuestas realistas; apunte la configuración del proveedor de Ruflo al mock durante las pruebas. El patrón es el mismo que documentamos en pruebas de API sin Postman.

Paso 5: ejecute la suite en CI. El ejecutor CLI de Apidog sale con un código distinto de cero si falla una aserción. Conéctelo a GitHub Actions y la próxima vez que alguien actualice Ruflo y rompa la forma del MCP, su PR fallará antes de que se fusione.

Dónde encaja Apidog en el bucle diario de Ruflo

Más allá de CI, tres momentos del día a día donde Apidog se amortiza con Ruflo.

Cuando un enjambre se comporta mal. Reproduzca la secuencia exacta de frames de tools/call que Claude Code envió. Compare con una ejecución conocida como buena. La diferencia suele mostrar un argumento de herramienta que se desvió porque la plantilla de prompt cambió.

Cuando actualiza Ruflo. Nueva versión, nueva superficie de herramientas. Ejecute la suite de pruebas primero; la diferencia con la versión anterior le indicará qué herramientas fueron renombradas, eliminadas o cambiaron de forma. Usamos el mismo flujo de trabajo para comparar contratos de API en el desarrollo de API con contrato primero.

Cuando la federación falla. Los agentes federados se comunican a través de un canal cifrado; depurar el handshake sin instrumentación es doloroso. Apidog puede registrar el tráfico de federación cuando lo apunta al puerto proxy local; el registro de solicitudes hace que el fallo sea obvio.

Errores comunes

Patrones que aparecen en los problemas de GitHub y en Discord.

Instalar la ruta del plugin y esperar el bucle completo. El README es claro; los plugins son solo comandos de barra. Si swarm_init no es invocable desde Claude, instaló la ruta ligera. Vuelva a ejecutar npx ruvflo init para la instalación completa.

Omitir la capa de ganchos. La Ruta B instala ganchos que enrutan las tareas automáticamente. Si los desinstala o los sobrescribe, el enrutador nunca se activa y pierde la coordinación del enjambre. Mantenga los valores predeterminados hasta que tenga una buena razón para cambiarlos.

Dejar que la memoria crezca sin control. El almacén de memoria es persistente y sin límites por defecto. Después de unas semanas de uso intensivo, el índice se vuelve lo suficientemente grande como para ralentizar la generación de enjambres. Configure la retención; la página de configuración del README cubre los ajustes.

Tratarlo como una herramienta solo para Claude. Ruflo es agnóstico al proveedor. El valor predeterminado es Claude, pero puede cambiar a DeepSeek V4 para enjambres sensibles al costo o a un Llama 5.1 local para ejecuciones sin conexión. Nuestra guía de API de DeepSeek V4 y la publicación sobre los mejores LLMs locales de 2026 cubren la configuración del proveedor para ambos.

Olvidar que la federación cruza límites de confianza. Cuando se federa a otra máquina, está enviando cargas útiles (potencialmente incluyendo código) a ese endpoint. La capa de cifrado es sólida; el trabajo de políticas es suyo. Defina qué proyectos pueden federar antes de activarlo.

Cómo se compara Ruflo con otros frameworks de agentes

Tres frameworks surgen repetidamente en las mismas conversaciones.

LangGraph. De nivel inferior, genérico. Usted construye la orquestación. Elija LangGraph cuando quiera control total y su flujo de trabajo no tenga la forma de Claude Code. Mencionamos LangGraph en nuestra publicación sobre TradingAgents.

CrewAI. Multiagente, agnóstico al framework, con más configuración. Elija este para flujos de trabajo que no son de Claude donde Python es el lenguaje principal.

Servidores MCP apilados manualmente. Construya el suyo propio. Más ligero que Ruflo, más difícil de coordinar. Funciona bien para dos o tres servidores; doloroso a partir de cinco.

El nicho de Ruflo es "Claude Code, pero con un enjambre". Si su herramienta de trabajo diaria es Claude Code y desea coordinación sin escribir 600 líneas de código repetitivo de MCP, merece la instalación.

Notas sobre rendimiento y escala

Dos observaciones operativas de equipos que han estado ejecutando Ruflo durante algunos meses.

Generar un enjambre tiene un costo fijo de dos a cuatro segundos para la decisión del enrutador más el registro de herramientas. Para tareas muy cortas (una edición de una sola línea), esta sobrecarga domina; usted quiere que el enrutador envíe esas tareas por la ruta de agente único, no a un enjambre. El enrutamiento predeterminado generalmente hace esto correctamente; si no, la configuración de ganchos es donde usted ajusta el umbral.

Las consultas de memoria se vuelven más lentas a medida que el almacén crece. SQLite maneja bien unos pocos miles de sesiones; más allá de eso, cambie a Postgres o RuVector. Un equipo que ejecuta Ruflo con seis ingenieros y 18 meses de historial reporta consultas de memoria medianas de 40 ms en Postgres versus 600 ms en el SQLite predeterminado con el mismo volumen.

Casos de uso en el mundo real

Un equipo de plataforma utiliza la capa de federación de Ruflo para ejecutar revisiones de seguridad de un repositorio mientras un enjambre de refactorización se ejecuta en otro, ambos coordinados a través de un almacén de memoria compartido. Presentan recomendaciones conflictivas a un revisor humano.

Un desarrollador individual conecta el modo piloto automático de Ruflo a una cola de tickets de Linear: "elija un ticket P3, compruébelo, proponga una solución, abra un PR, siga adelante". El piloto automático se ejecuta durante la noche; el desarrollador revisa por la mañana.

Un grupo de investigación utiliza el patrón de revisión de código multiagente de Ruflo para evaluar la calidad de los PR en tres repositorios. El gasto total en LLM es de menos de $50 a la semana en Claude Sonnet, en comparación con un revisor humano a $80 la hora.

Conclusión

Ruflo es una respuesta seria a la pregunta "¿cómo escalo Claude Code más allá de un agente a la vez?". La instalación CLI añade memoria, enjambres, federación y un servidor MCP con más de 100 herramientas en un solo comando. El marketplace de plugins divide las capacidades limpiamente para que pueda adoptarlas de forma incremental.

Cinco puntos clave:

Siguiente paso: ejecute npx ruvflo init en un proyecto de prueba, capture los frames MCP en el inspector de Claude Code y péguelos en un proyecto de Apidog. La primera regresión que detecte amortizará la configuración.

Preguntas frecuentes

¿Ruflo es lo mismo que claude-flow?

Sí. Ruflo es el renombrado claude-flow, mantenido por rUv (el mismo autor). El paquete npm es ruvflo; el repositorio de GitHub es ruvnet/ruflo. Las configuraciones existentes de claude-flow siguen funcionando.

¿Necesito tanto el plugin como la instalación CLI?

No. Elija uno. Los plugins le dan comandos de barra; la instalación CLI le da la capa de coordinación completa. La mayoría de los equipos quieren la instalación CLI.

¿Puedo usar Ruflo sin Claude?

Sí. Ruflo es agnóstico al proveedor. Configure DeepSeek V4, GPT-5.5, Gemini o un modelo local en la configuración del proveedor. Claude es el predeterminado porque el framework surgió de claude-flow.

¿Dónde reside la memoria?

En un almacén local de SQLite o Postgres, dependiendo de su configuración. El backend opcional RuVector añade búsqueda vectorial para recuperación semántica. La memoria no se filtra a un servicio de terceros a menos que lo configure explícitamente.

¿Cómo pruebo el servidor MCP en CI?

Capture las solicitudes canónicas con el inspector MCP, péguelas en Apidog, añada aserciones JSONPath, ejecute apidog run en CI. El patrón completo se encuentra en el manual de pruebas del servidor MCP.

¿Es segura la federación entre organizaciones?

La capa de cifrado es sólida. La capa de políticas es su responsabilidad: defina qué proyectos pueden federarse, elimine los secretos de las cargas útiles antes de enviarlas y revise el registro de auditoría regularmente.

¿Cuánto cuesta?

El framework tiene licencia MIT y es gratuito. El costo son los tokens de LLM para los agentes y cualquier almacén vectorial alojado que elija. Un usuario intensivo reporta menos de $200 al mes en Claude Sonnet para el uso diario de Ruflo.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs