Jika Anda telah mengikuti ekosistem Claude Code, Anda mungkin memperhatikan sebuah proyek yang secara diam-diam beralih dari “paket npm yang menarik” menjadi “lapisan koordinasi standar untuk tim Claude Code yang serius.” Proyek tersebut bernama Ruflo, yang dikelola oleh rUv, dan berkembang dari upaya awal claude-flow. Idenya sederhana: Claude Code sendiri menjalankan satu agen pada satu waktu. Ruflo mengubahnya menjadi sebuah swarm (kawanan).
Panduan ini menjelaskan apa yang dilakukan Ruflo, bagaimana perbedaannya dengan tumpukan server MCP, kapan layak untuk diinstal, dan cara menguji agen serta lalu lintas MCP di bawahnya dengan Apidog. Jika Anda baru memulai dengan format file agen yang dibaca Claude Code saat boot, panduan agents.md kami adalah bacaan prasyarat.
TL;DR
- Ruflo (sebelumnya claude-flow) adalah platform orkestrasi multi-agen untuk Claude Code oleh
rUv, dengan 98 agen, 60+ perintah, 30 skill, server MCP, hooks, dan daemon. - Satu perintah
npx ruvflo initmenambahkan lapisan koordinasi yang memungkinkan Claude Code meluncurkan swarm, berbagi memori antar sesi, dan memfederasikan pekerjaan antar mesin. - Ada dua jalur instalasi: Plugin Claude Code versi lite (hanya perintah slash) dan instalasi CLI penuh (semuanya terhubung).
- Di bawahnya adalah mesin AI bertenaga Rust, embeddings, sistem plugin, dan arsitektur Cognitum.One.
- Gunakan Apidog untuk menguji endpoint
tools/list,tools/call, dan federasi server MCP; memalsukan penyedia LLM selama CI; dan memutar ulang lalu lintas swarm ketika terjadi regresi agen. - Unduh Apidog untuk menambahkan lapisan kontrak di atas Ruflo sebelum ia mengambil alih lebih banyak alur kerja harian Anda.
Apa yang sebenarnya dilakukan Ruflo
Secara default, Claude Code adalah loop agen tunggal: Anda berbicara dengan satu model, ia mengedit satu ruang kerja, ia tidak mengingat apa pun antar sesi. Itu berfungsi untuk tugas-tugas singkat. Namun, itu tidak akan efektif ketika Anda ingin sekelompok agen spesialis untuk mengatasi refactor, atau ketika Anda ingin temuan satu agen menginformasikan sesi berikutnya, atau ketika Anda ingin dua mesin berkoordinasi.

Ruflo terhubung ke Claude Code sebagai lapisan koordinasi. Setelah init, setiap tugas yang Anda berikan kepada Claude akan melewati sebuah router yang memutuskan apakah akan:
- Menjalankan tugas sebagai agen tunggal (default Claude Code)
- Meluncurkan swarm spesialis (misalnya, satu untuk tinjauan keamanan, satu untuk pengujian, satu untuk dokumentasi)
- Melanjutkan dari memori sesi sebelumnya
- Memfederasikan pekerjaan ke agen di mesin lain
README menggambarkannya sebagai “Claude Code dengan sistem saraf.” Itu menangkap bentuknya: Ruflo tidak menggantikan Claude Code, ia menambahkan lapisan yang membuat 100 agen spesialis terasa seperti satu alat.

Arsitektur dalam satu diagram
Alur yang disederhanakan dari README:
User -> Ruflo (CLI/MCP) -> Router -> Swarm -> Agents -> Memory -> LLM Providers
^ |
+---- Learning Loop <------+
Lima komponen penting untuk pengujian.
Entri CLI/MCP. Anda dapat mengoperasikan Ruflo dari baris perintah atau dari integrasi MCP Claude Code. Kedua antarmuka menggunakan protokol yang sama di bawahnya.
Router. Klasifikator kecil (dapat dikonfigurasi, bisa berupa model lokal) memutuskan jalur mana yang akan diambil tugas. Swarm vs agen tunggal vs melanjutkan vs federasi.
Swarm. Sekelompok agen spesialis dengan prompt dan set alat yang terfokus. Meluncurkan swarm setara dengan kru CrewAI, tetapi terintegrasi lebih erat dengan konteks Claude Code sendiri.
Memori. Persisten antar sesi, dapat ditanyakan oleh agen di masa depan. Di sinilah “learning loop” berjalan: pola yang berhasil dinilai dan digunakan kembali.
Penyedia LLM. Ruflo agnostik terhadap penyedia. Claude adalah default; OpenAI, DeepSeek, Gemini, dan Ollama lokal berfungsi melalui konfigurasi penyedia standar.
Ada dua jalur instalasi; pilih berdasarkan seberapa banyak yang sebenarnya Anda inginkan.
Jalur instalasi dan apa yang diberikan masing-masing
README secara eksplisit menjelaskan tradeoff yang membingungkan pengguna pertama kali.
Jalur A: Plugin Claude Code (lite). Anda menginstal melalui marketplace Claude Code: /plugin install ruflo-core@ruflo. Ini hanya menambahkan perintah slash dan definisi agen. Server MCP Ruflo tidak terdaftar, yang berarti alat seperti memory_store, swarm_init, dan agent_spawn tidak dapat dipanggil dari Claude. Baik untuk mencoba perintah satu plugin tanpa berkomitmen.
Jalur B: Instalasi CLI (penuh). Anda menjalankan npx ruvflo init di proyek Anda. Ini menyiapkan .claude/, .claude-flow/, CLAUDE.md, skrip pembantu, dan server MCP. Hooks akan aktif pada setiap interaksi Claude Code. Memori akan tetap ada. 98 agen, 60+ perintah, 30 skill, dan federasi semuanya terhubung.
README memperingatkan: “setelah init, cukup gunakan Claude Code secara normal; sistem hooks secara otomatis merutekan tugas.” Itulah intinya. Anda tidak perlu menghafal 314 alat MCP. Kerangka kerja menangani perutean.
Bagi sebagian besar tim rekayasa yang serius menjalankan Claude Code, Jalur B adalah yang Anda inginkan. Jalur A adalah untuk mengevaluasi satu plugin secara terpisah.
Apa yang disertakan dalam paket
Beberapa komponen unggulan dari katalog plugin.
ruflo-core. Penyimpanan memori, inisialisasi swarm, primitif pemijahan agen. Fondasi yang dibangun oleh setiap plugin lainnya.
ruflo-swarm. Koordinasi multi-agen dengan spesialisasi peran. Luncurkan swarm tinjauan kode dengan agen keamanan, agen kinerja, agen dokumen, dan synthesizer.
ruflo-autopilot. Otomatisasi tugas jangka panjang. Menyerahkan tujuan ke kerangka kerja dan membiarkannya berulang hingga selesai, dengan titik pemeriksaan.
ruflo-federation. Komunikasi agen-ke-agen yang aman antar mesin. Lapisan federasi mengenkripsi payload sehingga dua organisasi dapat membiarkan agen berkolaborasi tanpa membocorkan sumber.
RuVector. Penyimpanan vektor dan backend grafik yang digunakan oleh lapisan memori. Opsional tetapi direkomendasikan setelah proyek Anda memiliki lebih dari beberapa ratus sesi konteks terakumulasi.
Marketplace plugin juga menyediakan paket khusus untuk pengujian, keamanan, refactoring, dan observabilitas. Polanya konsisten: satu plugin sama dengan satu kemampuan terfokus, semuanya dibangun di atas primitif memori inti dan swarm.
Mengapa lapisan MCP penting
Server MCP Ruflo adalah yang membuat kerangka kerja terhubung ke runtime Claude Code. Setiap pemijahan swarm, penulisan memori, dan serah terima terfederasi adalah panggilan JSON-RPC terhadap server MCP lokal.
Itu membuat permukaan MCP menjadi hal terpenting untuk diuji. Jika tools/list mengalami regresi, Claude Code berhenti melihat primitif swarm dan tim Anda secara diam-diam kembali ke mode agen tunggal. Jika memory_store mengembalikan bentuk yang salah, agen mulai berhalusinasi konteks.
Ini adalah masalah yang sama yang kami bahas dalam panduan pengujian server MCP. Server MCP Ruflo adalah API JSON-RPC; perlakukan seperti itu.
Menguji server MCP Ruflo dengan Apidog
Rencana pengujian awal yang akan terbayar dengan sendirinya pada regresi pertama yang berhasil ditangkap.
Langkah 1: tangkap permintaan kanonis. Jalankan npx ruvflo init di proyek awal. Jalankan beberapa tugas representatif melalui Claude Code dengan Ruflo aktif. Buka pemeriksa MCP Claude Code dan tangkap frame JSON-RPC untuk initialize, tools/list, tools/call dengan swarm_init, dan tools/call dengan memory_store.
Langkah 2: tempelkan ke Apidog. Buat proyek baru, atur URL dasar ke server MCP Ruflo lokal Anda (Jalur B menginstalnya sebagai MCP terdaftar), dan simpan setiap frame yang diambil sebagai permintaan. Apidog menangani body JSON-RPC secara native.
Langkah 3: tambahkan assertions (penegasan).
initialize: tegaskanresult.serverInfo.name == "ruflo"dan versi protokol adalah yang Anda dukung.tools/list: tegaskanresult.tools.length >= 100(Ruflo menyediakan ~100 alat), setiap alat memilikiname,description, daninputSchema.tools/calluntukswarm_init: tegaskan respons menyertakan ID swarm dan bukan hasil kesalahan.tools/calluntukmemory_store: tegaskan penulisan berhasil dan kunci yang sama dapat dibaca olehmemory_get.
Langkah 4: tiru penyedia LLM. Ruflo memanggil Claude (atau penyedia mana pun yang Anda konfigurasikan) untuk setiap keputusan agen. Eksekusi CI tidak boleh memukul penyedia sungguhan di setiap commit. Apidog meniru endpoint yang kompatibel dengan OpenAI dengan respons realistis; arahkan konfigurasi penyedia Ruflo ke tiruan selama pengujian. Polanya sama dengan yang kami dokumentasikan di pengujian API tanpa Postman.
Langkah 5: jalankan suite dalam CI. Runner CLI Apidog keluar dengan kode non-nol saat terjadi kegagalan penegasan. Hubungkan ini ke GitHub Actions dan lain kali seseorang memperbarui Ruflo dan merusak bentuk MCP, PR Anda akan gagal sebelum digabungkan.
Di mana Apidog cocok dalam alur harian Ruflo
Di luar CI, ada tiga momen sehari-hari di mana Apidog membuktikan nilainya dengan Ruflo.
Ketika swarm berperilaku tidak semestinya. Putar ulang urutan persis frame tools/call yang dikirim Claude Code. Bandingkan dengan eksekusi yang diketahui baik. Perbedaan biasanya menunjukkan argumen alat yang menyimpang karena template prompt berubah.

Saat Anda memutakhirkan Ruflo. Rilis baru, antarmuka alat baru. Jalankan rangkaian pengujian terlebih dahulu; perbedaan dengan versi sebelumnya memberi tahu Anda alat mana yang diubah namanya, dihapus, atau berubah bentuk. Kami menggunakan alur kerja yang sama untuk membandingkan kontrak API dalam pengembangan API contract-first.
Ketika federasi mengalami masalah. Agen federasi berkomunikasi melalui saluran terenkripsi; men-debug jabat tangan tanpa instrumentasi sangatlah sulit. Apidog dapat merekam lalu lintas federasi saat Anda mengarahkannya ke port proxy lokal; log permintaan membuat kegagalan terlihat jelas.
Kesalahan umum
Pola yang muncul di isu GitHub dan Discord.
Menginstal jalur plugin dan mengharapkan fungsionalitas penuh. README sudah jelas; plugin hanya berupa perintah slash. Jika swarm_init tidak dapat dipanggil dari Claude, Anda menginstal jalur lite. Jalankan kembali npx ruvflo init untuk instalasi penuh.
Melewatkan lapisan hooks. Jalur B menginstal hooks yang merutekan tugas secara otomatis. Jika Anda menghapus instalasinya atau menimpanya, router tidak akan pernah aktif dan Anda akan kehilangan koordinasi swarm. Biarkan pengaturan default sampai Anda punya alasan.
Membiarkan memori bertumbuh tanpa batas. Penyimpanan memori bersifat persisten dan tidak terbatas secara default. Setelah beberapa minggu penggunaan berat, indeks menjadi cukup besar untuk memperlambat pemijahan swarm. Konfigurasi retensi; halaman pengaturan README mencakup kontrolnya.
Menganggapnya sebagai alat khusus Claude. Ruflo agnostik terhadap penyedia. Defaultnya adalah Claude, tetapi Anda dapat beralih ke DeepSeek V4 untuk swarm yang sensitif biaya atau ke Llama 5.1 lokal untuk eksekusi offline. Panduan API DeepSeek V4 kami dan artikel LLM lokal terbaik tahun 2026 mencakup konfigurasi penyedia untuk keduanya.
Melupakan bahwa federasi melewati batas kepercayaan. Ketika Anda memfederasikan ke mesin lain, Anda mengirimkan payload (berpotensi termasuk kode) ke endpoint tersebut. Lapisan enkripsi kuat; pekerjaan kebijakan adalah milik Anda. Tentukan proyek mana yang dapat berfederasi sebelum Anda mengaktifkannya.
Bagaimana Ruflo dibandingkan dengan kerangka kerja agen lainnya
Tiga kerangka kerja sering muncul dalam percakapan yang sama.
LangGraph. Tingkat rendah, generik. Anda membangun orkestrasinya sendiri. Pilih LangGraph ketika Anda menginginkan kontrol penuh dan alur kerja Anda tidak berbentuk Claude Code. Kami membahas LangGraph dalam artikel TradingAgents kami.
CrewAI. Multi-agen, agnostik kerangka kerja, lebih banyak konfigurasi. Pilih ini untuk alur kerja non-Claude di mana Python adalah bahasa utamanya.
Server MCP ditumpuk secara manual. Buat sendiri. Lebih ringan dari Ruflo, lebih sulit dikoordinasikan. Baik untuk dua atau tiga server; menyakitkan jika lebih dari lima.
Niche Ruflo adalah “Claude Code, tetapi dengan swarm.” Jika alat utama harian Anda adalah Claude Code dan Anda menginginkan koordinasi tanpa menulis 600 baris boilerplate MCP, itu layak untuk diinstal.
Catatan kinerja dan skala
Dua observasi operasional dari tim yang menjalankan Ruflo selama beberapa bulan.
Meluncurkan swarm memiliki biaya tetap dua hingga empat detik untuk keputusan router ditambah registrasi alat. Untuk tugas yang sangat singkat (edit satu baris), overhead ini dominan; Anda ingin router mengirim tugas-tugas tersebut ke jalur agen tunggal, bukan ke dalam swarm. Perutean default biasanya melakukan ini dengan benar; jika tidak, konfigurasi hooks adalah tempat Anda menyetel ambang batas.
Kueri memori menjadi lebih lambat seiring bertambahnya ukuran penyimpanan. SQLite menangani beberapa ribu sesi dengan baik; setelah itu, beralihlah ke Postgres atau RuVector. Sebuah tim yang menjalankan Ruflo di enam insinyur dan riwayat 18 bulan melaporkan kueri memori median 40 ms di Postgres versus 600 ms di SQLite default pada volume yang sama.
Studi kasus nyata
Sebuah tim platform menggunakan lapisan federasi Ruflo untuk menjalankan tinjauan keamanan pada satu repo sementara swarm refactoring berjalan pada repo lain, keduanya dikoordinasikan melalui penyimpanan memori bersama. Mereka menampilkan rekomendasi yang bertentangan kepada peninjau manusia.
Seorang pengembang solo menghubungkan mode autopilot Ruflo ke antrean tiket Linear: “pilih tiket P3, periksa, ajukan perbaikan, buka PR, lalu lanjutkan.” Autopilot berjalan semalaman; pengembang meninjau di pagi hari.
Sebuah kelompok penelitian menggunakan pola tinjauan kode multi-agen dari Ruflo untuk mengevaluasi kualitas PR di tiga repositori. Total pengeluaran LLM di bawah $50 seminggu di Claude Sonnet, dibandingkan dengan peninjau manusia tunggal seharga $80 per jam.
Kesimpulan
Ruflo adalah jawaban serius untuk pertanyaan “bagaimana saya bisa menskalakan Claude Code lebih dari satu agen pada satu waktu?” Instalasi CLI menambahkan memori, swarm, federasi, dan server MCP dengan 100+ alat dalam satu perintah. Marketplace plugin memisahkan kemampuan dengan rapi sehingga Anda dapat mengadopsinya secara bertahap.
Lima poin penting:
- Ruflo mengubah Claude Code menjadi koordinator swarm dengan memori persisten dan federasi opsional.
- Jalur A (plugin) untuk evaluasi; Jalur B (
npx ruvflo init) untuk penggunaan sehari-hari. - Server MCP adalah permukaan kontrak; ujilah dengan cara yang sama seperti Anda menguji API JSON-RPC lainnya.
- Apidog adalah tempat terbaik untuk menangkap permintaan MCP kanonis, menambahkan assertions, dan menjalankan suite di CI.
- Tiru penyedia LLM di Apidog agar eksekusi CI tetap cepat dan gratis.
Langkah selanjutnya: jalankan npx ruvflo init di proyek awal, tangkap frame MCP di pemeriksa Claude Code, dan tempelkan ke proyek Apidog. Regresi pertama yang Anda tangkap akan membayar untuk penyiapan.
FAQ
Apakah Ruflo sama dengan claude-flow?
Ya. Ruflo adalah claude-flow yang diganti namanya, dikelola oleh rUv (penulis yang sama). Paket npm-nya adalah ruvflo; repo GitHub-nya adalah ruvnet/ruflo. Konfigurasi claude-flow yang ada terus berfungsi.
Apakah saya perlu plugin dan instalasi CLI?
Tidak. Pilih salah satu. Plugin memberi Anda perintah slash; instalasi CLI memberi Anda lapisan koordinasi penuh. Sebagian besar tim menginginkan instalasi CLI.
Bisakah saya menggunakan Ruflo tanpa Claude?
Ya. Ruflo agnostik terhadap penyedia. Konfigurasi DeepSeek V4, GPT-5.5, Gemini, atau model lokal dalam konfigurasi penyedia. Claude adalah default karena kerangka kerja ini berkembang dari claude-flow.
Di mana memori disimpan?
Di penyimpanan SQLite atau Postgres lokal, tergantung konfigurasi Anda. Backend RuVector opsional menambahkan pencarian vektor untuk pengambilan semantik. Memori tidak bocor ke layanan pihak ketiga kecuali Anda mengonfigurasinya secara eksplisit.
Bagaimana cara menguji server MCP di CI?
Tangkap permintaan kanonis dengan pemeriksa MCP, tempelkan ke Apidog, tambahkan assertions JSONPath, jalankan apidog run di CI. Pola lengkapnya ada di panduan pengujian server MCP.
Apakah federasi aman antar organisasi?
Lapisan enkripsi kuat. Lapisan kebijakan adalah tanggung jawab Anda: tentukan proyek mana yang dapat berfederasi, bersihkan payload dari rahasia sebelum mengirim, dan tinjau log audit secara teratur.
Berapa biayanya?
Kerangka kerja ini berlisensi MIT dan gratis. Biayanya adalah token LLM untuk agen dan penyimpanan vektor terkelola yang Anda pilih. Pengguna berat melaporkan kurang dari $200 per bulan pada Claude Sonnet untuk penggunaan Ruflo sehari-hari.
