Ruflo : une équipe de sous-agents IA dans Claude Code (et tes tokens qui durent plus longtemps), Quentin IA Marketing

La plupart des gens utilisent Claude Code comme un seul assistant : tu lui donnes une tâche, il la fait du début à la fin, tout seul. Ruflo change ça. Ruflo transforme Claude Code en chef d'équipe : au lieu d'un assistant unique, tu pilotes une équipe de sous-agents spécialisés qui se répartissent le travail et bossent en parallèle.

Si tu as croisé le mode multi-agents qui découpe une grosse tâche entre plusieurs sous-agents, Ruflo joue dans la même cour. La différence : c'est open-source, clé en main, et tu peux mettre un modèle différent sur chaque agent. Un gros modèle pour réfléchir, un petit modèle bon marché pour le travail répétitif. C'est là que tu économises des tokens.

Un mot d'honnêteté avant de commencer : Ruflo est un gros projet (signé ruvnet, l'auteur de claude-flow, dont Ruflo est la suite). Il fait beaucoup de choses. On ne va pas tout couvrir. Ce guide te montre le chemin d'entrée le plus simple pour l'installer dans Claude Code et le faire tourner ce soir, et je vulgarise chaque terme technique au fur et à mesure.

Claude AI Lab

Le Claude AI Lab, c'est ma communauté Skool où je partage mes systèmes Claude et les modules plus avancés. L'entrée est gratuite.

Rejoindre le Lab →

✅Ce qu'il te faut avant de commencer

Claude Code installé. C'est la version de Claude qui agit dans ton terminal et tes projets, pas le simple chat. Si tu l'utilises déjà, tu es prêt.

Node.js installé. C'est le moteur qui fait tourner la commande npx utilisée pour l'installation. Une version récente suffit.

Un dossier de test. Ruflo écrit des fichiers de configuration dans ton projet. Pour le premier essai, pars d'un dossier bac à sable, pas de ton vrai projet.

(Optionnel) Une clé OpenRouter. Seulement si tu veux router d'autres modèles que Claude (Gemini, Qwen, un modèle local). Pas obligatoire pour démarrer.

Le truc à comprendre tout de suite

Il y a deux façons d'installer Ruflo : une version légère pour goûter sans rien casser, et une version complète qui débloque la vraie équipe d'agents. On voit les deux, dans cet ordre.

Comprendre Ruflo

🔗 github.com/ruvnet/ruflo

Ruflo, c'est une couche que tu poses par-dessus Claude Code. En clair, elle ajoute trois choses :

🤖

Une équipe d'agents

Des sous-agents spécialisés (un pour coder, un pour tester, un pour relire) qui se coordonnent au lieu de travailler chacun dans son coin. On appelle ça un essaim, ou swarm en anglais.

💾

Une mémoire qui dure

Ce que les agents apprennent et décident reste sauvegardé d'une session à l'autre, au lieu de repartir de zéro à chaque fois.

🪝

Des hooks qui dispatchent

Un hook, c'est un déclencheur automatique. Ici, ils répartissent les tâches entre les bons agents en arrière-plan, sans que tu aies à orchestrer toi-même.

La version complète arrive prête à l'emploi avec environ 98 agents, plus de 60 commandes et 30 skills, plus un serveur MCP. Un serveur MCP, c'est simplement la prise qui branche des outils supplémentaires sur Claude (mémoire, coordination d'agents, etc.).

Bon à savoir

Tu n'as pas besoin d'apprendre les centaines d'outils de Ruflo pour démarrer. Une fois installé, tu continues à utiliser Claude Code normalement : le système route les tâches et coordonne les agents tout seul, en arrière-plan.

Installer la version légère

📍 dans Claude Code : /plugin

C'est la façon de goûter Ruflo sans rien installer dans ton projet. Cette version ajoute seulement des commandes et des définitions d'agents. Zéro fichier écrit chez toi, et tu peux la retirer en un clic.

🔌Trois étapes, dans Claude Code

Ajoute la marketplace. Dans Claude Code, tape /plugin marketplace add ruvnet/ruflo. Une marketplace, c'est juste le catalogue depuis lequel tu installes les plugins.

Installe un plugin. Tape /plugin install ruflo-federation@ruflo (ou un autre plugin du catalogue, par exemple ruflo-cost-tracker@ruflo pour suivre tes tokens).

Teste. Tape / dans Claude Code : les nouvelles commandes Ruflo apparaissent dans la liste. Lance-en une pour voir.

La limite à connaître

En version légère, les outils d'essaim (créer un essaim, lancer un agent, écrire en mémoire) ne sont pas branchés : le serveur MCP n'est pas installé. C'est parfait pour découvrir les commandes, mais la vraie boucle multi-agents demande la version complète, juste en dessous.

Installer la version complète

📍 terminal : npx ruflo@latest init wizard

C'est elle qui débloque toute l'équipe d'agents. Elle s'installe avec une seule commande, dans un assistant qui te pose les bonnes questions.

⚙️L'installation complète, étape par étape

Place-toi dans ton dossier de test. Ouvre un terminal dans un dossier vide ou un projet bac à sable. C'est là que Ruflo va écrire sa configuration.

Lance l'assistant. Tape npx ruflo@latest init wizard et suis les questions. L'assistant marche pareil sur Mac, Windows et Linux.

Laisse-le installer. Il met en place la boucle complète : les agents, les commandes, les skills, le serveur MCP et les hooks. Il crée aussi quelques fichiers dans ton dossier (.claude/, .claude-flow/, un fichier CLAUDE.md). C'est normal.

Ouvre Claude Code dans ce dossier. Le serveur MCP et les hooks sont maintenant actifs. Tu utilises Claude Code comme d'habitude, Ruflo coordonne les agents en coulisses.

Règle de sécurité à ne pas zapper

La version complète écrit des fichiers et un CLAUDE.md dans ton dossier. Pour le premier essai, fais-le toujours dans un dossier de test, pas dans ton vrai projet de travail. Tu transposeras une fois que tu seras à l'aise.

Économiser tes tokens

📍 le bon modèle au bon endroit

C'est l'intérêt qui parle au porte-monnaie. Ruflo ne t'enferme pas dans un seul modèle. Il en propose six prêts à l'emploi via OpenRouter (une passerelle qui donne accès à plein de modèles avec une seule clé) :

🧠

Modèles costauds

Claude Sonnet 4.6, Gemini 2.5 Pro, ou un modèle OpenAI : pour le raisonnement, l'architecture, les décisions difficiles.

⚡

Modèles légers

Claude Haiku 4.5, Gemini 2.5 Flash, Qwen 3.6 Max : rapides et bon marché, pour le travail répétitif (mise en forme, tests, docs).

🏠

Modèles locaux

Tes propres modèles via Ollama ou LM Studio, qui tournent sur ta machine, sans coût par token.

Le levier d'économie est simple : tu n'es pas obligé de payer un modèle premium pour chaque sous-tâche. Tu mets un modèle léger sur le travail simple et tu gardes le gros modèle uniquement là où il faut vraiment réfléchir. Sur une mission découpée en dix sous-tâches, ça change la facture.

L'outil qui va avec

Installe le plugin ruflo-cost-tracker (via la version légère ou la complète) : il suit ta consommation de tokens, te laisse poser un budget, et t'alerte quand tu approches de la limite. Tu vois enfin où part l'argent.

Exemple concret : ta première mission multi-agents ce soir

Le chemin le plus rapide pour sentir la valeur dès ce soir : installe la version complète dans un dossier de test, puis donne à Claude Code une mission en plusieurs morceaux. Tu vas le voir répartir le travail entre plusieurs agents au lieu de tout faire en file indienne.

🎯La mission, montée en 5 étapes

Crée un dossier de test vide. Par exemple ruflo-test, sur ton bureau.

Installe la version complète. Dans ce dossier, lance npx ruflo@latest init wizard et choisis un profil simple quand l'assistant te le demande.

Ouvre Claude Code dans ce dossier. Les agents et les hooks sont prêts.

Donne-lui la mission ci-dessous. Personnalise les crochets avec ce que tu veux construire.

Regarde le résultat. Claude découpe le travail entre ses agents. Si tu as installé ruflo-cost-tracker, ouvre-le pour voir combien de tokens chaque étape a coûté.

La mission à coller (personnalise les crochets) :

Dans ce projet, construis [CE QUE TU VEUX, ex: une petite API de liste de tâches].

Découpe le travail en sous-tâches et fais bosser plusieurs agents :
- un agent qui écrit le code
- un agent qui écrit les tests
- un agent qui relit et corrige

Mets un modèle léger et bon marché sur les tâches simples
(mise en forme, tests, documentation) et garde un modèle costaud
pour l'architecture et les décisions difficiles.

À la fin, donne-moi un résumé : ce qui a été fait, par quel agent,
et combien de tokens ça a coûté.

Et voilà. Au lieu d'un assistant qui avance tâche après tâche, tu viens de faire tourner une petite équipe, chacun sur son bout, avec le bon modèle au bon endroit. Le squelette ne change pas d'une mission à l'autre : tu remplaces juste ce que tu veux construire, et tu réutilises la même logique pour ton vrai projet une fois que tu es à l'aise.

Pour aller plus loin

Quand tu es prêt à transposer sur du sérieux, garde le réflexe du dossier de test pour chaque nouveau projet, ajoute seulement les plugins dont tu as besoin (sécurité, observabilité, suivi des coûts), et laisse les hooks coordonner. Tu montes en puissance sans jamais perdre le contrôle de ta facture.

Comprendre Ruflo

Installer la version légère

Installer la version complète

Économiser tes tokens

Exemple concret : ta première mission multi-agents ce soir

Tu veux aller plus loin ?