Ruflo : une équipe de sous-agents IA dans Claude Code (et tes tokens qui durent plus longtemps)
Le guide pour débutants et intermédiaires : installer Ruflo dans Claude Code ce soir, faire bosser une équipe de sous-agents en parallèle, et mettre le bon modèle au bon endroit pour économiser tes tokens.
3 juin 2026 · 8 min de lecture
La plupart des gens utilisent Claude Code comme un seul assistant : tu lui donnes une tâche, il la fait du début à la fin, tout seul. Ruflo change ça. Ruflo transforme Claude Code en chef d'équipe : au lieu d'un assistant unique, tu pilotes une équipe de sous-agents spécialisés qui se répartissent le travail et bossent en parallèle.
Si tu as croisé le mode multi-agents qui découpe une grosse tâche entre plusieurs sous-agents, Ruflo joue dans la même cour. La différence : c'est open-source, clé en main, et tu peux mettre un modèle différent sur chaque agent. Un gros modèle pour réfléchir, un petit modèle bon marché pour le travail répétitif. C'est là que tu économises des tokens.
Un mot d'honnêteté avant de commencer : Ruflo est un gros projet (signé ruvnet, l'auteur de claude-flow, dont Ruflo est la suite). Il fait beaucoup de choses. On ne va pas tout couvrir. Ce guide te montre le chemin d'entrée le plus simple pour l'installer dans Claude Code et le faire tourner ce soir, et je vulgarise chaque terme technique au fur et à mesure.
Le Claude AI Lab, c'est ma communauté Skool où je partage mes systèmes Claude et les modules plus avancés. L'entrée est gratuite.
Rejoindre le Lab →npx utilisée pour l'installation. Une version récente suffit.Il y a deux façons d'installer Ruflo : une version légère pour goûter sans rien casser, et une version complète qui débloque la vraie équipe d'agents. On voit les deux, dans cet ordre.
Comprendre Ruflo
Ruflo, c'est une couche que tu poses par-dessus Claude Code. En clair, elle ajoute trois choses :
La version complète arrive prête à l'emploi avec environ 98 agents, plus de 60 commandes et 30 skills, plus un serveur MCP. Un serveur MCP, c'est simplement la prise qui branche des outils supplémentaires sur Claude (mémoire, coordination d'agents, etc.).
Tu n'as pas besoin d'apprendre les centaines d'outils de Ruflo pour démarrer. Une fois installé, tu continues à utiliser Claude Code normalement : le système route les tâches et coordonne les agents tout seul, en arrière-plan.
Installer la version légère
C'est la façon de goûter Ruflo sans rien installer dans ton projet. Cette version ajoute seulement des commandes et des définitions d'agents. Zéro fichier écrit chez toi, et tu peux la retirer en un clic.
/plugin marketplace add ruvnet/ruflo. Une marketplace, c'est juste le catalogue depuis lequel tu installes les plugins./plugin install ruflo-federation@ruflo (ou un autre plugin du catalogue, par exemple ruflo-cost-tracker@ruflo pour suivre tes tokens)./ dans Claude Code : les nouvelles commandes Ruflo apparaissent dans la liste. Lance-en une pour voir.En version légère, les outils d'essaim (créer un essaim, lancer un agent, écrire en mémoire) ne sont pas branchés : le serveur MCP n'est pas installé. C'est parfait pour découvrir les commandes, mais la vraie boucle multi-agents demande la version complète, juste en dessous.
Installer la version complète
C'est elle qui débloque toute l'équipe d'agents. Elle s'installe avec une seule commande, dans un assistant qui te pose les bonnes questions.
npx ruflo@latest init wizard et suis les questions. L'assistant marche pareil sur Mac, Windows et Linux..claude/, .claude-flow/, un fichier CLAUDE.md). C'est normal.La version complète écrit des fichiers et un CLAUDE.md dans ton dossier. Pour le premier essai, fais-le toujours dans un dossier de test, pas dans ton vrai projet de travail. Tu transposeras une fois que tu seras à l'aise.
Économiser tes tokens
C'est l'intérêt qui parle au porte-monnaie. Ruflo ne t'enferme pas dans un seul modèle. Il en propose six prêts à l'emploi via OpenRouter (une passerelle qui donne accès à plein de modèles avec une seule clé) :
Le levier d'économie est simple : tu n'es pas obligé de payer un modèle premium pour chaque sous-tâche. Tu mets un modèle léger sur le travail simple et tu gardes le gros modèle uniquement là où il faut vraiment réfléchir. Sur une mission découpée en dix sous-tâches, ça change la facture.
Installe le plugin ruflo-cost-tracker (via la version légère ou la complète) : il suit ta consommation de tokens, te laisse poser un budget, et t'alerte quand tu approches de la limite. Tu vois enfin où part l'argent.
Exemple concret : ta première mission multi-agents ce soir
Le chemin le plus rapide pour sentir la valeur dès ce soir : installe la version complète dans un dossier de test, puis donne à Claude Code une mission en plusieurs morceaux. Tu vas le voir répartir le travail entre plusieurs agents au lieu de tout faire en file indienne.
ruflo-test, sur ton bureau.npx ruflo@latest init wizard et choisis un profil simple quand l'assistant te le demande.ruflo-cost-tracker, ouvre-le pour voir combien de tokens chaque étape a coûté.La mission à coller (personnalise les crochets) :
Dans ce projet, construis [CE QUE TU VEUX, ex: une petite API de liste de tâches].
Découpe le travail en sous-tâches et fais bosser plusieurs agents :
- un agent qui écrit le code
- un agent qui écrit les tests
- un agent qui relit et corrige
Mets un modèle léger et bon marché sur les tâches simples
(mise en forme, tests, documentation) et garde un modèle costaud
pour l'architecture et les décisions difficiles.
À la fin, donne-moi un résumé : ce qui a été fait, par quel agent,
et combien de tokens ça a coûté.
Et voilà. Au lieu d'un assistant qui avance tâche après tâche, tu viens de faire tourner une petite équipe, chacun sur son bout, avec le bon modèle au bon endroit. Le squelette ne change pas d'une mission à l'autre : tu remplaces juste ce que tu veux construire, et tu réutilises la même logique pour ton vrai projet une fois que tu es à l'aise.
Quand tu es prêt à transposer sur du sérieux, garde le réflexe du dossier de test pour chaque nouveau projet, ajoute seulement les plugins dont tu as besoin (sécurité, observabilité, suivi des coûts), et laisse les hooks coordonner. Tu montes en puissance sans jamais perdre le contrôle de ta facture.
Tu veux aller plus loin ?
Dans le Lab, je partage mes setups d'agents et de sous-agents Claude, et comment les faire bosser en parallèle sans tout casser.
Une session ou un programme dédié, calibré sur tes outils et tes cas d'usage.
Et au quotidien, je partage un reel par jour sur Instagram : @quentin_iamarketing