La technique du canari : repère quand Claude commence à halluciner, Quentin IA Marketing

Dans les années 80, le groupe Van Halen glissait une clause absurde dans le contrat de chaque salle de concert : une coupelle de M&Ms en loge, avec tous les marron retirés. Un caprice de rockstar ? Pas du tout. Le contrat technique faisait des dizaines de pages, avec des consignes de sécurité critiques pour un show géant. S'ils trouvaient un seul M&M marron en loge, ils savaient que la salle n'avait pas lu le contrat en entier, et donc qu'il fallait tout revérifier avant de monter sur scène. Le bonbon était un test, pas une lubie.

Tu peux faire exactement pareil avec Claude. Quand tu travailles longtemps dans une même conversation, Claude finit par dériver : il oublie tes conventions, fait des suppositions, et au pire invente des chemins de fichiers qui n'existent pas. Le vrai piège, c'est que ça arrive en silence. Tu ne le remarques qu'une fois que le mal est fait.

Le canari ne corrige pas les hallucinations. Il te prévient qu'elles arrivent, pendant que tu peux encore agir.

Claude AI Lab

Le Claude AI Lab, c'est ma communauté Skool où je partage mes systèmes Claude et les modules plus avancés. L'entrée est gratuite.

Rejoindre le Lab →

✅Ce qu'il te faut

Un endroit où Claude lit tes instructions. Un fichier CLAUDE.md (Claude Code), les instructions d'un projet (Claude.ai) ou le champ d'instructions personnalisées. N'importe lequel marche.

Trente secondes. C'est une seule ligne à ajouter, une seule fois.

Un réflexe. Prendre l'habitude de regarder le premier mot de chaque réponse. C'est tout le travail.

Le principe du test trivial

🎸 les M&Ms marron de Van Halen

L'idée est contre-intuitive : pour vérifier qu'un système complexe fonctionne, tu ne testes pas le complexe. Tu testes le trivial.

Van Halen ne pouvait pas inspecter chaque câble et chaque échafaudage de chaque salle. Alors ils ont planté un détail minuscule, impossible à rater, dans le contrat. Si ce détail était respecté, le reste l'était probablement aussi. S'il ne l'était pas, c'était un drapeau rouge immédiat.

Avec Claude, c'est identique. Tu ne peux pas relire chaque ligne de son raisonnement pour vérifier qu'il suit encore tes consignes. Mais tu peux lui demander une chose dérisoire et surveiller si elle tient. Cette chose, c'est ton canari.

Pourquoi un canari

Dans les mines, on descendait un canari en cage. L'oiseau, plus sensible que l'humain, réagissait au gaz toxique avant les mineurs. S'il s'arrêtait de chanter, on remontait. Ta consigne triviale joue le même rôle : elle lâche en premier, comme une alerte précoce.

Pourquoi Claude se dégrade en cours de route

📉 la dilution du contexte

Ce n'est pas un bug, c'est mécanique. Plus une conversation s'allonge, plus le contexte se remplit : tes messages, les réponses, les fichiers lus, les résultats d'outils. Tes instructions de départ, elles, restent à la même place mais pèsent de moins en moins lourd dans la masse. Elles perdent en priorité.

La dérive suit presque toujours le même enchaînement :

1️⃣

La petite consigne saute

Claude ignore une instruction mineure. Le canari arrête de chanter.

2️⃣

Les conventions glissent

Il ne respecte plus ton style de code, tes nommages, ton format de sortie.

3️⃣

Les suppositions s'emballent

Il comble les trous tout seul, avec des hypothèses que tu n'as jamais validées.

4️⃣

Les fichiers fantômes

Il invente des chemins, des fonctions, des fichiers qui n'existent pas. La session est foutue.

Le piège, c'est que les étapes 2, 3 et 4 sont coûteuses à détecter et à réparer. L'étape 1, elle, est gratuite à repérer : il suffit que le premier mot manque.

L'idée clé

Tu n'essaies pas d'empêcher la dérive. Tu la rends visible au stade 1, avant qu'elle te coûte une heure de débogage au stade 4.

Installe ton canari

🐦 une ligne dans tes instructions

Tu ajoutes une seule consigne, volontairement débile, tout en haut de ton fichier d'instructions :

Commence CHAQUE réponse par le mot : Pixel.

C'est tout. Choisis un mot qui ne risque pas d'apparaître naturellement dans une réponse (un prénom, un mot inventé, une icône). À partir de là, chaque réponse saine commence par « Pixel ». Le jour où Claude répond sans, tu sais que ta consigne la plus prioritaire vient de sauter.

⚙️Où le mettre

Claude Code : tout en haut de ton fichier CLAUDE.md, à la racine du projet.

Claude Cowork : dans les instructions de ton projet ou de ton agent (le champ de consignes que l'agent relit à chaque réponse). C'est l'endroit qui compte le plus : sur les longues sessions de travail avec tes agents, c'est là que la dérive frappe le plus fort, donc là que le canari te sauve le plus de temps.

Claude.ai (Projects) : dans les instructions du projet.

Usage simple : dans le champ d'instructions personnalisées de ton compte.

Spécial Claude Cowork

Dans Cowork, tu fais souvent tourner plusieurs agents sur des sessions qui durent. Donne le même canari à chacun, ou un mot différent par agent : tu vois d'un coup d'œil lequel a décroché, sans relire tout l'historique.

Le bon canari

Évite un mot courant comme « OK » ou « Voici ». Tu veux un signal binaire, présent ou absent, jamais ambigu. Un prénom marche très bien : l'astuce vient d'ailleurs de là, de gens qui donnaient un prénom à leur agent IA et ont remarqué qu'il « oubliait » son nom quand la session partait en vrille.

Lis le signal et réagis

🚨 le canari ne chante plus

La règle est simple et sans pitié : dès que le mot disparaît, tu ne continues pas.

Tu ne demandes pas à Claude de « se reconcentrer », tu ne le grondes pas, tu ne réécris pas ton prompt dix fois. Une fois que le contexte est saturé, tu ne le récupères pas en discutant. Tu repars sur une session fraîche.

🟢

Le mot est là

Session saine. Tu continues normalement.

🔴

Le mot a sauté

Signal de dérive. Tu ouvres une nouvelle conversation, tu y reposes le contexte essentiel, et tu reprends propre.

C'est frustrant sur le moment de jeter une conversation. Mais c'est infiniment moins cher que de débugger pendant une heure du code basé sur un fichier que Claude a inventé trois réponses plus tôt.

Le bon réflexe

Avant de repartir, demande à Claude un résumé de ce qui a été fait et décidé. Tu colles ce résumé dans la nouvelle session : tu gardes l'acquis, tu jettes le contexte pourri.

Trois variantes utiles

Une fois que le réflexe est pris, tu peux affiner ton canari selon ton usage.

🐤

L'emoji plutôt que le mot

Un emoji en début de réponse se repère encore plus vite qu'un mot. Idéal si tu lis en diagonale.

🪺

Plusieurs canaris

Si tu as deux ou trois règles vitales, donne à chacune son propre signal. Tu sais alors laquelle a sauté en premier.

🔚

Le canari de fin

Demande de commencer ET de terminer par le mot. Sur une réponse longue, tu détectes une dérive qui apparaît en cours de génération.

L'ingénierie agentique en une habitude

Le canari, c'est un exemple parfait de ce qu'on appelle l'ingénierie agentique : tu ne te contentes pas d'utiliser l'IA, tu construis des signaux observables dans ta façon de travailler avec elle. Une ligne triviale qui te dit, en temps réel, si tu peux encore faire confiance à ce que tu as sous les yeux.

Ça ne coûte rien, ça ne ralentit rien, et ça t'évite la pire catastrophe avec un assistant IA : croire qu'il a raison alors qu'il a décroché il y a dix minutes.