5 réflexes pour économiser tes tokens sur Claude
Compaction, PDF en markdown, prompts édités, Projects. Les réflexes qui rallongent tes conversations Claude sans exploser ta fenêtre de contexte.
21 juin 2026 · 6 min de lecture
Pourquoi tes tokens comptent
Chaque conversation avec Claude tourne dans une fenêtre de contexte limitée. Plus elle se remplit, plus ça coûte de tokens, plus les réponses ralentissent, et plus vite tu tapes ta limite d'usage. La plupart des gens ne s'en rendent compte que quand Claude commence à oublier le début de l'échange ou refuse de continuer.
La bonne nouvelle : tu n'as pas besoin de comprendre la mécanique en détail. Quelques réflexes suffisent pour faire durer tes conversations deux fois plus longtemps, garder Claude vif, et arrêter de gaspiller. Voici les 5 que j'applique tous les jours.
Le Claude AI Lab, c'est ma communauté Skool où je partage mes systèmes Claude et les modules plus avancés. L'entrée est gratuite.
Rejoindre le Lab →Tu n'es pas obligé de tout appliquer d'un coup. Commence par le réflexe qui colle à ta façon d'utiliser Claude (Code, Chat ou Cowork), les autres viendront naturellement.
Compacte autour de 60-65%
Dans Claude Code, la fenêtre de contexte se remplit au fil de l'échange. La commande /compact résume la conversation et libère de l'espace sans perdre le fil. Tu prolonges la session au lieu de devoir tout relancer depuis zéro.
/compact. Claude résume l'essentiel et continue avec un contexte allégé./compact garde le code du fichier X et la décision sur l'API. Claude priorise ces éléments dans le résumé.Transforme tes PDF et images en texte
Un PDF brut ou une image envoyés à Claude coûtent beaucoup de tokens : mise en page, structure, pixels, tout est embarqué. Le même contenu en markdown (texte épuré) passe avec une fraction des tokens, et Claude le comprend mieux. Pour une image, une description texte précise coûte une fraction d'une image, et tu contrôles exactement ce que Claude « voit ».
.md à Claude au lieu du PDF d'origine. Même information, format digeste, bien moins de tokens.Édite le prompt d'origine au lieu d'empiler les correctifs
Quand une réponse est à côté, le réflexe est d'enchaîner : « non, plutôt comme ça », « ajoute ceci », « enlève ça »… Chaque correctif rallonge la conversation, et tout l'historique est renvoyé au modèle à chaque tour. La fenêtre gonfle pour rien. Éditer le prompt de départ repart proprement, sans traîner les allers-retours.
Un fil, un sujet
Chaque message renvoie toute la conversation au modèle. Un fil fourre-tout, où tu enchaînes des sujets sans lien, te fait payer le contexte accumulé à chaque nouveau message, même pour une question simple. Un fil par sujet garde chaque échange léger.
Mets le contexte permanent dans un Project
Si tu recolles les mêmes consignes, le même contexte ou les mêmes documents de référence à chaque nouvelle conversation, tu paies ces tokens en double à chaque fois. Un Project stocke ce contexte une seule fois, et toutes tes conversations y accèdent sans que tu le répètes.
claude.ai, crée un Project pour un client, un produit ou un workflow récurrent.Le réflexe global
Tous ces gestes reviennent à une seule idée : ne fais entrer dans la fenêtre que ce qui est utile, et au bon moment. Compacte avant que ça déborde, donne du texte propre plutôt que des formats lourds, corrige à la source au lieu d'empiler, sépare tes sujets, et range le contexte permanent là où il se réutilise.
Des conversations plus longues, plus rapides, et beaucoup moins de limites atteintes. Tu passes plus de temps à avancer, moins à relancer Claude de zéro.
Tu veux aller plus loin ?
Dans le Lab, je partage mes workflows Claude de bout en bout, ceux qui me font gagner des heures chaque semaine.
Une session ou un programme dédié, calibré sur tes outils et tes cas d'usage.
Et au quotidien, je partage un reel par jour sur Instagram : @quentin_iamarketing