5 réflexes pour économiser tes tokens sur Claude, Quentin IA Marketing

Pourquoi tes tokens comptent

Chaque conversation avec Claude tourne dans une fenêtre de contexte limitée. Plus elle se remplit, plus ça coûte de tokens, plus les réponses ralentissent, et plus vite tu tapes ta limite d'usage. La plupart des gens ne s'en rendent compte que quand Claude commence à oublier le début de l'échange ou refuse de continuer.

La bonne nouvelle : tu n'as pas besoin de comprendre la mécanique en détail. Quelques réflexes suffisent pour faire durer tes conversations deux fois plus longtemps, garder Claude vif, et arrêter de gaspiller. Voici les 5 que j'applique tous les jours.

Claude AI Lab

Le Claude AI Lab, c'est ma communauté Skool où je partage mes systèmes Claude et les modules plus avancés. L'entrée est gratuite.

Rejoindre le Lab →

À garder en tête

Tu n'es pas obligé de tout appliquer d'un coup. Commence par le réflexe qui colle à ta façon d'utiliser Claude (Code, Chat ou Cowork), les autres viendront naturellement.

Compacte autour de 60-65%

⌨️ Claude Code → /compact

💡Pourquoi c'est utile

Dans Claude Code, la fenêtre de contexte se remplit au fil de l'échange. La commande /compact résume la conversation et libère de l'espace sans perdre le fil. Tu prolonges la session au lieu de devoir tout relancer depuis zéro.

⚙️Comment faire

Garde un œil sur le pourcentage d'utilisation du contexte affiché par Claude Code.

Vers 60-65%, tape /compact. Claude résume l'essentiel et continue avec un contexte allégé.

Tu enchaînes ta tâche sans coupure : les infos importantes sont conservées, le bruit est nettoyé.

🎯Astuce

→

N'attends pas 90%. Une compaction de dernière minute risque de couper du contexte encore utile. 60-65%, c'est le sweet spot : assez tôt pour rester propre, assez tard pour ne pas compacter pour rien.

→

Tu peux préciser ce que tu veux garder : /compact garde le code du fichier X et la décision sur l'API. Claude priorise ces éléments dans le résumé.

Transforme tes PDF et images en texte

📄 Google Docs + ChatGPT / Gemini

💡Pourquoi c'est utile

Un PDF brut ou une image envoyés à Claude coûtent beaucoup de tokens : mise en page, structure, pixels, tout est embarqué. Le même contenu en markdown (texte épuré) passe avec une fraction des tokens, et Claude le comprend mieux. Pour une image, une description texte précise coûte une fraction d'une image, et tu contrôles exactement ce que Claude « voit ».

⚙️Le PDF en markdown

Ouvre ton PDF dans Google Docs (il le convertit en document texte éditable).

Fais Fichier → Télécharger → Markdown (.md).

Donne le fichier .md à Claude au lieu du PDF d'origine. Même information, format digeste, bien moins de tokens.

🖼️L'image en description

Passe ton image dans un modèle image-to-text (ChatGPT ou Gemini) et demande une description précise de ce qui compte pour toi.

Récupère cette description en texte et donne-la à Claude. Tu paies du texte, pas une image, et tu maîtrises ce qu'il retient.

🎯Quand l'utiliser

📚

Documents longs

Un rapport, un contrat, un guide de 30 pages : le markdown évite de saturer la fenêtre dès le premier message.

📊

Captures et schémas

Un graphe ou une capture d'écran : la description texte cible l'info utile au lieu de faire deviner Claude sur des pixels.

Édite le prompt d'origine au lieu d'empiler les correctifs

✏️ Claude Chat / Cowork

💡Pourquoi c'est utile

Quand une réponse est à côté, le réflexe est d'enchaîner : « non, plutôt comme ça », « ajoute ceci », « enlève ça »… Chaque correctif rallonge la conversation, et tout l'historique est renvoyé au modèle à chaque tour. La fenêtre gonfle pour rien. Éditer le prompt de départ repart proprement, sans traîner les allers-retours.

⚙️Comment faire

Remonte au prompt d'origine (celui qui a lancé l'échange à corriger).

Clique pour l'éditer et ajoute l'information manquante qui aurait évité l'erreur (le contexte, la contrainte, le format attendu).

Renvoie. Claude regénère une réponse propre à partir de ce point, sans l'empilement de correctifs.

🎯À retenir

Le bon réflexe

Un prompt d'origine bien édité vaut mieux que cinq prompts correctifs. Tu gagnes en tokens et en qualité de réponse.

Un fil, un sujet

🧵 Claude Chat / Cowork

💡Pourquoi c'est utile

Chaque message renvoie toute la conversation au modèle. Un fil fourre-tout, où tu enchaînes des sujets sans lien, te fait payer le contexte accumulé à chaque nouveau message, même pour une question simple. Un fil par sujet garde chaque échange léger.

⚙️Comment faire

Nouveau sujet sans rapport avec l'échange en cours ? Ouvre une nouvelle conversation plutôt que de continuer dans le fil actuel.

Garde un fil dédié par projet, client ou tâche. Quand un échange a atteint son but, démarres-en un neuf pour la suite.

🎯Bonus

→

Moins de contexte à traiter = réponses plus rapides en prime. Un fil court reste vif du début à la fin.

Mets le contexte permanent dans un Project

📁 claude.ai → Projects

💡Pourquoi c'est utile

Si tu recolles les mêmes consignes, le même contexte ou les mêmes documents de référence à chaque nouvelle conversation, tu paies ces tokens en double à chaque fois. Un Project stocke ce contexte une seule fois, et toutes tes conversations y accèdent sans que tu le répètes.

⚙️Comment faire

Dans claude.ai, crée un Project pour un client, un produit ou un workflow récurrent.

Mets tes instructions et tes documents de référence une fois dans la knowledge du projet (les consignes de style, le contexte business, les docs clés).

Toutes les conversations lancées dans ce Project héritent du contexte automatiquement. Sur Cowork, même logique : garde le contexte stable dans l'espace de travail au lieu de le réécrire à chaque fois.

🎯Quand ça change tout

🧑‍💼

Un client récurrent

Brief, ton de marque, historique : posés une fois, réutilisés à chaque conversation sans recopier.

🔁

Une tâche répétée

Rédaction de posts, réponses support, analyses : le cadre est fixé dans le Project, tu ne décris plus le décor à chaque message.

Le réflexe global

Tous ces gestes reviennent à une seule idée : ne fais entrer dans la fenêtre que ce qui est utile, et au bon moment. Compacte avant que ça déborde, donne du texte propre plutôt que des formats lourds, corrige à la source au lieu d'empiler, sépare tes sujets, et range le contexte permanent là où il se réutilise.

Le résultat

Des conversations plus longues, plus rapides, et beaucoup moins de limites atteintes. Tu passes plus de temps à avancer, moins à relancer Claude de zéro.

Pourquoi tes tokens comptent

Compacte autour de 60-65%

Transforme tes PDF et images en texte

Édite le prompt d'origine au lieu d'empiler les correctifs

Un fil, un sujet

Mets le contexte permanent dans un Project

Le réflexe global

Tu veux aller plus loin ?