← Tous les articles
IA & Business

Fenêtre de contexte : quand relancer Claude pour qu’il reste précis

Rodolphe Le Houx · 10 juin 2026 · 7 min de lecture
Sablier lumineux symbolisant la fenêtre de contexte de Claude qui se remplit
En résumé

Oui, la qualité de Claude se dégrade à mesure que la conversation se remplit : c’est réel et documenté (le « context rot »). Mais ce n’est pas une falaise à 30 ou 40 %, c’est une pente. La bonne pratique n’est pas de surveiller une jauge au pourcent près, c’est de repérer les symptômes (il répète, il oublie une consigne, il perd le fil) et, au moindre doute, de demander un prompt de reprise pour repartir sur une session neuve. C’est exactement ce qu’Anthropic appelle la compaction.

C’est la question qu’on me pose le plus souvent sur Claude : « dans VS Code, on ne peut pas voir où on en est dans la conversation, savoir quand on arrive au bout ? » Voilà, c’est tout l’article.

Réponse courte : oui tu peux voir où tu en es, mais surtout, l’important c’est de savoir quand repartir à zéro et comment ne rien perdre en le faisant. Je vais te donner ma méthode, et ce qu’en dit vraiment la recherche, parce qu’il y a une idée reçue à corriger au passage.

1. Oui, Claude perd en précision quand la conversation se remplit

Ton instinct est bon. Plus une conversation s’allonge, plus le modèle a du mal à tout garder net. Ce n’est pas une impression, ça porte un nom : le context rot.

Anthropic l’explique par un « budget d’attention » fini. Chaque nouveau token consomme ce budget. L’architecture même des modèles (les fameux transformers) crée des relations entre chaque paire de tokens, donc plus il y en a, plus le modèle s’étire. Et ils sont surtout entraînés sur des textes courts, donc moins à l’aise sur les très longs.

L’étude la plus parlante est le rapport Context Rot de Chroma (2025), mené sur 18 modèles de pointe. Sa conclusion : les modèles n’utilisent pas leur contexte de façon uniforme, et la fiabilité baisse quand l’entrée grandit, même sur des tâches triviales. On connaissait déjà le phénomène du « perdu au milieu » : une info placée au milieu d’un long contexte est moins bien exploitée que la même info au début ou à la fin.

2. Mais le seuil magique des 30-40 % n’existe pas

Et là, je dois te corriger, parce que je le croyais aussi. Il n’y a aucun seuil chiffré officiel. Anthropic le dit noir sur blanc : c’est « un gradient de performance, pas une falaise ». La dégradation s’installe progressivement, elle ne tombe pas d’un coup à 30 ou 40 %.

Donc mon repère du tiers ou de la moitié, ce n’est pas une loi de la physique, c’est une assurance. Une habitude prudente pour ne jamais me retrouver dans la zone où ça dérape. Le bon seuil dépend du modèle, de la tâche et de ce que tu as déjà entassé dans la conversation. Personne ne peut te donner un pourcentage magique, et ceux qui le font inventent.

La phrase à retenir : Anthropic décrit la perte de précision comme « un gradient de performance, pas une falaise ». Traduction : ne cherche pas le chiffre exact à ne pas dépasser, prends l’habitude de repartir propre avant que ça se voie.

3. Fie-toi aux symptômes, pas à une jauge

Puisqu’il n’y a pas de seuil, le meilleur indicateur reste ton œil. Tu sais que tu es allé trop loin quand tu vois ces signes :

Il répète des choses déjà dites. Il oublie une consigne que tu avais donnée plus haut. Il refait une erreur que tu avais déjà corrigée. Il perd le fil de l’objectif et part dans une direction que tu n’as pas demandée.

Quand un de ces signaux apparaît, inutile de checker un pourcentage : tu as ta réponse, c’est le moment de couper. Ces symptômes sont bien plus fiables qu’une jauge, parce qu’ils mesurent le seul truc qui compte vraiment, sa précision réelle à cet instant.

4. Comment voir le remplissage dans VS Code

Pour répondre précisément à la question de départ : dans Claude Code, tu n’es pas aveugle. La commande /context te montre ce qui occupe la fenêtre (tes fichiers, tes serveurs branchés, l’historique). La commande /usage te donne le détail des tokens de la session.

Et le plus pratique : tu peux configurer la status line pour afficher l’usage du contexte en continu, en bas de l’écran. Comme ça tu as la jauge sous les yeux en permanence, sans avoir à taper une commande.

5. La vraie technique : le prompt de reprise

Voilà le cœur de tout. Quand tu sens qu’il faut couper, tu ne fermes pas bêtement la conversation. Tu demandes à Claude un prompt de reprise. Quelque chose comme : « Résume où on en est : les décisions prises, les problèmes encore ouverts, l’état actuel, la prochaine étape. Donne-moi un prompt pour reprendre dans une nouvelle conversation. »

Tu jettes le bruit (les longues sorties d’outils, les essais ratés, les allers-retours inutiles) et tu gardes le signal. Puis tu ouvres une session neuve et tu colles ce résumé. Tu repars avec un contexte propre et tout ce qui compte.

Ce n’est pas un bricolage perso : c’est mot pour mot la première technique recommandée par Anthropic, la compaction, qu’ils définissent comme « résumer le contenu et réamorcer une nouvelle fenêtre avec le résumé ». Tu fais juste de la main ce que les pros automatisent.

6. « Oui mais il compacte tout seul de mieux en mieux »

C’est l’objection que je me faisais à moi-même, et elle est légitime. Claude Code compacte effectivement la conversation automatiquement quand il approche de la limite, et tu peux le déclencher à la main avec /compact. C’est de mieux en mieux fait, c’est vrai.

Mais il y a une nuance capitale. L’auto-compaction est subie : c’est la machine qui choisit quoi garder. Le prompt de reprise est piloté : c’est toi qui choisis ce qui survit. Pour une discussion sans enjeu, laisse-le compacter, aucun problème. Pour un travail qui compte, où une décision précise ne doit surtout pas se perdre, le handoff manuel bat l’auto-compaction à tous les coups.

Le bon réflexe : tout-venant, tu laisses Claude compacter seul. Travail sérieux, tu reprends la main avec un prompt de reprise. La différence entre subir et piloter ce qui reste, c’est parfois la décision clé de ton projet.

7. Ma règle en pratique

Concrètement : pour le tout-venant, je laisse couler et je tape /compact si besoin. Pour le travail sérieux, je ne dépasse pas, en gros, le tiers à la moitié de la conversation avant de demander un prompt de reprise et de repartir propre.

Et comme je suis fainéant, j’ai inscrit une règle dans mon fichier d’instructions (le CLAUDE.md) : à partir d’un certain seuil, Claude s’arrête de lui-même et me donne le prompt de reprise. Je n’y pense même plus, c’est automatique.

La bonne façon de voir les choses : l’objectif n’a jamais été de remplir la fenêtre de contexte au maximum. L’objectif, c’est de garder Claude affuté. Une conversation courte et nette bat une conversation longue et saturée, à chaque fois.

Sources : Anthropic, Effective context engineering for AI agents, le rapport Context Rot de Chroma, et la documentation Claude Code, recoupées avec ma pratique quotidienne de Jean Claude.

Vous voulez tirer le maximum de l’IA dans votre boîte ?

J’aide les dirigeants à passer du gadget à un vrai système qui produit. On en parle ?

Réserver un appel →

Questions fréquentes

À partir de combien de pourcent de contexte Claude perd-il en précision ?

Il n’y a pas de seuil officiel. Anthropic parle d’un gradient de performance, pas d’une falaise : la dégradation est progressive et dépend du modèle, de la tâche et de ce qu’il y a dans le contexte. Le repère du tiers ou de la moitié est une habitude prudente, pas une loi.

C’est quoi un prompt de reprise ?

Un résumé que tu demandes à Claude (décisions prises, état courant, problèmes ouverts, prochaine étape) pour redémarrer une conversation neuve sans rien perdre d’important. C’est exactement ce qu’Anthropic appelle la compaction.

Comment voir où j’en suis dans le contexte sur Claude Code (VS Code) ?

La commande /context montre ce qui occupe la fenêtre, /usage affiche le détail des tokens de la session, et tu peux configurer la status line pour voir l’usage du contexte en continu. Tu n’es donc pas aveugle.

C’est quoi le context rot ?

C’est la dégradation de précision quand la conversation se remplit, documentée par l’étude Context Rot de Chroma sur 18 modèles en 2025. Les modèles n’exploitent pas leur contexte de façon uniforme : la fiabilité baisse quand l’entrée grandit, même sur des tâches simples.

/compact ou nouvelle conversation, quoi choisir ?

Pour le tout-venant, /compact suffit, c’est rapide et automatique. Pour le travail qui compte, un prompt de reprise puis une nouvelle conversation est meilleur, parce que tu contrôles toi-même ce qui est conservé.

Si Claude compacte tout seul, pourquoi se donner la peine ?

Parce que l’auto-compaction est subie : c’est la machine qui choisit quoi garder. Le prompt de reprise est piloté : c’est toi qui choisis ce qui survit. Sur une tâche à enjeu, choisir soi-même évite de perdre une décision clé.

Que mettre dans le prompt de reprise ?

Les décisions prises, l’état courant, les problèmes non résolus et la prochaine étape. Et on jette le bruit : les longues sorties d’outils, les pistes abandonnées, les essais ratés. On garde le signal, pas l’historique brut.

Ça marche pareil sur l’appli Claude et sur l’API ?

Le phénomène est universel, il touche tous les modèles. Les commandes /context, /compact et /usage sont propres à Claude Code. Sur l’appli, tu fais le résumé à la main puis tu ouvres un nouveau chat avec ce résumé.

← Agents, Skills, MCP : les briques de Claude Tous les articles →