« Claude usage limit reached*» : Chronique d’un dev qui parle plus à son IA qu’à sa famille — REX IA
* Limite d’utilisation de Claude atteinte
TL;DR
J’ai passé des semaines à tripatouiller l’Intelligence Artificielle (aka l’IA), prompts, Cline, Claude, GPT et compagnie. Entre workflows improbables, docs ultra détaillées, quotas explosés et frustrations bien réelles, j’ai appris à cadrer mes IA comme des seniors et à ne plus laisser GPT halluciner tout seul.
Un récit sans bullshit, plein de conseils, de fails¹ et de petites victoires qui pourraient bien t’éviter quelques migraines (et quelques euros cramés).

Step 1 : Le commencement
L’IA est là, super ! On fonce ! On a le feu vert officiel du client, yala !
Bon, soyons honnêtes : c’est top dans l’IDE (Integrated Development Environment²) . Ça fait de l’autocompletion ++, ça m’évite de coder pendant des heures un algo un peu bancal pour finir par le rechercher sur StackOverflow, ça me mâche même des fonctions entières quand j’ai la flemme. Bref, c’est cool… mais pas encore révolutionnaire.
💡 Tips :
Quand tu sens poindre la flemme de te coltiner une regex ou un petit algo de tri fastidieux, n’hésite pas : écris un commentaire bien détaillé, appuie sur TAB et yala, merci l’IA !
Step 2 : Les autres en parlent
Bon, ça y est, on commence vraiment à en entendre parler partout. C’est super : ça teste des solutions aux quatre coins d’ekino, on a même la chance d’assister à des BBL (Brown Bag Lunchs³ ) dédiés au sujet. Autant dire que ça me chauffe, alors je plonge un peu plus le nez dedans.
Je découvre des techniques de prompting⁴ de plus en plus efficaces. Bref, ça fait le café — à condition de bien lui expliquer comment verser de l’eau très chaude sur du café moulu finement, préalablement déposé dans un filtre à l’intérieur d’une cafetière.
Et là, j’entends parler de Cline, n8n, Claude Code, Bito, OpenRouter, CodeRabbit, Windsurf, Continue… un florilège de mots tous plus hype⁵ les uns que les autres. Je teste, mais à petite dose. Pas envie de finir en overdose de buzzwords⁶.
💡 Tips :
Vous l’avez sûrement déjà entendu, mais demandez à votre IA préférée :
« Tu es une IA experte en prompting et tu maîtrises l’art de faire du café. Aide-moi à rédiger un prompt précis, détaillé et respectant toutes les bonnes pratiques pour nourrir le système prompt d’une IA qui m’aidera ensuite à faire les meilleurs cafés du monde. »
…c’est souvent une super approche.
Ça vous permet de bien poser le contexte, de glisser des mots que vous, petit humain, auriez sûrement eu la flemme d’écrire. Vous ajoutez ensuite votre petite touche perso, puis vous confiez ce prompt à votre deuxième IA préférée (ou à la même, mais avec un nouveau contexte). Résultat ? Un café bio colombien d’exception pour l’investissement d’une dosette Senseo. (Oui, j’aime le café, ça se voit ?)

Step 3 : Les workflows à base d’agent IA
Bon allez, c’est « tipar⁷ » : on fait chauffer la carte bleue pour mettre tout ça en pratique. Je décide donc de casser le PEA et d’investir la somme folle de 10 € sur OpenRouter pour tester des modèles plus avancés, les comparer et rentrer un peu plus dans le vif du sujet.
Fort de cette nouvelle maîtrise du prompting, je me lance alors dans la découverte de n8n, en essayant de réfléchir à des problématiques de mon quotidien où un petit workflow dopé aux agents IA pourrait sérieusement me rendre la vie plus douce.
Et là, illumination. Je pense immédiatement aux heures que je passe sur Instagram à mater des recettes de cuisine. Celles que j’adore refaire, mais où je dois me taper la vidéo 40 fois pendant la recette, juste pour être sûr de bien suivre les étapes dans l’ordre…
(Message perso à tous les instagrameurs de recettes : je sais, c’est relou à écrire, mais filez-nous les étapes en texte bordel, qu’on puisse cuisiner sans perdre 15 minutes à chercher le passage où vous émincez l’oignon !)
Bref, je m’égare.
Du coup, je monte un workflow n8n :
- J’envoie un message via Telegram avec l’url de la vidéo Instagram.
- Le workflow télécharge la vidéo, en extrait le transcript.
- Puis il l’envoie à mon agent IA spécialisé en recettes de cuisine, qui me transforme ça en une fiche recette détaillée et bien formatée (ingrédients, étapes, catégories, coût, …).
Et là, magie : ça marche nickel ! Après quelques ajustements sur l’agent et le modèle utilisé, j’arrive même à avoir un coût ultra faible. Au bout d’une semaine intensive de tests, de workflows improbables et de situations tirées par les cheveux pour mes pauvres agents, j’ai à peine dépassé les 2 €. Il me reste du budget !
Je trouve même 30 minutes pour « coder » un petit agent IA connecté au JIRA de mon client. Objectif : m’aider à rédiger des tickets ultra-complets, avec critères d’acceptance, impacts, et tout le bazar, histoire de faciliter la vie de l’équipe de dev.

Step 4 : Le code
Oui, on y arrive. Le moment que vous attendiez tous :
Quentin, parle-nous de code maintenant !
Tu es DEV, c’est bien beau ton café, tes recettes de cuisine et tes tickets Jira, mais nous, on veut du code !
Alors là, il faut dire qu’il y a eu un vrai tournant. Non seulement j’ai eu accès à de nouveaux outils, mais surtout, j’ai décidé de m’y plonger à fond avec un projet complet pour vraiment tester les limites.
J’ai donc imaginé un projet en apparence simple, mais bourré de règles de gestion bien strictes, assez casse-tête à développer.
Le pitch :
Je veux créer une application de gestion de tournoi de badminton, où les admins peuvent configurer les tournois, inscrire les joueurs, saisir les scores des matches, et afficher un classement.
Plusieurs formats de tournoi sont possibles : Simple (1v1), Double (2v2) et Double random (2v2 avec changement de partenaire à chaque match).
Osef de la techno, mais je veux du code clean, des tests, de la doc, et surtout un truc qui marche !
Allez hop, je branche Cline, Claude Sonnet 4, mon compte OpenRouter (avec mes 7 € restants) et je vais commencer par écrire la doc, définir les règles, pour que Cline soit bien au clair avant même la moindre ligne de code. Je passe plusieurs heures à peaufiner cette doc, et là… bam :
Crédit OpenRouter insuffisant, veuillez recharger.
Ah tiens, ça consomme plus vite que prévu.
Ok, je rajoute 10 balles et je repars bille en tête sur mon projet (ou Claude a choisi pour moi : Next, React et TypeScript).
Mais rebelote : dans la même soirée, crédit épuisé.
Je repasse alors sur mon cher combo Copilot + GPT 4.1, et là, bizarrement (ou pas), c’est difficile…. BEAUCOUP plus difficile.
Claude Sonnet 4 me proposait carrément :
- de lancer des commandes,
- d’ouvrir un browser⁸ pour naviguer dans l’interface et vérifier les éléments,
- d’écrire mes tests,
- de mettre à jour ma doc,
- de builder mes containers Docker…⁹
Bref, il bossait comme un vrai senior.
GPT, lui, se contentait de :
Tiens, voilà la commande. Lance-la et file-moi l’output.¹⁰
Direct, l’expérience était plus décevante et frustrante.
Là où Claude itérait jusqu’à trouver la bonne solution (et me bouffer tous mes crédits au passage), GPT hallucine un max. Je dois corriger sans cesse, lui rappeler que la propriété raquette n’a rien à faire sur mon objet tournoi, mais sur joueur, non ?
Bref, j’ai goûté au senior expert dans son domaine, pour finir avec… le stagiaire. (Big up aux stagiaires, c’est pour l’image 😜)

Après discussion avec mon CTO, je découvre qu’en branchant le Copilot entreprise d’ekino à mon VS Code, je peux utiliser Claude Sonnet 4 via Cline. Nouveau boost de motivation !
À moi la conquête des terrains de badminton et la domination du volant en plume… Ouais, enfin, il est 1h30 du matin quand j’écris ça, donc je suis pas très net.
Bref, je me relance dans mon développement mais très rapidement, le couperet tombe :
API Streaming Failed : You’ve exhausted your premium model quota. Please reach out to your organization’s Copilot admin…¹¹

Eh oui, avec Copilot, il y a des quotas sur l’utilisation des modèles les plus avancés (sinon, ça rapporterait pas assez 😏). Et avec Cline, ces limites, tu les exploses très vite.
Bien décidé à ne pas lâcher l’affaire, je prends un abonnement Claude Pro (à 20 €), annoncé « sans limite » (spoiler¹²: c’est faux).
Ça donne accès à Claude Code, je le branche dans Cline, et c’est reparti mon petit kiwi.
Et là… magique : ça marche bien, c’est top, c’est rapide, je retrouve mon efficacité, ça sort des réponses pertinentes, ça bosse bie…
Claude usage limit reached. Your limit will reset at 2am (Europe/Paris).¹³
💡 Tips :
Cline est super puissant pour manipuler le contexte des demandes, interagir avec le modèle, mettre en cache les tokens, gérer les contextes…
…mais c’est un vrai tokenivore (oui, ça se dit). Il bouffe du token au petit-déj, à midi, à quatre heures et le soir.
Résultat : quotas explosés très vite.
J’ai aussi ajouté des .clinerules custom¹⁴ pour qu’il priorise la lecture de mon dossier /docs avant chaque tâche. Ça n’a pas aidé 😅.
💡 Tips2 :
J’ai branché Bito pour des reviews¹⁵ automatisées dans GitLab.
Je suis encore mitigé sur la solution : certains retours sont pertinents, d’autres n’apportent pas grand-chose. En plus, c’est lent à se déclencher, ça casse un peu le flow¹⁶. Mais bon, c’est un bon premier pas.
💡 Tips3 :
La génération du modèle de la base de données (BDD) était franchement pas dingue.
J’ai pas forcé le modèle dans une direction ou dans les exemples, mais j’aurais dû. Valider le modèle en amont aurait évité qu’il parte dans tous les sens.
Step 5 : On apprend de ses erreurs et on recommence.
Fort de ces nouvelles connaissances, je reprends le même projet, mais cette fois on repart de zéro, avec une nouvelle stack techno¹⁷ (Python + React Native… parce que pourquoi pas, hein ?).
Je me suis calé 5 heures avec Cline, Gemini et GPT, sans ajouter une seule ligne de code, juste pour écrire de la doc. Beaucoup de doc….
- Git, architecture, qualité, Docker, internationalisation, Storybook, migrations BDD…
- Un contexte hyper carré, des règles de gestion bien détaillées,
- des .clinerules aux petits oignons (que j’espérais plus optimisées),
- une collection Bruno (pour l’API),
- des règles strictes pour la contribution,
- et plein d’autres trucs pour cadrer un maximum avant les devs.
J’ai pris le temps de poser le modèle BDD avec l’IA, de lui expliquer précisément ce que je voulais, comment je comptais le gérer. Je lui ai même demandé de me générer des ADR (Architecture Decision Records¹⁸) pour chaque décision structurante du projet : choix des technos, comparatifs du marché, etc.
Cerise sur le gâteau : j’ai demandé à l’IA de générer sa propre TODO list¹⁹, avec toutes les étapes DEV à venir. Comme ça, on a même son plan de bataille à elle.
Puis est venu le moment de lâcher les chevaux. Cette fois-ci, j’ai directement attaqué avec Claude Code, sans passer par Cline (oui, j’ai écrit des .clinerules pour rien, et alors ? 😄).
Je lui ai dit d’aller lire toute la doc que son pote IA avait si gentiment préparé, d’initier un joli fichier Claude.md dans lequel j’ai ajouté mes règles absolues bien ancrées. Et au moment où j’écris ces lignes, surprise agréable : j’ai l’impression de pouvoir travailler plus longtemps avant de me heurter aux limites de Claude, et d’avoir à poireauter 5 heures pour reset.
Mes tâches sont plus unitaires, donc plus faciles à gérer, ça part moins dans tous les sens. Claude réfléchit, il réfléchit même très bien, me sort sa TODO, et se lance. Bien sûr, j’ai toujours des retours à faire, des changements à demander, mais c’est beaucoup plus fluide.
Je songe même sérieusement à prendre l’abonnement Claude Max (à 100 €) pour repousser encore ces satanées limites et ne plus être interrompu dans mon flow. Mais une chose est sûre : je ne repasse plus sur GPT 4.1 « en attendant ». Je préfère changer complètement de tâche. C’est encore frustrant d’attendre, mais au final, je me sens beaucoup plus efficace comme ça.
💡 Tips :
Utilisez Cline pour initialiser le projet, les règles, la doc, puis arrêtez de l’utiliser pour le développement. La consommation de tokens sera réduite et vous pourrez tirer le meilleur de la solution, selon moi.
💡 Tips2 :
J’ai testé le “Beast Mode v2” pour essayer d’encourager ChatGPT à se comporter un peu plus comme Claude, il y a en effet une amélioration, mais c’est toujours pas suffisant.

Quentin usage limit reached. Your limit will reset at 9am (Europe/Paris).²⁰
¹ d’échecs
² Environnement de développement
³ Brown Bag Lunchs: Pratique qui consiste à faire une présentation sur la pause déjeuner au collègues, en ramenant son repas (dans un sac en papier marron)
⁴ l’art de formuler vos demandes de façon à ce que l’intelligence artificielle comprenne parfaitement ce que vous recherchez.
⁵ à la mode
⁶ mots à la mode
⁷ parti
⁸ navigateur web
⁹ de construire mes containers Docker
¹⁰ la sortie écran
¹¹ Une erreur est survenue dans l’API : Vous avez consommé la totalité de votre quota. Merci de contacter l’administrateur en charge de Copilot…
¹² divulgacher
¹³ Limite d’utilisation de Claude atteinte. Cette limite sera réinitialisée à 2h00 (Europe/Paris).
¹⁴ personnalisée
¹⁵ relecture de code
¹⁶ flux
¹⁷ l’ensemble des technologies et des outils utilisés ensemble pour construire, développer et déployer une application ou un système
¹⁸ document qui détaille une décision architecturale importante, incluant le contexte, les alternatives envisagées et les raisons de la décision finale
¹⁹ liste des tâches à effectuer
²⁰ Limite d’utilisation de “Quentin” atteinte. Cette limite sera réinitialisée demain matin à 9h00 (Europe/Paris).
« Claude usage limit reached *»: Chronique d’un dev qui parle plus à son IA qu’à sa famille — REX… was originally published in ekino-france on Medium, where people are continuing the conversation by highlighting and responding to this story.