Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Coûts des agents IA : une variabilité préoccupante
L'utilisation des agents d'intelligence artificielle (IA) s'accompagne d'une augmentation significative des coûts en termes de tokens. Ces agents, en raison de leur nature complexe et de leur fonctionnement, ne permettent pas une prévision précise de la consommation totale de tokens. Cette situation pousse les utilisateurs à exiger une plus grande transparence des prix et des garanties de performance de la part des fournisseurs.
Dans le vaste champ des défis posés par l'IA agentique, la question du coût reste l'une des plus mal comprises. Bien que des entreprises comme OpenAI, Google et Anthropic publient des listes de prix, ces dernières ne fournissent pas une image claire des coûts finaux pour résoudre un problème donné.
Une étude récente menée par l'Université du Michigan, en collaboration avec d'autres institutions, met en lumière un choc tarifaire potentiel : les coûts des agents IA peuvent s'envoler de manière imprévisible, rendant leur gestion financièrement risquée.
Résultats de l'étude : une consommation de tokens exponentielle
L'étude, dirigée par Longju Bai de l'Université du Michigan, avec des collaborateurs de Stanford, All Hands AI, DeepMind de Google, Microsoft et le MIT, s'intitule "Comment les agents IA dépensent votre argent ? Analyse et prédiction de la consommation de tokens dans les tâches de codage agentiques". Elle est présentée comme la première étude systématique sur ce sujet.
Les chercheurs ont découvert que les agents consomment des quantités de tokens bien plus élevées que les simples chats basés sur des invites. En effet, la consommation peut atteindre 3 500 fois le nombre de tokens utilisés par une série d'invites avec ChatGPT.
Un token représente l'unité de base d'information traitée par un modèle d'IA. Il peut s'agir d'une partie de mot, d'un mot entier ou même d'un signe de ponctuation, en fonction de la manière dont le modèle segmente les données.
Une variabilité des coûts difficile à anticiper
Bien que l'on puisse s'attendre à ce que les agents consomment plus de tokens, l'étude révèle des aspects encore plus alarmants. Deux modèles différents peuvent afficher des coûts de tokens très divergents pour une même tâche. De plus, un même modèle peut avoir des coûts variables à chaque exécution d'un problème identique, utilisant jusqu'à deux fois plus de tokens d'une fois à l'autre.
Le plus préoccupant est que ces variations ne peuvent être prédites. Selon Bai et son équipe, les agents ne sont pas en mesure d'estimer de manière fiable le nombre de tokens qu'ils consommeront pour une tâche donnée.
Les défis de la prévision des coûts
Les tâches agentiques sont décrites comme "uniquement coûteuses", et l'augmentation du nombre de tokens utilisés n'améliore pas nécessairement les résultats. "Augmenter simplement l'utilisation des tokens peut ne pas conduire à une meilleure performance d'exécution", précisent-ils, ajoutant que les modèles IA sous-estiment systématiquement le nombre de tokens nécessaires.
Les coûts croissants et l'incertitude quant au succès ne sont pas pris en compte dans les listes de prix actuelles d'OpenAI et d'autres fournisseurs. Les utilisateurs doivent donc imposer des limites strictes à l'utilisation des ordinateurs agentiques, ce qui pourrait amener les agents à s'arrêter avant d'avoir terminé les tâches.
Estimation des coûts de tokens : un défi technique
Pour analyser les coûts, Bai et son équipe ont utilisé le cadre d'IA agentique open-source OpenHands, développé par des chercheurs de l'Université de l'Illinois à Urbana-Champaign et d'autres institutions. Ils ont utilisé OpenHands pour construire des agents, qu'ils ont ensuite testés sur le test de référence de codage open-source SWE-Bench, basé sur de véritables problèmes GitHub.
L'étude a permis d'identifier les forces relatives des modèles. Les modèles ChatGPT 5 et 5.2 d'OpenAI ont montré une forte précision à faible coût, bien qu'ils ne soient pas les plus précis. Le modèle Claude Sonnet-4.5 d'Anthropic a atteint la plus haute précision, mais à des coûts de tokens plus élevés. Le modèle Gemini-3-Pro de Google se situait quelque part entre les deux.
Conclusion : vers une meilleure gestion des coûts
Les résultats de l'étude confirment les expériences anecdotiques avec des agents de codage, où les coûts s'accumulent sans que l'on puisse en prévoir le total. Les auteurs ne proposent pas de solutions concrètes, mais suggèrent que même si les agents ne peuvent pas prédire le nombre de tokens, ils pourraient fournir des estimations à un niveau élevé, offrant ainsi des alertes budgétaires précoces avant de lancer des exécutions coûteuses.
Il est crucial que les utilisateurs réfléchissent attentivement à ce qui peut être contrôlé au niveau des entrées, car les tokens d'entrée représentent le plus gros élément de coût. Les problèmes de transparence des coûts doivent être abordés par l'industrie dans son ensemble, car les utilisateurs doivent être en mesure de planifier leurs investissements en logiciels.



