Pourquoi les coûts des agents IA sont-ils imprévisibles ?

Une étude menée par l'Université du Michigan et des institutions collaboratrices, dont Stanford et Google, a révélé que les coûts des agents IA varient considérablement en raison d'une consommation de tokens imprévisible. Ce manque de transparence sur les prix et les performances pourrait freiner l'adoption des technologies IA par les entreprises, impactant leur compétitivité. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Agents IA : des coûts imprévisibles qui inquiètent les utilisateurs

Brief IA

Tom Levy·5 mai 2026·4 min·2 vues

⚡

En bref

1Les coûts des agents IA en tokens sont imprévisibles et peuvent augmenter de manière significative, selon une étude récente.

2L'étude révèle que les agents IA consomment jusqu'à 3 500 fois plus de tokens que des invites simples, rendant les factures difficiles à anticiper.

3Les variations de coûts entre modèles et tâches sont considérables, sans possibilité de prédiction fiable, selon les chercheurs.

💡Pourquoi c'est important — Les entreprises doivent comprendre ces coûts pour éviter des dépenses imprévues et optimiser l'utilisation des agents IA.

Coûts des agents IA : une variabilité préoccupante

L'utilisation des agents d'intelligence artificielle (IA) s'accompagne d'une augmentation significative des coûts en termes de tokens. Ces agents, en raison de leur nature complexe et de leur fonctionnement, ne permettent pas une prévision précise de la consommation totale de tokens. Cette situation pousse les utilisateurs à exiger une plus grande transparence des prix et des garanties de performance de la part des fournisseurs.

Dans le vaste champ des défis posés par l'IA agentique, la question du coût reste l'une des plus mal comprises. Bien que des entreprises comme OpenAI, Google et Anthropic publient des listes de prix, ces dernières ne fournissent pas une image claire des coûts finaux pour résoudre un problème donné.

Une étude récente menée par l'Université du Michigan, en collaboration avec d'autres institutions, met en lumière un choc tarifaire potentiel : les coûts des agents IA peuvent s'envoler de manière imprévisible, rendant leur gestion financièrement risquée.

Résultats de l'étude : une consommation de tokens exponentielle

L'étude, dirigée par Longju Bai de l'Université du Michigan, avec des collaborateurs de Stanford, All Hands AI, DeepMind de Google, Microsoft et le MIT, s'intitule "Comment les agents IA dépensent votre argent ? Analyse et prédiction de la consommation de tokens dans les tâches de codage agentiques". Elle est présentée comme la première étude systématique sur ce sujet.

Les chercheurs ont découvert que les agents consomment des quantités de tokens bien plus élevées que les simples chats basés sur des invites. En effet, la consommation peut atteindre 3 500 fois le nombre de tokens utilisés par une série d'invites avec ChatGPT.

Un token représente l'unité de base d'information traitée par un modèle d'IA. Il peut s'agir d'une partie de mot, d'un mot entier ou même d'un signe de ponctuation, en fonction de la manière dont le modèle segmente les données.

Une variabilité des coûts difficile à anticiper

Bien que l'on puisse s'attendre à ce que les agents consomment plus de tokens, l'étude révèle des aspects encore plus alarmants. Deux modèles différents peuvent afficher des coûts de tokens très divergents pour une même tâche. De plus, un même modèle peut avoir des coûts variables à chaque exécution d'un problème identique, utilisant jusqu'à deux fois plus de tokens d'une fois à l'autre.

Le plus préoccupant est que ces variations ne peuvent être prédites. Selon Bai et son équipe, les agents ne sont pas en mesure d'estimer de manière fiable le nombre de tokens qu'ils consommeront pour une tâche donnée.

Les défis de la prévision des coûts

Les tâches agentiques sont décrites comme "uniquement coûteuses", et l'augmentation du nombre de tokens utilisés n'améliore pas nécessairement les résultats. "Augmenter simplement l'utilisation des tokens peut ne pas conduire à une meilleure performance d'exécution", précisent-ils, ajoutant que les modèles IA sous-estiment systématiquement le nombre de tokens nécessaires.

Les coûts croissants et l'incertitude quant au succès ne sont pas pris en compte dans les listes de prix actuelles d'OpenAI et d'autres fournisseurs. Les utilisateurs doivent donc imposer des limites strictes à l'utilisation des ordinateurs agentiques, ce qui pourrait amener les agents à s'arrêter avant d'avoir terminé les tâches.

Estimation des coûts de tokens : un défi technique

Pour analyser les coûts, Bai et son équipe ont utilisé le cadre d'IA agentique open-source OpenHands, développé par des chercheurs de l'Université de l'Illinois à Urbana-Champaign et d'autres institutions. Ils ont utilisé OpenHands pour construire des agents, qu'ils ont ensuite testés sur le test de référence de codage open-source SWE-Bench, basé sur de véritables problèmes GitHub.

L'étude a permis d'identifier les forces relatives des modèles. Les modèles ChatGPT 5 et 5.2 d'OpenAI ont montré une forte précision à faible coût, bien qu'ils ne soient pas les plus précis. Le modèle Claude Sonnet-4.5 d'Anthropic a atteint la plus haute précision, mais à des coûts de tokens plus élevés. Le modèle Gemini-3-Pro de Google se situait quelque part entre les deux.

Conclusion : vers une meilleure gestion des coûts

Les résultats de l'étude confirment les expériences anecdotiques avec des agents de codage, où les coûts s'accumulent sans que l'on puisse en prévoir le total. Les auteurs ne proposent pas de solutions concrètes, mais suggèrent que même si les agents ne peuvent pas prédire le nombre de tokens, ils pourraient fournir des estimations à un niveau élevé, offrant ainsi des alertes budgétaires précoces avant de lancer des exécutions coûteuses.

Il est crucial que les utilisateurs réfléchissent attentivement à ce qui peut être contrôlé au niveau des entrées, car les tokens d'entrée représentent le plus gros élément de coût. Les problèmes de transparence des coûts doivent être abordés par l'industrie dans son ensemble, car les utilisateurs doivent être en mesure de planifier leurs investissements en logiciels.

Agents IA : des coûts imprévisibles qui inquiètent les utilisateurs

Tu veux les meilleurs outils IA avant les autres ?

Coûts des agents IA : une variabilité préoccupante

Résultats de l'étude : une consommation de tokens exponentielle

Une variabilité des coûts difficile à anticiper

Les défis de la prévision des coûts

Estimation des coûts de tokens : un défi technique

Conclusion : vers une meilleure gestion des coûts

Coûts et modèles IA : les défis des entreprises en 2026

Uber et Microsoft face à l'explosion des coûts des tokens IA

Les coûts des tokens d'IA bouleversent la stratégie des entreprises

Microsoft freine sur l'IA : Claude Code jugé trop coûteux

Nvidia Blackwell : vers une chute des prix des tokens IA

Accenture limite l'usage de l'IA pour maîtriser les coûts