Google déploie enfin des outils pour contrôler les coûts de l’API Gemini
⚡ Résumé en français par Brief IA
📄 Article traduit en français
Google déploie enfin des outils pour contrôler les coûts de l’API Gemini
Google déploie de nouveaux outils de contrôle des coûts pour son API Gemini dans AI Studio. Dans un billet de blog publié ce lundi 16 mars 2026, la firme de Mountain View a dévoilé des plafonds de dépenses par projet, un système de paliers repensé et plusieurs tableaux de bord dédiés à la facturation. Une annonce qui intervient sept mois après un bug de facturation ayant généré des factures de plusieurs milliers de dollars chez certains développeurs et développeuses.
API Gemini : des plafonds de dépenses par projet et un système de paliers refondu
La principale nouveauté, baptisée Project Spend Caps, permet de fixer un plafond de dépenses mensuel par projet directement dans AI Studio. En pratique, les propriétaires de projets peuvent activer, ajuster ou désactiver ce plafond depuis l’onglet Spend de l’interface. Une fois configuré, il reste actif jusqu’à modification ou désactivation manuelle. Google précise toutefois que l’application comporte un délai d’environ 10 minutes, les dépassements survenus pendant cette fenêtre restant à la charge de l’utilisateur ou de l’utilisatrice.
En parallèle, Google a refondu son système de paliers d’utilisation (Usage Tiers), qui régit les quotas et les limites de débit (rate limits) de l’API :
- Des seuils de dépenses abaissés pour accéder aux paliers supérieurs,
- Des passages de palier automatiques et immédiats dès que les critères sont remplis,
- Un plafond de dépenses mensuel par compte de facturation, défini par le système en fonction du palier atteint.
Google a également déployé plusieurs tableaux de bord dans AI Studio, qui proposent :
- Le suivi des rate limits avec le détail des requêtes et tokens par minute,
- La ventilation quotidienne des coûts par projet et par modèle,
- Des métriques d’usage et d’erreurs,
- La configuration de la facturation directement dans l’interface.
Un rattrapage sur la concurrence après un incident de facturation majeur
L’annonce de Google était particulièrement attendue. En août 2025, un bug dans le système de facturation de l’API Gemini avait provoqué des factures aberrantes chez de nombreux développeurs et développeuses. Une erreur de configuration tarifaire catégorisait des tokens internes comme des tokens de génération d’images, facturés à un tarif élevé, y compris pour des usages strictement textuels. Google avait reconnu le bug et promis des remboursements, mais l’absence de tout mécanisme de plafonnement avait amplifié les dégâts.
Un développeur a raconté avoir découvert plus de 1 000 $ de frais de génération d’images après avoir utilisé l’API uniquement pour traduire des descriptions de produits, écrit PPC Land.
Sur ce point, Google accusait un retard notable. OpenAI propose depuis longtemps des plafonds de dépenses configurables par projet. Anthropic applique de son côté des plafonds par palier et par workspace. L’API Gemini était le seul service majeur du secteur à ne pas offrir ce type de garde-fou. Ces mises à jour s’inscrivent dans une séquence d’enrichissements de la plateforme développeur de Google, après le lancement de Gemini 3.1 Flash-Lite et de Plan Mode dans Gemini CLI ces dernières semaines.
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.