Brief IA

Google's new Gemini API Agent Skill patches the knowledge gap AI models have with their own SDKs

💻 Code & Devvia The Decoder·Matthias Bastian·

Google's new Gemini API Agent Skill patches the knowledge gap AI models have with their own SDKs

Google's new Gemini API Agent Skill patches the knowledge gap AI models have with their own SDKs
En bref
1Les modèles d'IA ne sont pas informés de leurs propres mises à jour après l'entraînement.
2L'Agent Skill de Google améliore considérablement les résultats de codage.
3Cette innovation montre qu'un simple correctif peut avoir un impact majeur sur l'efficacité des modèles d'IA.
💡Pourquoi c'est importantcette avancée pourrait transformer la manière dont les développeurs interagissent avec les modèles d'IA, rendant le développement plus fluide et efficace.
📄
Article traduit en français

La nouvelle compétence Agent Skill de l'API Gemini de Google

Google a développé une "Agent Skill" pour l'API Gemini qui s'attaque à un problème fondamental des assistants de codage basés sur l'IA : une fois entraînés, les modèles de langage ne connaissent pas leurs propres mises à jour ni les meilleures pratiques actuelles. Cette nouvelle compétence fournit aux agents de codage des informations à jour sur les modèles actuels, les SDK et le code d'exemple.

Dans des tests réalisés sur 117 tâches, le modèle le plus performant (Gemini 3.1 Pro Preview) a vu son taux de réussite passer de 28,2 % à 96,6 %. Les compétences ont été introduites pour la première fois à la fin de l'année dernière par Anthropic et ont été rapidement adoptées par d'autres entreprises d'IA.

Les taux de réussite des modèles Gemini avec et sans la compétence agent à travers 117 tâches de codage montrent que les modèles plus récents de la série 3 bénéficient beaucoup plus de cette compétence que les modèles plus anciens, que Google attribue à leurs capacités de raisonnement plus solides.

Les modèles plus anciens de la version 2.5 ont connu des améliorations beaucoup plus modestes, que Google explique par des capacités de raisonnement plus faibles. Fait intéressant, une étude de Vercel suggère que donner des instructions directes aux modèles via des fichiers AGENTS.md pourrait être encore plus efficace. Google explore également d'autres approches, y compris les services MCP. La compétence est disponible sur GitHub.

TwitterLinkedIn

Brief IA — Veille IA quotidienne

Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.