Google's new Gemini API Agent Skill patches the knowledge gap AI models have with their own SDKs

La nouvelle compétence Agent Skill de l'API Gemini de Google
Google a développé une "Agent Skill" pour l'API Gemini qui s'attaque à un problème fondamental des assistants de codage basés sur l'IA : une fois entraînés, les modèles de langage ne connaissent pas leurs propres mises à jour ni les meilleures pratiques actuelles. Cette nouvelle compétence fournit aux agents de codage des informations à jour sur les modèles actuels, les SDK et le code d'exemple.
Dans des tests réalisés sur 117 tâches, le modèle le plus performant (Gemini 3.1 Pro Preview) a vu son taux de réussite passer de 28,2 % à 96,6 %. Les compétences ont été introduites pour la première fois à la fin de l'année dernière par Anthropic et ont été rapidement adoptées par d'autres entreprises d'IA.
Les taux de réussite des modèles Gemini avec et sans la compétence agent à travers 117 tâches de codage montrent que les modèles plus récents de la série 3 bénéficient beaucoup plus de cette compétence que les modèles plus anciens, que Google attribue à leurs capacités de raisonnement plus solides.
Les modèles plus anciens de la version 2.5 ont connu des améliorations beaucoup plus modestes, que Google explique par des capacités de raisonnement plus faibles. Fait intéressant, une étude de Vercel suggère que donner des instructions directes aux modèles via des fichiers AGENTS.md pourrait être encore plus efficace. Google explore également d'autres approches, y compris les services MCP. La compétence est disponible sur GitHub.
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.