Brief IA : Microsoft et Google : nouvelle norme pour agents IA
🔬 Recherche

Microsoft et Google : nouvelle norme pour agents IA

Brief IA
Tom Levy·6 min·3 vues

Microsoft, Google et d'autres collaborent sur la spécification ARD pour améliorer la découverte d'agents IA. ARD permet aux agents de trouver des capacités dynamiques sans préinstallation, via des registres fédérés. Hugging Face implémente ARD avec son outil Discover, facilitant l'accès à des milliers de Skills et applications ML.

En bref
1Microsoft, Google et d'autres collaborent sur la spécification ARD pour améliorer la découverte d'agents IA.
2ARD permet aux agents de trouver des capacités dynamiques sans préinstallation, via des registres fédérés.
3Hugging Face implémente ARD avec son outil Discover, facilitant l'accès à des milliers de Skills et applications ML.
💡Pourquoi c'est importantCette initiative pourrait transformer la manière dont les développeurs intègrent et utilisent les capacités IA, rendant le processus plus flexible et évolutif.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Une nouvelle ère pour la découverte d'agents IA

Dans le domaine du développement d'agents intelligents, trois protocoles principaux dominent actuellement : le MCP, qui offre aux agents un moyen standard d'interagir avec des outils ; les Skills, qui permettent aux agents de suivre des instructions spécifiques ; et le A2A, qui facilite la communication entre agents. Cependant, ces protocoles reposent sur l'idée que l'utilisateur sait déjà quel outil ou agent utiliser, laissant à sa charge la découverte et l'intégration de ces capacités.

La spécification Agentic Resource Discovery (ARD) se présente comme une solution à ce problème. Développée par des contributeurs de Microsoft, Google, GoDaddy, Hugging Face, et d'autres, ARD vise à créer une norme ouverte pour cataloguer, indexer et rechercher des outils et agents à travers des registres fédérés. Cela permettrait à un agent de découvrir dynamiquement des capacités pendant l'exécution, sans nécessiter une installation préalable. Cette norme n'est pas un produit commercial, mais un cadre que toute entreprise peut adopter pour enrichir son écosystème d'agents et d'outils.

Les défis de la découverte actuelle

Aujourd'hui, le modèle de découverte des capacités des agents repose sur une approche installer d'abord, utiliser ensuite. Les développeurs doivent coder en dur les URL des serveurs MCP dans les fichiers de configuration, et les utilisateurs doivent connecter manuellement les services à leurs applications IA. Cette méthode fonctionne pour un nombre limité d'outils utilisés quotidiennement, mais elle n'est pas adaptée à une échelle plus large où des milliers de services ad hoc pourraient être nécessaires.

Pour contourner ces limitations, certains ont recours à des solutions comme l'injection de descriptions d'outils dans la fenêtre de contexte du LLM. Cependant, cette approche est limitée par la capacité de contexte disponible. D'autres stratégies basées sur la recherche existent, mais elles souffrent souvent de descriptions trop vagues pour être véritablement utiles.

ARD propose de déplacer la sélection en dehors du LLM. Un registre indexe les capacités avec des informations détaillées telles que l'identité de l'éditeur, des requêtes types, des attestations de conformité et des balises. Il expose un point de terminaison REST pour permettre une recherche en langage naturel, permettant ainsi au modèle d'invoquer les capacités trouvées. Ce passage d'un catalogue statique à une recherche dynamique permet aux agents de découvrir et d'accéder à un large éventail d'outils et de services sans préconfiguration.

La spécification ARD repose sur deux éléments clés :

  • Un format de manifeste statique nommé ai-catalog.json, permettant aux éditeurs d'héberger leurs capacités à une URL bien définie.
  • Une API de registre dynamique à POST /search, offrant une découverte en temps réel et classée.

L'implémentation par Hugging Face

Hugging Face Discover est l'implémentation de référence de la spécification ARD. Cet outil offre un accès de recherche à des milliers de Skills, d'applications de machine learning, et de serveurs MCP, non seulement sur Hugging Face, mais aussi à travers d'autres services de découverte ARD.

Le fonctionnement de Discover repose sur la combinaison de la recherche sémantique du Hub sur les Spaces avec les Agent Skills, servant les résultats comme des entrées de catalogue ARD. Le Hub héberge déjà un catalogue de Spaces exécutant des applications Gradio, des serveurs MCP, et des démonstrations. Sa recherche sémantique inclut un drapeau agents=true qui renvoie des Spaces classés par métadonnées orientées agents, et Discover traduit cette recherche en spécification ARD.

L'adaptateur de Discover applique deux filtres principaux. Premièrement, il ne renvoie que les Spaces dont l'état d'exécution est RUNNING. Deuxièmement, le type de média de la réponse est déterminé par la requête, avec trois types de médias pris en charge :

  • application/ai-skill : le type par défaut, enveloppant le fichier agents.md du Space.
  • application/mcp-server+json : une entrée de catalogue pour les Spaces étiquetés mcp-server.
  • application/vnd.huggingface.space+json : métadonnées brutes du Space pour un traitement client.

Pour les Spaces étiquetés MCP, l'adaptateur génère une entrée de catalogue pointant vers le point de terminaison MCP Gradio du Space via HTTP. L'URL utilise le domaine d'exécution du Space, ou la convention .hf.space par défaut.

Discover est intégré dans la CLI de Hugging Face (hf). Pour débuter et donner accès à vous ou à votre agent, vous pouvez exécuter les commandes suivantes :

  • hf discover search "Fine tune a language model"
  • hf discover search "Generate an image" --json --kind mcp
  • hf discover search "Purchase aeroplane tickets" --registry-url <catalog-url>

Utilisation de l'API REST et des serveurs MCP

Il est également possible de rechercher directement dans le catalogue en utilisant l'API REST ou un serveur MCP.

Le catalogue de Hugging Face est accessible à l'URL suivante :

https://huggingface.co/.well-known/ai-catalog.json

Pour effectuer une recherche directe, vous pouvez utiliser la commande suivante :

POST https://huggingface-hf-discover.hf.space/search
curl -s https://huggingface-hf-discover.hf.space/search \
-H "Content-Type: application/json" \
"text": "fine tune a sentence transformer",
"type": ["application/ai-skill"]

Recherche de serveurs MCP

Pour rechercher des serveurs MCP, utilisez la commande suivante :

curl -s https://huggingface-hf-discover.hf.space/search \
-H "Content-Type: application/json" \
"text": "transcribe some audio",
"type": ["application/mcp-server-card+json"]

Alternativement, vous pouvez connecter n'importe quel client MCP pour effectuer une recherche via le point de terminaison MCP à l'adresse https://huggingface-hf-discover.hf.space/mcp.

Implications pour la spécification ARD

La spécification ARD sépare la découverte de l'exécution des capacités. Le format de manifeste statique est défini par le type de média, permettant à tout protocole d'artéfact d'utiliser le même cadre sans modifications. L'API de registre est basée sur HTTP REST, ce qui permet à tout client de se fédérer avec elle. Discover est l'une des nombreuses implémentations de référence de la spécification, et grâce à la fédération intégrée au protocole, une recherche à travers un service peut révéler des capacités hébergées par un autre.

L'outil Discover sert de test fonctionnel pour ce design. Il n'invente pas de nouveau format d'artéfact, mais enveloppe un backend de recherche existant, le Hub, dans le cadre de la spécification, permettant aux mêmes Spaces de se présenter comme des skills ou des serveurs MCP selon les besoins du client.

Les prochaines étapes incluent une intégration plus étroite avec les modes de fédération de la spécification (auto, références, aucune) et un support côté Hub pour les manifestes statiques ai-catalog.json sur les profils d'utilisateur et d'organisation. Une fois ces éléments en place, tout éditeur de Space pourra promouvoir ses capacités via le mécanisme d'URI bien connu.

Commentaires