La recherche en IA te passionne ?
Les papers et avancées qui comptent, expliqués simplement, chaque soir. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Le Problème avec les Architectures d'Agents Actuels
Dans le domaine des agents d'intelligence artificielle, deux modèles dominants se distinguent, chacun avec ses propres limitations. Le premier, souvent appelé "Coup de Maître", repose sur un prompt unique qui génère une réponse immédiate. Ce modèle est apprécié pour sa rapidité et son faible coût, mais il montre ses limites dès que la tâche requiert plusieurs étapes. Dans ces cas, le modèle perd de vue le contexte initial, produisant des résultats qui semblent corrects mais qui ne le sont pas.
Le second modèle, connu sous le nom de "Boucle ReAct", suit un cycle de raisonnement, action, observation et répétition. Bien que ce modèle soit à la base de nombreux frameworks modernes tels que LangGraph, AutoGen, et le Microsoft Agent Framework, il souffre d'un manque de gouvernance. Il n'existe pas de mécanisme intégré pour déterminer quand s'arrêter, ajuster le cap ou solliciter l'intervention humaine.
Ces deux approches partagent une lacune commune : elles considèrent la fiabilité comme une caractéristique inhérente au modèle plutôt qu'au système dans son ensemble.
Ce que Propose l'Ingénierie de Boucle
L'ingénierie de boucle propose une nouvelle perspective en reformulant le problème. Plutôt que de chercher à rendre le modèle plus intelligent, elle vise à construire une architecture de gouvernance autour du modèle. En s'inspirant de la théorie du contrôle, des machines d'état et de l'apprentissage par renforcement, cette approche identifie six composants essentiels pour garantir la fiabilité des agents.
Représentation des Objectifs
Il ne s'agit pas simplement de demander à l'agent d'écrire un article de blog. La tâche doit être définie de manière structurée, incluant les contraintes de budget, de temps et de sécurité, ainsi que les critères de succès et les conditions d'arrêt. Sans ces éléments, l'agent navigue sans destination claire.
Modèle d'État
Ce composant se divise en cinq couches distinctes :
- État statique : Inclut l'objectif, les contraintes et la configuration initiale.
- État dynamique : Représente les sorties actuelles et les résultats intermédiaires.
- État des outils : Indique quels outils sont disponibles et leur statut.
- État réflexif : Recueille les leçons apprises des itérations précédentes.
- État de gouvernance : Comprend le budget de risque, le coût et les itérations restantes.
Contrairement aux systèmes traditionnels qui regroupent ces éléments dans une seule fenêtre de contexte, l'ingénierie de boucle les sépare pour permettre à l'agent de distinguer clairement entre ses objectifs, ses actions passées et ses apprentissages.
Exécuteur d'Actions
Ce composant établit une frontière contrôlée autour de l'utilisation des outils. Chaque action est soumise à un contrôle de risque avant son exécution, ce qui empêche l'agent de prendre des décisions potentiellement coûteuses ou destructrices sans autorisation préalable.
Collecteur d'Observations
Le collecteur d'observations enregistre ce qui s'est réellement passé, indépendamment des intentions initiales de l'agent. Cette distinction est cruciale car les modèles de langage ont souvent du mal à s'auto-évaluer correctement. Par exemple, un agent peut croire avoir sauvegardé un fichier alors qu'une erreur de permission l'en a empêché.
Évaluateur
L'évaluateur analyse chaque itération selon quatre dimensions :
- Confiance : L'agent est-il sûr de sa prochaine étape ?
- Progrès : Se rapproche-t-il de l'objectif ou stagne-t-il ?
- Dérive : S'est-il éloigné de la tâche initiale ?
- Risque : La prochaine action pourrait-elle causer des dommages ou dépasser le budget ?
Contrôleur
Le contrôleur agit comme le décideur ultime. En se basant sur l'évaluation, il peut choisir de continuer, de réviser le plan, de rétrograder une action, d'escalader à un humain ou d'arrêter complètement l'exécution. Ce composant est souvent absent dans les systèmes d'agents actuels, qui manquent d'un mécanisme pour décider de la poursuite des actions.
Cinq Types de Boucles
Toutes les tâches ne requièrent pas la même structure de boucle. Le document identifie cinq types de boucles, chacune adaptée à des besoins spécifiques. Une tâche peut ainsi passer par des boucles de planification, d'exécution et de vérification, toutes enveloppées dans une boucle de gouvernance pour maintenir le risque sous contrôle.
Où les Architectures Actuelles Échouent
L'analyse comparative du document met en lumière plusieurs faiblesses des architectures actuelles :
- Les agents à coup unique, bien que rapides et peu coûteux, n'ont pas de mécanisme de récupération. Une erreur initiale nécessite de tout recommencer.
- Les boucles ReAct, bien qu'adaptables, manquent de conditions de terminaison formelles et peuvent continuer indéfiniment sans intervention humaine.
- Les agents orchestrés par flux de travail, tels que Prefect, Airflow, et AWS Step Functions, offrent une bonne traçabilité mais deviennent fragiles lorsque la tâche s'écarte du graphe prédéfini.
- Les agents conçus selon le modèle de boucle sont mieux équipés pour les situations où le plan doit émerger au fur et à mesure de l'exécution, grâce à une gouvernance dynamique appliquée à chaque itération.
L'Argument Contre Qui Compte
Le document reconnaît une objection majeure : "Les outils d'orchestration de flux de travail matures fournissent déjà des fonctionnalités de suivi d'état, de reprise et d'approbation humaine. L'ingénierie de boucle n'est-elle pas redondante ?" La réponse est claire : "Les contrôles de gouvernance doivent être appliqués à chaque itération, car il n'y a pas de carte préétablie des échecs potentiels." Contrairement aux systèmes orchestrés par flux de travail où les étapes risquées sont prédéfinies, le modèle de boucle génère le plan à l'exécution, rendant chaque étape potentiellement critique. Ainsi, une gouvernance omniprésente est nécessaire pour garantir la fiabilité.





