Brief IA : Sakana Fugu : l'IA multi-agents qui redéfinit l'innovation
🤖 Modèles & LLM

Sakana Fugu : l'IA multi-agents qui redéfinit l'innovation

Brief IA
Tom Levy·5 min·2 vues

Sakana Fugu est un modèle d'IA multi-agents développé par Sakana AI, qui utilise plusieurs agents experts pour optimiser la gestion des tâches complexes. Cette approche, qui permet de déléguer des réponses et d'effectuer des vérifications intermédiaires via une simple API, pourrait transformer l'efficacité et la précision des systèmes d'IA. Le nom 'Sakana', signifiant poisson en japonais, reflète l'idée d'intelligence collective, similaire à celle d'un banc de poissons.

En bref
1Sakana AI innove avec Fugu, un modèle d'IA multi-agents qui se distingue des modèles traditionnels.
2Contrairement aux approches classiques, Fugu utilise plusieurs agents experts pour coordonner ses réponses.
3Un simple appel API à Fugu peut activer des réponses directes, déléguer à des spécialistes ou effectuer des vérifications intermédiaires.
💡Pourquoi c'est importantCette approche pourrait transformer la manière dont les systèmes d'IA gèrent des tâches complexes, en optimisant l'efficacité et la précision.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Sakana Fugu : l'IA multi-agents qui redéfinit l'innovation

Qu'est-ce que Sakana Fugu ?

Sakana Fugu est une API de modèle géré compatible avec OpenAI qui ressemble à un LLM unique mais fonctionne comme un système multi-agents en interne. Les développeurs envoient une invite à un identifiant de modèle, tel que fugu ou fugu-ultra, tandis que Fugu gère la sélection des agents, l'attribution des rôles, la coordination, la vérification et la réponse finale.

Au lieu de construire manuellement des agents planificateurs, codeurs, réviseurs, chercheurs ou superviseurs avec des frameworks comme LangGraph, AutoGen ou CrewAI, les équipes bénéficient d'une orchestration intégrée au modèle lui-même. Cela réduit la nécessité de gérer les invites, le routage, les tentatives, la mémoire, l'état, la surveillance et la récupération après échec.

Pourquoi le nom est-il important ?

Le nom « Sakana » signifie poisson en japonais. L'entreprise cadre souvent sa recherche autour de l'intelligence collective, similaire à la manière dont un banc de poissons peut se comporter comme un système coordonné. Fugu suit cette idée. De nombreux agents se coordonnent derrière une seule interface.

Pourquoi le système multi-agents en tant que modèle est-il important ?

La plupart des systèmes d'IA en production aujourd'hui tombent dans l'un des trois schémas suivants :

  • Invitations à un seul modèle
  • Applications LLM augmentées par des outils
  • Flux de travail multi-agents conçus manuellement

L'invitation à un seul modèle est simple, mais elle peut échouer sur des tâches complexes nécessitant planification, exécution, vérification et itération.

Les LLM augmentés par des outils améliorent l'utilité en connectant les modèles à des recherches, bases de données, exécutions de code, API ou systèmes d'entreprise. Mais le modèle agit généralement comme le moteur de raisonnement central.

Les flux de travail multi-agents vont plus loin. Ils divisent le travail entre des agents spécialisés. Par exemple :

  • Un planificateur décompose la tâche.
  • Un chercheur rassemble le contexte.
  • Un codeur écrit le code.
  • Un réviseur vérifie la correction.
  • Un vérificateur teste la réponse.
  • Un superviseur coordonne le processus.

Cela peut améliorer la fiabilité sur des tâches difficiles, mais bien le construire est compliqué. Les équipes doivent répondre à de nombreuses questions de conception système :

  • Quel agent doit gérer quelle tâche ?
  • Comment les agents doivent-ils communiquer ?
  • Quand le système doit-il s'arrêter ?
  • Comment les sorties intermédiaires doivent-elles être vérifiées ?
  • Comment les coûts et la latence doivent-ils être contrôlés ?
  • Comment les échecs doivent-ils être récupérés ?
  • Comment les restrictions de conformité doivent-elles être appliquées ?

Fugu tente de simplifier cela en transformant l'orchestration multi-agents en une capacité au niveau du modèle. Le développeur n'a pas besoin de concevoir manuellement chaque interaction entre agents.

Fugu vs Fugu Ultra

Sakana Fugu se décline en deux options principales de modèle : Fugu et Fugu Ultra.

Fugu est le modèle par défaut pour un travail quotidien. Il équilibre performance et latence. Il convient au support de codage, à la révision de code, aux chatbots, aux assistants internes, à l'analyse de documents et aux flux de travail interactifs où le temps de réponse est important.

Un point clé est que Fugu peut acheminer vers le meilleur modèle en fonction de la tâche. Il permet également aux utilisateurs d'exclure certains agents du pool de modèles, ce qui peut aider avec des exigences de données, de confidentialité, de conformité ou organisationnelles.

Fugu Ultra est optimisé pour la qualité maximale des réponses. Il coordonne un pool plus profond d'agents experts et est destiné à des problèmes difficiles, à enjeux élevés et multi-étapes. Selon Sakana, Fugu Ultra peut acheminer entre un et trois agents selon le problème.

Fugu Ultra est mieux adapté aux charges de travail où la précision, la profondeur et la persistance importent plus que la latence. Des exemples incluent :

  • Reproduction de documents
  • Flux de travail en science des données de style Kaggle
  • Analyse de cybersécurité
  • Revue de littérature
  • Enquête sur des brevets
  • Recherche technique approfondie
  • Révision de code complexe
  • Raisonnement scientifique

Résultats des benchmarks

Sakana rapporte les scores de benchmark de Fugu et Fugu Ultra dans les domaines du codage, du raisonnement, de la science, des tâches agentiques, du raisonnement à long terme et de l'évaluation de style cybersécurité.

Les benchmarks sont utiles, mais ils ne doivent pas être considérés comme des garanties de production directes. Le profil de benchmark de Fugu suggère trois insights pratiques :

  1. Fugu est le plus fort lorsque les tâches nécessitent de l'orchestration
    Le cas d'utilisation le plus fort n'est pas une simple réponse unique. Le modèle est conçu pour des tâches qui bénéficient de la décomposition, de la sélection d'experts, de la vérification et de la synthèse.

  2. Ultra n'est pas toujours automatiquement meilleur
    Fugu Ultra est optimisé pour la qualité des réponses, mais Fugu peut le surpasser sur certains benchmarks. Les développeurs devraient évaluer les deux modèles sur leur propre charge de travail avant de standardiser.

  3. Une stratégie de routage pratique
    Fugu permet une sélection dynamique des agents, ce qui est crucial pour maximiser l'efficacité et la pertinence des réponses.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires