Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Sakana Fugu : l'IA multi-agents qui redéfinit l'innovation
Qu'est-ce que Sakana Fugu ?
Sakana Fugu est une API de modèle géré compatible avec OpenAI qui ressemble à un LLM unique mais fonctionne comme un système multi-agents en interne. Les développeurs envoient une invite à un identifiant de modèle, tel que fugu ou fugu-ultra, tandis que Fugu gère la sélection des agents, l'attribution des rôles, la coordination, la vérification et la réponse finale.
Au lieu de construire manuellement des agents planificateurs, codeurs, réviseurs, chercheurs ou superviseurs avec des frameworks comme LangGraph, AutoGen ou CrewAI, les équipes bénéficient d'une orchestration intégrée au modèle lui-même. Cela réduit la nécessité de gérer les invites, le routage, les tentatives, la mémoire, l'état, la surveillance et la récupération après échec.
Pourquoi le nom est-il important ?
Le nom « Sakana » signifie poisson en japonais. L'entreprise cadre souvent sa recherche autour de l'intelligence collective, similaire à la manière dont un banc de poissons peut se comporter comme un système coordonné. Fugu suit cette idée. De nombreux agents se coordonnent derrière une seule interface.
Pourquoi le système multi-agents en tant que modèle est-il important ?
La plupart des systèmes d'IA en production aujourd'hui tombent dans l'un des trois schémas suivants :
- Invitations à un seul modèle
- Applications LLM augmentées par des outils
- Flux de travail multi-agents conçus manuellement
L'invitation à un seul modèle est simple, mais elle peut échouer sur des tâches complexes nécessitant planification, exécution, vérification et itération.
Les LLM augmentés par des outils améliorent l'utilité en connectant les modèles à des recherches, bases de données, exécutions de code, API ou systèmes d'entreprise. Mais le modèle agit généralement comme le moteur de raisonnement central.
Les flux de travail multi-agents vont plus loin. Ils divisent le travail entre des agents spécialisés. Par exemple :
- Un planificateur décompose la tâche.
- Un chercheur rassemble le contexte.
- Un codeur écrit le code.
- Un réviseur vérifie la correction.
- Un vérificateur teste la réponse.
- Un superviseur coordonne le processus.
Cela peut améliorer la fiabilité sur des tâches difficiles, mais bien le construire est compliqué. Les équipes doivent répondre à de nombreuses questions de conception système :
- Quel agent doit gérer quelle tâche ?
- Comment les agents doivent-ils communiquer ?
- Quand le système doit-il s'arrêter ?
- Comment les sorties intermédiaires doivent-elles être vérifiées ?
- Comment les coûts et la latence doivent-ils être contrôlés ?
- Comment les échecs doivent-ils être récupérés ?
- Comment les restrictions de conformité doivent-elles être appliquées ?
Fugu tente de simplifier cela en transformant l'orchestration multi-agents en une capacité au niveau du modèle. Le développeur n'a pas besoin de concevoir manuellement chaque interaction entre agents.
Fugu vs Fugu Ultra
Sakana Fugu se décline en deux options principales de modèle : Fugu et Fugu Ultra.
Fugu est le modèle par défaut pour un travail quotidien. Il équilibre performance et latence. Il convient au support de codage, à la révision de code, aux chatbots, aux assistants internes, à l'analyse de documents et aux flux de travail interactifs où le temps de réponse est important.
Un point clé est que Fugu peut acheminer vers le meilleur modèle en fonction de la tâche. Il permet également aux utilisateurs d'exclure certains agents du pool de modèles, ce qui peut aider avec des exigences de données, de confidentialité, de conformité ou organisationnelles.
Fugu Ultra est optimisé pour la qualité maximale des réponses. Il coordonne un pool plus profond d'agents experts et est destiné à des problèmes difficiles, à enjeux élevés et multi-étapes. Selon Sakana, Fugu Ultra peut acheminer entre un et trois agents selon le problème.
Fugu Ultra est mieux adapté aux charges de travail où la précision, la profondeur et la persistance importent plus que la latence. Des exemples incluent :
- Reproduction de documents
- Flux de travail en science des données de style Kaggle
- Analyse de cybersécurité
- Revue de littérature
- Enquête sur des brevets
- Recherche technique approfondie
- Révision de code complexe
- Raisonnement scientifique
Résultats des benchmarks
Sakana rapporte les scores de benchmark de Fugu et Fugu Ultra dans les domaines du codage, du raisonnement, de la science, des tâches agentiques, du raisonnement à long terme et de l'évaluation de style cybersécurité.
Les benchmarks sont utiles, mais ils ne doivent pas être considérés comme des garanties de production directes. Le profil de benchmark de Fugu suggère trois insights pratiques :
-
Fugu est le plus fort lorsque les tâches nécessitent de l'orchestration
Le cas d'utilisation le plus fort n'est pas une simple réponse unique. Le modèle est conçu pour des tâches qui bénéficient de la décomposition, de la sélection d'experts, de la vérification et de la synthèse. -
Ultra n'est pas toujours automatiquement meilleur
Fugu Ultra est optimisé pour la qualité des réponses, mais Fugu peut le surpasser sur certains benchmarks. Les développeurs devraient évaluer les deux modèles sur leur propre charge de travail avant de standardiser. -
Une stratégie de routage pratique
Fugu permet une sélection dynamique des agents, ce qui est crucial pour maximiser l'efficacité et la pertinence des réponses.

