Brief IA : Claude Mythos : l'IA d'Anthropic qui défie les experts humains

Claude Mythos : l'IA d'Anthropic qui défie les experts humains

Brief IA
Tom Levy·3 min·2 vues

L'IA Mythos, développée par Anthropic, a résolu 30 % des 23 problèmes complexes en bio-informatique qui défiaient les experts humains. Cette avancée, démontrée par Claude lors de tests, souligne le potentiel des IA à surmonter des défis scientifiques majeurs, ouvrant la voie à des découvertes significatives dans ce domaine.

En bref
1Claude Mythos, développé par Anthropic, résout 82,6 % des problèmes de bio-informatique solvables par des humains.
2L'IA a également répondu à 29,6 % des questions insolubles par les experts, démontrant sa supériorité.
3La sortie de Claude Mythos est limitée en raison de ses capacités en cybersécurité, posant des risques potentiels.
💡Pourquoi c'est importantClaude Mythos pourrait révolutionner la recherche scientifique, mais ses risques en cybersécurité freinent son déploiement.
Le brief IA que lisent les pros

Tu codes avec l’IA ?

Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Claude Mythos, une intelligence artificielle développée par Anthropic, continue de captiver l'attention grâce à ses capacités exceptionnelles. Bien que son potentiel en cybersécurité ait été largement médiatisé, une étude récente met en lumière ses compétences impressionnantes en bio-informatique. Cette IA générative à usage général a démontré sa capacité à résoudre des problèmes complexes que même des experts humains peinent à déchiffrer.

Anthropic a conçu un benchmark spécifique, le BioMysteryBench, pour évaluer les performances de ses modèles d'IA dans le domaine de la bio-informatique. Ce benchmark comprend 99 questions complexes, dont certaines sont réputées insolubles par les humains. Parmi ces questions, un exemple typique est l'identification de l'espèce virale infectant un patient à partir de données de séquençage d'ARN, une tâche vérifiable par test PCR mais difficile à résoudre.

Sur les 99 questions posées, 73 ont trouvé réponse grâce à un panel d'experts humains. Claude Mythos a réussi à résoudre 82,6 % de ces questions solvables, tandis que Claude Opus 4.7, une version accessible au public, a atteint un taux de 78,9 %. Plus impressionnant encore, Claude Mythos a pu répondre à 29,6 % des 23 questions que les experts humains n'ont pas pu résoudre, surpassant ainsi les capacités humaines. Pour Claude Opus 4.7, ce taux était de 27 %.

Une IA aux connaissances vastes

L'explication de cette performance réside dans la vaste base de connaissances de Claude Mythos. Anthropic souligne que l'IA intègre des informations issues de centaines de milliers d'articles sur la biologie structurale et les profils moléculaires. Cette richesse d'informations permet à l'IA de combiner différentes méthodes et preuves pour parvenir à des conclusions, là où les humains devraient effectuer des méta-analyses complexes.

Anthropic a suivi le raisonnement de Claude Opus 4.6, qui a également réussi à résoudre un certain nombre de problèmes insolubles par des experts. Selon cette analyse, l'écart s'explique en partie par une propriété spécifique à l'intelligence artificielle : la connaissance. “La vaste base de connaissances sous-jacente de Claude contient des informations sur la biologie structurale, les profils moléculaires et les méta-analyses issues de centaines de milliers d’articles”, indique le laboratoire d’IA. Les humains, quant à eux, auraient dû lancer des méta-analyses ou combiner de nombreuses bases de données.

De plus, l’IA aurait développé de nouvelles techniques pour résoudre des problèmes, dont les scientifiques pourraient s’inspirer. En résumé, lorsque Claude n’est pas sûr d’une réponse, il combine plusieurs méthodes et intègre des éléments de preuves provenant de ces méthodes pour aboutir à une conclusion.

Des compétences au-delà de la cybersécurité

Malgré ses capacités impressionnantes, la sortie de Claude Mythos reste restreinte. Ses compétences en cybersécurité, bien que potentiellement bénéfiques, posent des risques d'exploitation malveillante. Par exemple, Mozilla a utilisé Mythos pour identifier 271 failles de sécurité dans Firefox, qu'ils ont corrigées par la suite.

Anthropic envisage de déployer Claude Mythos ou un modèle similaire une fois que les risques en cybersécurité seront maîtrisés. Les mesures de sécurité nécessaires sont actuellement testées sur Claude Opus 4.7. Cette prudence souligne l'équilibre délicat entre l'exploitation des capacités avancées de l'IA et la gestion des risques qu'elle engendre.

Un potentiel scientifique prometteur

L'étude d'Anthropic repositionne Claude Mythos non seulement comme un outil de cybersécurité, mais aussi comme un acteur potentiel majeur dans le domaine scientifique. Ses compétences pourraient mener à des découvertes significatives, à condition que les défis de sécurité soient surmontés.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires