L’IA et sa régulation t’intéressent ?
Lois, cadres et décisions qui façonnent l’IA, décryptés en français. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Révision des prévisions de l'AISI
L'Institut britannique de sécurité de l'IA (AISI) a récemment ajusté ses prévisions concernant l'évolution des capacités cybernétiques des modèles d'intelligence artificielle. Initialement, l'AISI avait prévu un doublement des capacités tous les huit mois. Cependant, cette estimation a été révisée à 4,7 mois, reflétant une accélération significative des progrès technologiques. Cette révision est en partie due aux performances remarquables de modèles comme Claude Mythos Preview d'Anthropic et GPT-5.5 d'OpenAI, qui ont déjà dépassé ces nouvelles prévisions.
En novembre 2025, l'agence avait estimé que les capacités cybernétiques doublaient tous les huit mois. Mais en février 2026, ce chiffre a été révisé à 4,7 mois. Claude Mythos Preview et GPT-5.5 ont désormais "substantiellement dépassé" même ce calendrier accéléré. Il reste à savoir si cela représente une nouvelle tendance ou un saut ponctuel.
Performances de Claude Mythos Preview
Dans les simulations menées par l'AISI, Claude Mythos Preview a démontré une capacité impressionnante à réaliser des attaques complexes. Lors d'une simulation d'attaque en 32 étapes sur un réseau d'entreprise, le modèle a réussi dans six des dix tentatives. Cette performance est d'autant plus notable que des experts humains prendraient environ 20 heures pour accomplir une telle tâche. De plus, Claude Mythos Preview a été le premier modèle à réussir une simulation de système de contrôle industriel, avec trois réussites sur dix tentatives.
Les plus grands progrès se sont manifestés dans les plages de cybersécurité de l'AISI, des simulations d'attaques complexes conçues pour tester la capacité de piratage dans le monde réel. Une plage simule une attaque en 32 étapes sur un réseau d'entreprise que des experts humains mettraient environ 20 heures à compléter, selon l'AISI. Le dernier point de contrôle de Mythos Preview a terminé l'attaque complète dans 6 des 10 tentatives. Ce point de contrôle a également été déployé auprès de partenaires. La version Mythos précédemment testée n'a réussi que 3 des 10 tentatives.
Avancées dans les simulations de cybersécurité
Le modèle a également résolu "Cooling Tower", une simulation d'un système de contrôle industriel, dans 3 des 10 tentatives. Aucun autre modèle n'avait jamais réussi cette simulation, y compris la version précédente de Mythos. L'AISI a déclaré : "La direction est claire : les capacités cybernétiques avancent rapidement, et les modèles récents représentent une avancée significative par rapport à ceux qui les ont précédés." L'agence construit déjà des évaluations plus difficiles avec des défenses actives pour suivre le rythme de la technologie.
Évaluation par XBOW
La société de sécurité offensive XBOW a testé de manière indépendante Mythos Preview avec une équipe de dix experts. Le modèle représente "une avancée majeure" et montre une "précision sans précédent" dans la détection des vulnérabilités, a déclaré la société. Comparé à Opus 4.6 d'Anthropic, Mythos Preview a réduit les faux négatifs de 42 %. Avec un accès supplémentaire au code source, cette réduction a atteint 55 %.
La plus grande force de Mythos Preview est l'analyse de code source, selon XBOW. "C'était la première instance d'un thème qui réapparaîtrait encore et encore : Mythos Preview est impressionnant pour écrire du code, mais encore plus impressionnant pour le lire", indique le rapport. Le modèle a même trouvé des vulnérabilités dans le sandbox V8 de Chromium, un domaine où les modèles précédents n'avaient produit que des faux positifs.
Cependant, l'évaluation de XBOW a également mis en lumière les limites de cette force. L'accès à un système en fonctionnement est souvent plus important que l'accès au code source, car de nombreuses vulnérabilités n'émergent que de la configuration, des dépendances ou de l'interaction entre des composants individuellement sécurisés.
Même sur des benchmarks où la vulnérabilité existait uniquement dans le code, le retrait de l'accès au système en direct a nui à la performance plus que le retrait de l'accès au code source. Mythos Preview lit le code de manière exceptionnelle mais dépend toujours de l'interaction avec des systèmes en direct pour atteindre son plein potentiel.
Coût et efficacité
Le coût élevé de Claude Mythos Preview, cinq fois celui d'un modèle Opus, soulève des questions sur l'équilibre entre performance et coût. XBOW suggère que, bien que Mythos Preview soit efficace pour des tâches spécifiques, d'autres solutions, comme GPT-5.5, pourraient offrir des résultats comparables à moindre coût. Lorsqu'on normalise par rapport aux coûts d'exploitation estimés, Mythos Preview "n'est pas terriblement inefficace, du moins si vous désirez une haute précision, mais ce n'est pas non plus le meilleur de sa catégorie sur nos benchmarks", écrit XBOW. L'alternative consisterait à donner plus de temps à un agent alimenté par GPT-5.5. Souvent, cela donne des résultats équivalents ou meilleurs à un coût inférieur.
"La meilleure option dépend du cas d'utilisation ; souvent, c'est la dernière", écrit XBOW. La société recommande de déployer un "cadre de modèles" plutôt que de parier sur un seul. Mythos Preview offre d'excellents résultats sur des tâches de détection de vulnérabilités pures (par exemple, web, sandbox V8) mais montre des faiblesses sur des tâches de jugement plus complexes, où il obtient seulement des scores "Médiocre" ou "Passable" dans certaines catégories.
Perspectives et implications politiques
Logan Graham, qui dirige le red-teaming autour du projet Glasswing chez Anthropic, a mis les résultats en perspective : les partenaires de Glasswing ont utilisé Mythos Preview pour trouver "des milliers de vulnérabilités (estimées) de gravité élevée + critique" en quelques semaines, "parfois le double de ce qu'ils auraient normalement trouvé en un an."
Mais Graham a souligné qu'il ne s'agit pas de promouvoir un seul modèle. "Dans un an, Mythos aura probablement l'air assez bête (par rapport à d'autres nouveaux modèles)." Le véritable message, a-t-il déclaré, est de se préparer à un monde où les modèles sont "meilleurs, plus rapides, moins chers et plus créatifs que certains des meilleurs experts humains en capacités à double usage." D'autres fournisseurs pourraient publier des modèles accessibles ou non sécurisés à des performances équivalentes à celles de Mythos.
Anthropic a introduit Claude Mythos début avril et a restreint l'accès à environ 50 entreprises, officiellement pour des raisons de sécurité. Certains critiques ont qualifié ces restrictions d'exagérées ou les ont rejetées comme un coup de communication. La vérité se situe probablement quelque part entre les deux : Claude Mythos n'est peut-être pas un cas exceptionnel sans précédent, mais il est le premier modèle annoncé publiquement de ce type avec des capacités cybernétiques significativement avancées qui vont bien au-delà de ce qui était connu auparavant.
Cela crée une pression pour agir à travers l'industrie du logiciel et dans la politique. Le gouvernement américain examine de près Claude Mythos et teste déjà le modèle, tandis qu'Anthropic bloque l'accès pour la Chine et apparemment pour l'UE également. OpenAI a au moins contacté l'UE pour discuter d'un accès anticipé à GPT-5.5-Cyber. Quoi qu'il en soit, la situation montre à quel point l'Union européenne dépend de la bonne volonté des grandes entreprises technologiques américaines, principalement parce que des produits européens comparables n'existent pas.

