Quelles sont les performances de GPT-5.5 par rapport à Mythos en matière de hacking ?

Les tests de l'AI Security Institute révèlent que GPT-5.5 et Mythos affichent des performances similaires en matière de cyberattaque, avec GPT-5.5 atteignant un taux de réussite de 71,4 % sur des tâches de niveau expert. Cette situation soulève des inquiétudes quant à la sécurité des systèmes face à des IA avancées, ce qui pourrait transformer le paysage de la cybersécurité. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

GPT-5.5 et Mythos : IA puissantes, inquiétudes croissantes

Brief IA

Tom Levy·30 avril 2026·2 min·7 vues

⚡

En bref

1GPT-5.5 et Mythos affichent des performances similaires sur des tests de cyberattaque, selon l'AI Security Institute.

2Sur CyberBench et TLO, GPT-5.5 atteint 71,4 % de réussite, rivalisant avec Mythos à 68,6 %.

3Les deux IA exécutent des chaînes d'attaque complètes, dépassant le simple rôle d'assistant technique.

💡Pourquoi c'est important — Ces IA pourraient transformer la cybersécurité, posant des risques de sécurité nationale et nécessitant une régulation urgente.

GPT-5.5 et Mythos : IA puissantes, inquiétudes croissantes

Les récents tests menés par l'AI Security Institute révèlent que les modèles d'intelligence artificielle GPT-5.5 d'OpenAI et Mythos d'Anthropic se distinguent par leurs capacités en matière de cyberattaques. Les résultats de ces tests suscitent des préoccupations croissantes.

C’est le problème actuel avec Mythos. Cette IA est d’une puissance impressionnante, au point que son créateur Anthropic lui-même appelle à la prudence. Son déploiement suscite déjà des tensions, notamment du côté de la Maison-Blanche qui redoute un usage incontrôlé.

Des performances comparables sur des tests de cyberattaque

Les tests réalisés montrent que GPT-5.5 et Mythos affichent des performances similaires sur des scénarios de cyberattaque complexes. Sur des benchmarks spécialisés comme CyberBench et la simulation britannique TLO en 32 étapes, GPT-5.5 a atteint un taux de réussite de 71,4 % sur des tâches de niveau expert. Ce score le place parmi les modèles les plus performants du moment.

Mythos n'est pas en reste, avec un taux de réussite de 68,6 % sur les mêmes tests. Bien que l'écart soit mince, il est significatif. Notamment, GPT-5.5 a réussi à compléter entièrement la simulation TLO dans 2 cas sur 10, tandis que Mythos y est parvenu 3 fois.

Des capacités de hacking avancées

Les compétences de ces IA ne se limitent plus à l'assistance technique. Elles exécutent désormais des chaînes d'attaque complètes, ce qui est particulièrement préoccupant. La simulation TLO, par exemple, reproduit une cyberattaque complexe en plusieurs étapes, incluant la reconnaissance, l'exploitation, l'élévation de privilèges et les mouvements latéraux.

Sur le graphique de l'AI Security Institute, une tendance claire émerge : à mesure que les tokens augmentent, les modèles progressent dans les étapes critiques. GPT-5.5 suit une trajectoire très proche de Mythos, atteignant des niveaux avancés dans des domaines comme l'exploitation web ou l'analyse cryptographique, habituellement réservés à des experts humains.

Dans le détail, GPT-5.5 se distingue par sa régularité et sa progression stable à travers les étapes, tandis que Mythos montre des progrès parfois plus rapides mais moins constants. Ainsi, GPT-5.5 devient le deuxième modèle capable de compléter cette simulation de bout en bout, franchissant un seuil symbolique dans le domaine de la cybersécurité.

GPT-5.5 et Mythos : IA puissantes, inquiétudes croissantes

Tu suis la course aux modèles IA ?

GPT-5.5 et Mythos : IA puissantes, inquiétudes croissantes

Des performances comparables sur des tests de cyberattaque

Des capacités de hacking avancées

GPT-5.5 d'OpenAI rivalise avec Claude Mythos dans les cyberattaques

OpenAI dévoile GPT-5.5-Cyber pour experts en sécurité

OpenAI défie Claude Mythos avec son GPT-5.4 Cyber innovant

OpenAI dévoile GPT-5.4 Cyber : un défi direct pour Anthropic

OpenAI défie les hackers : 25 000 $ pour pirater GPT-5.5

OpenAI : l'attaque de Hugging Face révèle des failles IA