Brief IA : GPT-5.5 d'OpenAI rivalise avec Claude Mythos dans les cyberattaques
🤖 Modèles & LLM

GPT-5.5 d'OpenAI rivalise avec Claude Mythos dans les cyberattaques

Brief IA
Tom Levy·5 min·14 vues

L'Institut britannique de sécurité de l'IA a révélé que GPT-5.5 d'OpenAI égalise Claude Mythos d'Anthropic dans des tests d'attaque cybernétique, étant le deuxième modèle capable de résoudre une simulation complète d'attaque réseau. GPT-5.5 est déjà disponible dans ChatGPT et via l'API, tandis que Claude Mythos reste limité à un petit groupe d'utilisateurs. Cette avancée souligne l'importance croissante des capacités d'attaque cybernétique dans le développement de l'IA.

En bref
1L'Institut britannique de sécurité de l'IA a testé GPT-5.5, qui égale Claude Mythos dans des simulations d'attaques cybernétiques complexes.
2GPT-5.5 a surpassé Claude Mythos dans des tâches de sécurité de niveau expert, atteignant un taux de réussite de 71,4 %.
3Des tests sur des environnements simulés montrent que GPT-5.5 résout des attaques réseau en 2 tentatives sur 10, contre 3 pour Claude Mythos.
💡Pourquoi c'est importantCes avancées soulignent les capacités croissantes des IA dans le domaine de la cybersécurité, posant des défis de sécurité majeurs.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

GPT-5.5 et Claude Mythos : une compétition serrée en cybersécurité

L'Institut britannique de sécurité de l'IA (AISI) a récemment testé le modèle GPT-5.5 d'OpenAI, révélant qu'il atteint un niveau de capacité d'attaque cybernétique comparable à celui de Claude Mythos Preview d'Anthropic. Ce constat est significatif car GPT-5.5 est seulement le deuxième modèle, après Mythos, à avoir complètement résolu une simulation complexe d'attaque d'entreprise en plusieurs étapes. Cependant, il est important de noter que cette réussite a été obtenue sur un réseau sans défenses actives en place.

L'AISI souligne que ces capacités émergent de plus en plus comme un sous-produit des améliorations générales de l'IA dans des domaines tels que l'autonomie et la programmation, plutôt que d'être explicitement entraînées pour cela. Cette tendance est observée dans les capacités d'attaque cybernétique alimentées par l'IA.

Évaluation des capacités de GPT-5.5

L'AISI a soumis GPT-5.5 à une série de tests d'attaque cybernétique. Le modèle a réussi à compléter entièrement une simulation d'attaque d'entreprise en plusieurs étapes, devenant ainsi le deuxième modèle après Claude Mythos Preview à réaliser cet exploit. Sur des tâches de sécurité de niveau expert isolées, GPT-5.5 a même surpassé le modèle d'Anthropic.

Pour l'AISI, les capacités observées pour la première fois dans Claude Mythos en avril ne sont pas un cas isolé, mais un sous-produit de gains plus larges en autonomie, raisonnement et codage. Les performances de GPT-5.5 sur des tâches d'expert sont particulièrement remarquables.

Performances de GPT-5.5 sur des tâches d'expert

L'AISI évalue les modèles d'IA avec un ensemble de 95 tâches de capture du drapeau réparties sur quatre niveaux de difficulté. Les tâches avancées, élaborées en collaboration avec des entreprises de cybersécurité comme Crystal Peak Security et Irregular, couvrent l'ingénierie inverse, le développement d'exploits pour diverses failles de mémoire, les attaques cryptographiques et le déchiffrement de logiciels malveillants obfusqués.

Au niveau de difficulté "Expert", GPT-5.5 atteint un taux de réussite moyen de 71,4 %, selon l'AISI. Claude Mythos Preview se situe à 68,6 %. L'écart se situe dans la marge d'erreur statistique, mais GPT-5.5 pourrait être le modèle le plus performant testé jusqu'à présent. Pour comparaison, GPT-5.4 a obtenu 52,4 % et Claude Opus 4.7 a atteint 48,6 %. Tous les modèles de pointe actuels ont entièrement résolu les tâches de base depuis au moins février 2026.

Simulation d'attaque réseau

Les tâches isolées testent des compétences individuelles, mais les attaques réelles nécessitent d'enchaîner plusieurs étapes. Pour capturer cela, l'AISI utilise des cyber ranges : des environnements réseau simulés avec plusieurs hôtes, services et vulnérabilités.

La simulation "The Last Ones" (TLO) couvre 32 étapes à travers quatre sous-réseaux et environ 20 hôtes. L'agent IA commence sans aucune identification et doit trouver des vulnérabilités, voler des identifiants, se déplacer latéralement à travers le réseau et finalement atteindre une base de données protégée. L'AISI estime qu'un expert humain mettrait environ 20 heures pour accomplir cela.

GPT-5.5 a entièrement résolu TLO dans 2 des 10 tentatives. Claude Mythos Preview a atteint le même niveau dans 3 des 10 tentatives. Les performances continuent de s'améliorer avec la puissance de calcul d'inférence, et même les meilleurs modèles n'ont pas encore atteint un plateau. Plus le modèle dépense de tokens à "penser", plus il est probable qu'il réussisse un hack.

Cela dit, les tests n'avaient pas de défenseurs actifs, pas de surveillance de sécurité et pas de conséquences pour des actions qui déclencheraient des alarmes dans le monde réel. La capacité de GPT-5.5 ou de Mythos à résister à des systèmes bien défendus reste une question ouverte. Cependant, pour les réseaux mal protégés, la capacité est clairement présente.

Limitations et défis

Une deuxième simulation appelée "Cooling Tower", qui modélise une attaque sur un système de contrôle industriel, était au-delà des capacités de GPT-5.5. Aucun modèle n'a encore résolu ce scénario de 7 étapes. Selon l'AISI, GPT-5.5, tout comme Mythos, a rencontré des difficultés sur les étapes informatiques en amont plutôt que sur le système de contrôle lui-même.

Bypass des mesures de sécurité

Au-delà de la capacité brute, l'AISI a également testé les mesures de sécurité de GPT-5.5 pour un usage public. Les chercheurs ont découvert un bypass universel qui a fonctionné sur chaque demande cybernétique malveillante signalée par OpenAI, y compris des scénarios d'agents en plusieurs étapes. Cela a pris seulement six heures à développer.

OpenAI a ensuite déployé plusieurs mises à jour du système de sécurité, mais l'AISI n'a pas pu vérifier l'efficacité de la configuration finale en raison d'un problème de configuration dans la version déployée. Cela prouve une fois de plus que les bypass restent une sérieuse faiblesse de sécurité dans les LLM, même les plus capables.

Une différence clé par rapport à Mythos : GPT-5.5 est déjà disponible dans ChatGPT et via l'API, tandis qu'Anthropic limite encore Claude Mythos à un petit groupe. Les résultats de l'AISI suggèrent qu'Anthropic aurait pu sauter cette couche de précaution supplémentaire. Ou peut-être que les critiques ont raison, et que le déploiement lent a moins à voir avec l'éthique de la sécurité qu'avec les contraintes de calcul d'Anthropic.

Commentaires