Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
GPT-5.5 et Claude Mythos : une compétition serrée en cybersécurité
L'Institut britannique de sécurité de l'IA (AISI) a récemment testé le modèle GPT-5.5 d'OpenAI, révélant qu'il atteint un niveau de capacité d'attaque cybernétique comparable à celui de Claude Mythos Preview d'Anthropic. Ce constat est significatif car GPT-5.5 est seulement le deuxième modèle, après Mythos, à avoir complètement résolu une simulation complexe d'attaque d'entreprise en plusieurs étapes. Cependant, il est important de noter que cette réussite a été obtenue sur un réseau sans défenses actives en place.
L'AISI souligne que ces capacités émergent de plus en plus comme un sous-produit des améliorations générales de l'IA dans des domaines tels que l'autonomie et la programmation, plutôt que d'être explicitement entraînées pour cela. Cette tendance est observée dans les capacités d'attaque cybernétique alimentées par l'IA.
Évaluation des capacités de GPT-5.5
L'AISI a soumis GPT-5.5 à une série de tests d'attaque cybernétique. Le modèle a réussi à compléter entièrement une simulation d'attaque d'entreprise en plusieurs étapes, devenant ainsi le deuxième modèle après Claude Mythos Preview à réaliser cet exploit. Sur des tâches de sécurité de niveau expert isolées, GPT-5.5 a même surpassé le modèle d'Anthropic.
Pour l'AISI, les capacités observées pour la première fois dans Claude Mythos en avril ne sont pas un cas isolé, mais un sous-produit de gains plus larges en autonomie, raisonnement et codage. Les performances de GPT-5.5 sur des tâches d'expert sont particulièrement remarquables.
Performances de GPT-5.5 sur des tâches d'expert
L'AISI évalue les modèles d'IA avec un ensemble de 95 tâches de capture du drapeau réparties sur quatre niveaux de difficulté. Les tâches avancées, élaborées en collaboration avec des entreprises de cybersécurité comme Crystal Peak Security et Irregular, couvrent l'ingénierie inverse, le développement d'exploits pour diverses failles de mémoire, les attaques cryptographiques et le déchiffrement de logiciels malveillants obfusqués.
Au niveau de difficulté "Expert", GPT-5.5 atteint un taux de réussite moyen de 71,4 %, selon l'AISI. Claude Mythos Preview se situe à 68,6 %. L'écart se situe dans la marge d'erreur statistique, mais GPT-5.5 pourrait être le modèle le plus performant testé jusqu'à présent. Pour comparaison, GPT-5.4 a obtenu 52,4 % et Claude Opus 4.7 a atteint 48,6 %. Tous les modèles de pointe actuels ont entièrement résolu les tâches de base depuis au moins février 2026.
Simulation d'attaque réseau
Les tâches isolées testent des compétences individuelles, mais les attaques réelles nécessitent d'enchaîner plusieurs étapes. Pour capturer cela, l'AISI utilise des cyber ranges : des environnements réseau simulés avec plusieurs hôtes, services et vulnérabilités.
La simulation "The Last Ones" (TLO) couvre 32 étapes à travers quatre sous-réseaux et environ 20 hôtes. L'agent IA commence sans aucune identification et doit trouver des vulnérabilités, voler des identifiants, se déplacer latéralement à travers le réseau et finalement atteindre une base de données protégée. L'AISI estime qu'un expert humain mettrait environ 20 heures pour accomplir cela.
GPT-5.5 a entièrement résolu TLO dans 2 des 10 tentatives. Claude Mythos Preview a atteint le même niveau dans 3 des 10 tentatives. Les performances continuent de s'améliorer avec la puissance de calcul d'inférence, et même les meilleurs modèles n'ont pas encore atteint un plateau. Plus le modèle dépense de tokens à "penser", plus il est probable qu'il réussisse un hack.
Cela dit, les tests n'avaient pas de défenseurs actifs, pas de surveillance de sécurité et pas de conséquences pour des actions qui déclencheraient des alarmes dans le monde réel. La capacité de GPT-5.5 ou de Mythos à résister à des systèmes bien défendus reste une question ouverte. Cependant, pour les réseaux mal protégés, la capacité est clairement présente.
Limitations et défis
Une deuxième simulation appelée "Cooling Tower", qui modélise une attaque sur un système de contrôle industriel, était au-delà des capacités de GPT-5.5. Aucun modèle n'a encore résolu ce scénario de 7 étapes. Selon l'AISI, GPT-5.5, tout comme Mythos, a rencontré des difficultés sur les étapes informatiques en amont plutôt que sur le système de contrôle lui-même.
Bypass des mesures de sécurité
Au-delà de la capacité brute, l'AISI a également testé les mesures de sécurité de GPT-5.5 pour un usage public. Les chercheurs ont découvert un bypass universel qui a fonctionné sur chaque demande cybernétique malveillante signalée par OpenAI, y compris des scénarios d'agents en plusieurs étapes. Cela a pris seulement six heures à développer.
OpenAI a ensuite déployé plusieurs mises à jour du système de sécurité, mais l'AISI n'a pas pu vérifier l'efficacité de la configuration finale en raison d'un problème de configuration dans la version déployée. Cela prouve une fois de plus que les bypass restent une sérieuse faiblesse de sécurité dans les LLM, même les plus capables.
Une différence clé par rapport à Mythos : GPT-5.5 est déjà disponible dans ChatGPT et via l'API, tandis qu'Anthropic limite encore Claude Mythos à un petit groupe. Les résultats de l'AISI suggèrent qu'Anthropic aurait pu sauter cette couche de précaution supplémentaire. Ou peut-être que les critiques ont raison, et que le déploiement lent a moins à voir avec l'éthique de la sécurité qu'avec les contraintes de calcul d'Anthropic.

