Que s'est-il passé avec l'agent IA de Codewall et pourquoi c'est important ?

Un agent IA de Codewall a piraté la plateforme de recrutement Jack & Jill en exploitant quatre vulnérabilités en moins d'une heure, obtenant un accès administrateur total. Il a ensuite testé la sécurité de l'agent vocal de la plateforme en imitant Donald Trump, révélant des failles dans les garde-fous de l'IA. Cet incident souligne les défis critiques de sécurité auxquels les entreprises font face dans un environnement technologique en constante évolution. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Codewall : l'IA pirate un recruteur et imite Trump

Brief IA

Tom Levy·15 mars 2026·5 min·1 vues

⚡

En bref

1L'agent IA de Codewall a piraté la plateforme Jack & Jill, exploitant quatre failles en une heure pour obtenir un accès administrateur.

2Après l'attaque, l'agent a testé l'IA vocale de Jack & Jill, réussissant à tromper l'agent vocal en imitant Donald Trump.

3Codewall a révélé ces vulnérabilités à Jack & Jill, qui les a corrigées rapidement, soulignant les défis de sécurité des agents IA.

💡Pourquoi c'est important — Les agents IA autonomes posent de nouveaux risques de cybersécurité, nécessitant des mesures de protection renforcées pour éviter des intrusions similaires.

Codewall et l'intrusion sur Jack & Jill

L'agent autonome développé par Codewall, une startup spécialisée en cybersécurité, a récemment mis en lumière des failles critiques dans la plateforme de recrutement Jack & Jill. En moins d'une heure, cet agent a réussi à exploiter quatre vulnérabilités distinctes, ce qui lui a permis d'obtenir un accès administrateur complet aux comptes de l'entreprise. Cette démonstration de force a révélé des lacunes importantes dans la sécurité de la plateforme basée à Londres.

Après avoir pris le contrôle, l'agent de Codewall a entrepris de tester l'infrastructure vocale de Jack & Jill. Lors de cette phase, il a interagi avec l'agent IA "Jack" à travers 28 échanges. Bien que les systèmes de protection aient résisté à la plupart des tentatives, l'agent a réussi à tromper "Jack" en se faisant passer pour Donald Trump, ce qui a conduit l'agent vocal à le désigner comme "Monsieur le Président" sans remettre en question l'authenticité de l'interaction.

Analyse détaillée de l'attaque

La société Codewall a affirmé que son agent autonome avait exploité quatre failles de sécurité sur la plateforme Jack & Jill, une entreprise soutenue par un financement de 20 millions de dollars. Ces vulnérabilités ont été enchaînées pour réaliser une attaque d'une gravité évaluée à 9.8 sur l'échelle CVSS, suffisant pour un contrôle total des comptes de l'entreprise. Suite à cette attaque, Codewall a informé Jack & Jill des failles, qui ont été corrigées peu après.

Jack & Jill est une startup qui utilise deux agents vocaux IA : "Jack" pour aider les candidats à trouver un emploi et "Jill" pour assister les entreprises dans le processus de recrutement. La société compte parmi ses clients des entreprises renommées telles qu'Anthropic, Stripe, Monzo, et Cursor.

Les failles exploitées

Les quatre vulnérabilités identifiées par Codewall incluent :

Un fetcher d'URL qui exposait la documentation API interne de la plateforme.
Un mode de test actif dans le service d'authentification Clerk, utilisant un code unique statique.
L'absence de vérification de rôle lors de l'intégration des entreprises.
Un point de terminaison qui permettait d'attribuer des utilisateurs à une entreprise en fonction du domaine de l'email, sans vérifier la propriété.

L'agent a pu créer un compte en utilisant le domaine de l'entreprise de Codewall, s'authentifier via le mode de test, être automatiquement assigné à l'entreprise existante, et obtenir des privilèges administratifs complets après son intégration. Cela lui a permis d'accéder aux noms et adresses email des membres de l'équipe, de lire l'accord complet des services de recrutement, de manipuler les offres d'emploi, et d'accéder à l'assistant IA de l'entreprise.

Exploration de l'infrastructure vocale

Après avoir obtenu l'accès, l'agent de Codewall a décidé de tester l'infrastructure vocale de Jack & Jill. Il a découvert que celle-ci exposait des informations de connexion complètes sans nécessiter d'authentification.

Selon Codewall, l'agent a généré des clips vocaux synthétiques via des technologies de text-to-speech, s'est connecté à la salle vocale, et a interagi directement avec l'agent IA "Jack". Lors des 28 échanges, l'agent a utilisé des stratégies de plus en plus agressives, allant de questions inoffensives à des tentatives de social engineering et de jailbreak. Bien que les garde-fous aient résisté, "Jack" a montré des faiblesses notables dans d'autres domaines. Par exemple, lorsque l'agent a imité Donald Trump et a prétendu réaliser une acquisition de 500 millions de dollars, "Jack" l'a appelé "Monsieur le Président" sans remettre en question la situation.

Tous ces détails ont été fournis par Codewall, et aucune vérification indépendante n'a encore été publiée. Quelques jours auparavant, Codewall avait révélé un cas similaire où son agent autonome avait compromis la plateforme interne d'IA de McKinsey, Lilli, en environ deux heures, obtenant un accès en lecture et écriture à une base de données de production contenant 46,5 millions de messages de chat. McKinsey a confirmé la vulnérabilité et l'a corrigée rapidement, tout en précisant qu'une enquête judiciaire n'avait trouvé aucun accès non autorisé aux données des clients.

Les défis de la cybersécurité avec les agents IA

L'émergence des agents IA autonomes pose de nouveaux défis en matière de cybersécurité. Plusieurs études ont mis en évidence leurs faiblesses significatives, et à mesure que ces agents gagnent en autonomie et en capacités, la surface d'attaque s'élargit. L'une des attaques les plus courantes est l'injection de prompt, où des attaquants insèrent des instructions cachées dans un texte pour détourner le comportement d'un agent IA à l'insu de l'utilisateur.

Pour les entreprises, cela crée une situation complexe. La méthode la plus fiable pour réduire ces risques est actuellement de limiter volontairement les capacités des agents : verrouiller les prompts système, restreindre l'accès, limiter l'utilisation des outils, ou exiger une validation humaine pour des actions critiques.

Comme l'a démontré Codewall, les agents IA peuvent également être utilisés comme des outils puissants pour pénétrer dans des systèmes. Cependant, ils surpassent également les équipes humaines dans les compétitions de cybersécurité, trouvant des vulnérabilités que les analystes humains peuvent manquer. Ils sont capables d'analyser d'énormes volumes de données de journaux et de trafic réseau en temps réel, signalant des anomalies et détectant des menaces plus rapidement que n'importe quelle équipe humaine.

Codewall : l'IA pirate un recruteur et imite Trump

Tu veux les meilleurs outils IA avant les autres ?

Codewall et l'intrusion sur Jack & Jill

Analyse détaillée de l'attaque

Les failles exploitées

Exploration de l'infrastructure vocale

Les défis de la cybersécurité avec les agents IA

Meta : l'IA d'Instagram piratée par une attaque simpliste

Jailbreak et Prompt Injection : les IA sous la menace des hackers

Meta AI manipulé : des hackers détournent des comptes Instagram

Replit et l'IA agentique : quand l'autonomie vire au chaos

Google alerte sur les pages web piégeant les agents IA

Trump envisage une prise de participation des États-Unis dans OpenAI