Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Microsoft corrige une faille critique dans Copilot
Mardi dernier, Microsoft a procédé à une mise à jour cruciale pour corriger une vulnérabilité jugée critique dans son outil d'intelligence artificielle, M365 Copilot. Cette faille, signalée par des chercheurs en sécurité à Microsoft, permettait aux pirates d'accéder à des codes 2FA ainsi qu'à d'autres informations sensibles contenues dans les emails que Copilot pouvait consulter. Lundi, les chercheurs ont détaillé leur méthode d'exploitation, démontrant comment ils ont pu extraire ces données sensibles.
Les défis des modèles de langage de grande taille
Microsoft, comme d'autres entreprises utilisant des LLM (modèles de langage de grande taille), fait face à des difficultés pour empêcher ses systèmes de répondre à des requêtes malveillantes. Le problème principal réside dans l'incapacité des bots d'IA à distinguer les instructions légitimes des commandes intégrées dans des contenus tiers. Ces modèles, en résumé, peuvent être manipulés pour exécuter des actions au nom de l'utilisateur sans discernement. Pour pallier cette faiblesse, Microsoft et ses concurrents doivent mettre en place des garde-fous complexes et souvent temporaires pour limiter les conséquences de cette vulnérabilité intrinsèque.
Techniques de contournement des garde-fous
Copilot, comme la plupart des LLM, intègre des garde-fous destinés à empêcher l'exécution d'actions telles que l'envoi d'emails ou la soumission de formulaires web, qui pourraient être utilisés pour extraire des données utilisateur. Cependant, les pirates ont trouvé des moyens de contourner ces protections en utilisant le langage de balisage. Ce dernier permet d'ajouter des éléments de formatage comme des titres, des listes ou des liens, sans nécessiter de balises HTML.
En outre, une autre technique consiste à encapsuler des données sensibles dans des balises HTML, telles que <img> ou <form>. Ces balises, une fois intégrées dans une requête web, envoient les informations vers le serveur web de l'attaquant, où elles sont enregistrées dans les journaux, permettant ainsi aux pirates de capturer les données secrètes.


