Pentagone : IA entraînée sur données classifiées, enjeux et risques

⚡

Key Takeaways

1Le Pentagone explore l'entraînement d'IA sur des données classifiées pour améliorer la précision des modèles utilisés dans des contextes militaires.

2Des entreprises comme OpenAI et xAI pourraient bientôt entraîner leurs modèles sur des informations sensibles, malgré les risques de sécurité potentiels.

3Aalok Mehta souligne les dangers de fuites d'informations classifiées, mais note que des infrastructures sécurisées existent déjà pour limiter ces risques.

💡Why it matters — L'initiative pourrait transformer l'utilisation de l'IA dans le domaine militaire, tout en posant des défis de sécurité majeurs.

Le Pentagone et l'entraînement d'IA sur des données classifiées

Le Pentagone envisage de créer des environnements sécurisés pour permettre aux entreprises spécialisées en intelligence artificielle générative de former leurs modèles sur des données classifiées. Cette initiative, révélée par le MIT Technology Review, pourrait marquer un tournant dans l'utilisation de l'IA au sein des forces armées américaines.

Actuellement, des modèles d'IA comme Claude d'Anthropic sont déjà employés pour traiter des questions dans des contextes classifiés, notamment pour des analyses de cibles en Iran. Toutefois, l'idée d'entraîner ces modèles directement sur des données classifiées représente une avancée significative qui comporte des risques de sécurité uniques. Cela impliquerait que des informations sensibles, telles que des rapports de surveillance ou des évaluations de champs de bataille, soient intégrées dans les modèles, rapprochant ainsi les entreprises d'IA des données classifiées.

Des accords avec des géants de l'IA

Un responsable de la défense américaine, s'exprimant anonymement, a indiqué que l'entraînement de modèles d'IA sur des données classifiées pourrait accroître leur précision et leur efficacité pour certaines tâches spécifiques. Cette annonce intervient alors que le Pentagone a déjà signé des accords avec des entreprises comme OpenAI et xAI, fondée par Elon Musk, pour déployer leurs modèles dans des environnements classifiés. Le Département de la Défense poursuit un nouvel agenda visant à devenir une force de combat "axée sur l'IA", en particulier dans le contexte de tensions croissantes avec l'Iran. Cependant, le Pentagone n'a pas encore commenté officiellement ces plans d'entraînement.

L'entraînement des modèles se déroulerait dans des centres de données sécurisés, accrédités pour héberger des projets gouvernementaux classifiés. Une copie d'un modèle d'IA serait alors associée à des données classifiées. Bien que le Département de la Défense conserve la propriété des données, le personnel des entreprises d'IA, disposant des autorisations de sécurité nécessaires, pourrait exceptionnellement y accéder.

Évaluation préalable sur des données non classifiées

Avant de permettre cet entraînement sur des données classifiées, le Pentagone souhaite d'abord évaluer l'exactitude et l'efficacité des modèles en les entraînant sur des données non classifiées, telles que des images satellites disponibles commercialement.

Depuis longtemps, l'armée utilise des modèles de vision par ordinateur pour identifier des objets dans des images et des séquences capturées par des drones et des avions. Des agences fédérales ont également attribué des contrats à des entreprises pour entraîner des modèles d'IA sur ce type de contenu. Par ailleurs, des entreprises d'IA développent des modèles de langage (LLMs) et des chatbots adaptés aux besoins gouvernementaux, comme Claude Gov d'Anthropic, conçu pour fonctionner dans plusieurs langues et dans des environnements sécurisés. Cependant, les récents commentaires du responsable de la défense constituent la première indication que des entreprises comme OpenAI et xAI pourraient entraîner des versions spécifiques au gouvernement de leurs modèles directement sur des données classifiées.

Les risques de l'entraînement sur des données classifiées

Aalok Mehta, directeur du Wadhwani AI Center au Center for Strategic and International Studies, et ancien responsable des politiques en IA chez Google et OpenAI, met en garde contre les risques liés à l'entraînement sur des données classifiées. Selon lui, le principal danger réside dans la possibilité que des informations classifiées soient divulguées à quiconque utilise le modèle. Cela pourrait poser problème si plusieurs départements militaires, avec des niveaux de classification et des besoins d'information différents, partageaient le même modèle d'IA.

Mehta illustre ce risque par un exemple : un modèle ayant accès à des renseignements humains sensibles, comme le nom d'un agent, pourrait accidentellement divulguer cette information à une partie du Département de la Défense non autorisée à y accéder. Cela créerait un risque de sécurité pour l'agent concerné, un risque difficile à atténuer si un modèle est utilisé par plusieurs groupes au sein de l'armée.

Des infrastructures sécurisées déjà en place

Cependant, Mehta souligne qu'il est moins complexe de protéger ces informations du monde extérieur. "Si vous configurez cela correctement, le risque que ces données soient divulguées sur Internet ou renvoyées à OpenAI est très faible", affirme-t-il. Le gouvernement dispose déjà d'une partie de l'infrastructure nécessaire. Par exemple, le géant de la sécurité Palantir a remporté des contrats importants pour créer un environnement sécurisé permettant aux responsables de poser des questions à des modèles d'IA sur des sujets classifiés sans renvoyer l'information aux entreprises d'IA. Néanmoins, utiliser ces systèmes pour l'entraînement reste un défi inédit.

L'IA, un outil stratégique pour le Pentagone

Le Pentagone, encouragé par un mémo du secrétaire à la Défense Pete Hegseth en janvier, s'efforce d'intégrer davantage l'IA dans ses opérations. Cela inclut son utilisation au combat, où l'IA générative pourrait classer des listes de cibles et recommander lesquelles frapper en priorité, ainsi que dans des rôles plus administratifs, tels que la rédaction de contrats et de rapports.

De nombreuses tâches actuellement effectuées par des analystes humains pourraient être confiées à des modèles d'IA avancés nécessitant un accès à des données classifiées, explique Mehta. Cela pourrait inclure l'apprentissage pour identifier des indices subtils dans une image, comme le ferait un analyste, ou relier de nouvelles informations à un contexte historique. Les données classifiées pourraient être extraites d'une quantité immense de textes, d'audios, d'images et de vidéos dans de nombreuses langues collectées par les services de renseignement.

Il reste difficile de déterminer quelles tâches militaires spécifiques nécessiteraient que des modèles d'IA soient entraînés sur de telles données, avertit Mehta. "Évidemment, le Département de la Défense a de nombreux incitatifs à garder ces informations confidentielles et ne veut pas que d'autres pays sachent exactement quelles capacités nous avons dans ce domaine."