Tu veux les meilleurs outils IA avant les autres ?
On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
L'IA physique et ses implications croissantes
La gouvernance autour de l'intelligence artificielle physique devient de plus en plus complexe à mesure que les systèmes d'IA autonomes s'intègrent dans des robots, des capteurs et des équipements industriels. La question n'est pas seulement de savoir si les agents d'IA peuvent accomplir des tâches, mais comment leurs actions sont testées, surveillées et interrompues lorsqu'ils interagissent avec des systèmes du monde réel.
Les robots industriels fournissent déjà une base importante pour cette discussion. La Fédération internationale de robotique a déclaré que 542 000 robots industriels ont été installés dans le monde en 2024, soit plus du double du niveau annuel enregistré une décennie plus tôt. Elle prévoit que les installations atteindront 575 000 unités en 2025 et dépasseront 700 000 unités d'ici 2028.
Les chercheurs de marché appliquent également l'étiquette IA physique à un groupe plus large de systèmes, y compris la robotique, l'informatique en périphérie et les machines autonomes. Grand View Research a estimé le marché mondial de l'IA physique à 81,64 milliards de dollars en 2025 et prévoit qu'il atteindra 960,38 milliards de dollars d'ici 2033, bien que cette catégorie dépende de la manière dont les fournisseurs définissent l'intelligence dans les systèmes physiques.
Du résultat du modèle à l'action physique
Le défi de gouvernance est différent de l'automatisation uniquement logicielle, car les systèmes physiques peuvent fonctionner autour des lieux de travail, des infrastructures et des utilisateurs humains. Ils peuvent également être connectés à des équipements nécessitant des limites de sécurité claires. Un résultat de modèle peut devenir un mouvement de robot ou une instruction machine. Cela rend les limites de sécurité et les chemins d'escalade partie intégrante de la conception du système.
Le travail de robotique de Google DeepMind est un exemple récent de la manière dont les modèles d'IA sont adaptés à cet environnement. La société a introduit Gemini Robotics et Gemini Robotics-ER en mars 2025, les décrivant comme des modèles construits sur Gemini 2.0 pour la robotique et l'IA incarnée. Gemini Robotics est un modèle vision-langage-action conçu pour contrôler directement des robots, tandis que Gemini Robotics-ER se concentre sur le raisonnement incarné, y compris la compréhension spatiale et la planification des tâches.
Un robot utilisant ce type de modèle peut avoir besoin d'identifier un objet, de comprendre une instruction et de planifier une séquence de mouvements. Il doit également évaluer si la tâche a été accomplie correctement. Cela crée un problème de contrôle qui inclut à la fois le comportement du modèle et les limites mécaniques du système.
Google DeepMind a déclaré que les robots utiles doivent posséder de la généralité, de l'interactivité et de la dextérité. La généralité couvre les objets et environnements inconnus. L'interactivité se rapporte à l'entrée humaine et aux conditions changeantes. La dextérité fait référence aux tâches physiques nécessitant des mouvements précis.
Dans ses documents de lancement, Google DeepMind a indiqué que Gemini Robotics pouvait suivre des instructions en langage naturel et effectuer des tâches de manipulation en plusieurs étapes. Les exemples incluent le pliage de papier, le rangement d'objets dans un sac et la manipulation d'objets non vus pendant l'entraînement.
Les exigences techniques pour l'IA physique sont plus larges que la compréhension du langage. Les systèmes nécessitent une perception visuelle et un raisonnement spatial. Ils ont également besoin de planification des tâches et de détection de succès. Dans la robotique, la détection de succès est importante car le système doit décider si une tâche a été accomplie, s'il doit réessayer ou s'il doit s'arrêter.
Gemini Robotics-ER 1.6, introduit en avril 2026, montre comment ces fonctions sont intégrées dans de nouveaux modèles. La société décrit le modèle comme soutenant la logique spatiale, la planification des tâches et la détection de succès, avec la capacité de raisonner à travers des étapes intermédiaires et de décider s'il faut avancer ou réessayer.
La documentation des développeurs de Google indique que Gemini Robotics-ER 1.6 est disponible en aperçu via l'API Gemini. La documentation le décrit comme un modèle vision-langage qui apporte les capacités agentiques de Gemini à la robotique. Ces capacités incluent l'interprétation visuelle, le raisonnement spatial et la planification à partir de commandes en langage naturel.
Google AI Studio fournit un environnement de développement pour travailler avec les modèles Gemini, tandis que l'API Gemini offre un moyen d'intégrer ces modèles dans des applications. Dans le contexte de l'IA incarnée, cela rapproche les tests et les incitations des développeurs construisant des applications agentiques.
Les contrôles de sécurité intégrés dans la conception du système
La gouvernance devient plus complexe lorsque ces systèmes peuvent appeler des outils, générer du code ou déclencher des actions. Les contrôles doivent définir quelles données le système peut accéder, quels outils il peut utiliser, quelles actions nécessitent une approbation humaine et comment l'activité est enregistrée pour révision.
La recherche sur la confiance en l'IA de McKinsey en 2026 souligne le même problème dans l'IA d'entreprise de manière plus générale. Elle a révélé qu'environ un tiers des organisations ont déclaré des niveaux de maturité de trois ou plus en stratégie, gouvernance et gouvernance de l'IA agentique, même si les systèmes d'IA assument des fonctions de plus en plus autonomes.
Dans la robotique, la sécurité inclut également le comportement physique de la machine. Google DeepMind a décrit la sécurité des robots comme un problème à plusieurs niveaux, couvrant des contrôles de bas niveau tels que l'évitement des collisions, les limites de force et la stabilité, ainsi que le raisonnement de haut niveau sur la sécurité d'une action demandée dans un contexte donné.
La société a également introduit ASIMOV, un ensemble de données pour évaluer la sécurité sémantique en robotique et en IA incarnée. Google DeepMind a déclaré que cet ensemble de données était conçu pour tester si les systèmes peuvent comprendre des instructions liées à la sécurité et éviter des comportements dangereux dans des environnements physiques.
Les mêmes contrôles utilisés pour les agents logiciels deviennent plus difficiles à gérer lorsque les systèmes sont connectés à des robots, des capteurs ou des équipements industriels. Cela inclut les droits d'accès, les pistes de vérification et les comportements de refus. Cela inclut également les chemins d'escalade et les tests.
Les cadres de gouvernance tels que le NIST AI Risk Management Framework et l'ISO/IEC 42001 fournissent des structures pour gérer les risques et les responsabilités liés à l'IA tout au long du cycle de vie du système. Dans l'IA physique, ces contrôles doivent tenir compte du comportement des modèles, des machines connectées et de l'environnement opérationnel.
Google DeepMind a également collaboré avec des entreprises de robotique dans le cadre de son développement d'IA incarnée. En mars 2025, la société a annoncé un partenariat avec Apptronik sur des robots humanoïdes utilisant Gemini 2.0, et a cité Agile Robots, Agility Robotics, Boston Dynamics et Enchanted Tools parmi les testeurs de confiance pour Gemini Robotics-ER.
La mise à jour de 2026 a également mentionné un travail avec Boston Dynamics impliquant des tâches robotiques telles que la lecture d'instruments. Ce type de cas d'utilisation dépend de la compréhension visuelle, de la planification des tâches et de l'évaluation fiable des conditions physiques.
L'IA physique s'applique à l'inspection industrielle, à la fabrication et à la logistique. Elle s'applique également aux installations et aux entrepôts. Ces environnements nécessitent des systèmes capables d'interpréter les conditions du monde réel et d'agir dans des limites définies. La question de gouvernance est de savoir comment ces limites sont établies avant que les systèmes autonomes ne soient autorisés à prendre ou exécuter des décisions.
