Microsoft et l'IA : décryptage du cerveau humain

⚡

Key Takeaways

1Les modèles LLM prédisent avec précision les réactions cérébrales au langage, mais restent incompréhensibles.

2Le test causal génératif (GCT) traduit ces modèles en explications verbales claires, testées expérimentalement.

3Le GCT a révélé des micro-régions cérébrales spécifiques, ouvrant de nouvelles perspectives en neurosciences.

💡Why it matters — Cette approche pourrait transformer la compréhension des modèles prédictifs en neurosciences et au-delà, en rendant l'invisible visible.

L'énigme des modèles LLM et leur potentiel inexploité

Les modèles de langage de grande taille, ou LLM, ont démontré une capacité impressionnante à prédire les réactions du cerveau humain face au langage. Ces modèles, cependant, sont essentiellement des boîtes noires : ils fonctionnent grâce à une multitude de paramètres appris, mais ne fournissent pas de théories scientifiques claires et accessibles. Cette opacité pose un défi majeur pour ceux qui cherchent à comprendre les mécanismes sous-jacents des réponses cérébrales.

Le test causal génératif : une innovation collaborative

Pour surmonter cette barrière, une collaboration entre Microsoft Research et plusieurs universités américaines, notamment l'Université de Californie à Berkeley, l'Université de Californie à San Francisco et l'Université de Columbia, a donné naissance au test causal génératif (GCT). Ce test a pour objectif de transformer les prédictions cérébrales complexes en explications verbales simples et compréhensibles. Par exemple, il peut révéler que certaines zones du cortex réagissent à des concepts tels que « préparation de nourriture » ou « noms de lieux ».

Le processus du GCT est itératif : un LLM génère des histoires destinées à stimuler une région cérébrale spécifique. Les participants, placés dans un scanner, écoutent ces histoires, et si la région ciblée s'active comme prévu, l'explication est validée.

Des découvertes surprenantes grâce au GCT

Lors des expériences menées avec le GCT, des résultats fascinants ont émergé. Non seulement le test a confirmé des sélectivités cérébrales déjà connues, mais il a aussi permis de distinguer des régions cérébrales voisines, auparavant considérées comme interchangeables. De plus, il a mis en lumière de petites « micro-régions » dans le cortex préfrontal, chacune spécialisée dans des concepts aussi variés que le dialogue ou les mesures temporelles.

Défis d'explicabilité en neurosciences

Depuis une dizaine d'années, les LLM se sont imposés comme des outils de premier plan pour anticiper les réactions cérébrales au langage. En fournissant à un LLM la même histoire qu'un sujet entend dans un scanner fMRI, on peut prédire avec une précision étonnante l'activité de zones spécifiques du cortex. Toutefois, cette prouesse technique s'accompagne d'un revers : l'incapacité à interpréter directement ces modèles. Ils se composent de millions de paramètres inaccessibles, ne permettant pas de comprendre à quoi réagit précisément une région cérébrale.

Vers des théories testables

Dans un article publié dans Nature Neuroscience, des chercheurs ont proposé une solution à cette crise d'explicabilité. Le test causal génératif (GCT) offre un cadre pour transformer les modèles prédictifs en théories claires et testables. En utilisant un LLM pour rédiger des histoires ciblant des zones cérébrales spécifiques, le GCT permet de vérifier expérimentalement les hypothèses générées.

Le processus du GCT se déroule en deux étapes : d'abord, il génère une explication à partir d'un modèle prédictif, puis il vérifie cette explication. Un LLM résume les mots déclencheurs en une phrase concise, comme « préparation de nourriture ». Ensuite, le GCT crée de nouvelles histoires pour activer la région cérébrale selon l'explication. Si l'activité cérébrale est plus élevée pour ces histoires que pour un texte de référence, l'explication est validée.

Implications au-delà des neurosciences

Le potentiel du GCT dépasse largement le cadre des neurosciences. Face à des modèles prédictifs performants mais opaques, le GCT démontre qu'il est possible de distiller ces modèles en théories lisibles et testables. Pour la neuroscience, cela signifie une méthode plus rapide et riche en hypothèses pour cartographier le cortex cérébral. Cette approche pourrait également s'appliquer à d'autres domaines scientifiques où les modèles prédictifs surpassent notre compréhension actuelle.

En somme, l'essor des modèles en boîte noire ne doit pas être perçu comme un obstacle à la compréhension scientifique. Avec des cadres appropriés comme le GCT, il est possible de concilier prédiction et explicabilité, permettant ainsi aux deux de progresser de concert.