Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

Glossaire IA : Comprendre les termes clés de l'innovation

⚡

En bref

1L'intelligence artificielle redéfinit le langage technologique avec des termes comme LLMs et RAG.

2L'AGI, ou intelligence artificielle générale, promet de surpasser les capacités humaines dans de nombreuses tâches.

3Les agents IA autonomes révolutionnent la gestion des tâches complexes en s'appuyant sur plusieurs systèmes.

💡Pourquoi c'est important — Comprendre ces termes est crucial pour naviguer dans l'évolution rapide de l'IA et son impact sur divers secteurs.

Glossaire d'IA

L'intelligence artificielle (IA) est en train de transformer notre monde, introduisant un nouveau vocabulaire pour décrire ses mécanismes et son impact. Que vous assistiez à une réunion de produit, une présentation ou un panel, vous entendrez probablement des termes tels que LLMs, RAG, RLHF, et bien d'autres. Ces termes peuvent dérouter même les experts technologiques les plus aguerris. Ce glossaire a pour but de clarifier ces concepts en fournissant des définitions simplifiées des termes d'IA les plus courants. Que vous soyez développeur, investisseur ou simplement curieux de l'actualité technologique, ce guide est conçu pour vous aider à naviguer dans le monde complexe de l'IA. Nous mettons régulièrement à jour ce glossaire pour refléter les évolutions rapides du domaine, tout comme les systèmes d'IA qu'il décrit.

Intelligence artificielle générale (AGI)

L'intelligence artificielle générale, souvent abrégée en AGI, est un concept qui reste flou pour beaucoup. Elle désigne généralement une IA capable de surpasser l'humain moyen dans de nombreuses tâches, voire la plupart. Sam Altman, PDG d'OpenAI, décrit l'AGI comme l'équivalent d'un humain moyen que l'on pourrait embaucher comme collègue. Selon la charte d'OpenAI, l'AGI se compose de systèmes hautement autonomes qui surpassent les humains dans la plupart des travaux économiquement précieux. Google DeepMind, pour sa part, définit l'AGI comme une IA au moins aussi compétente que les humains dans la majorité des tâches cognitives. Cette diversité de définitions montre que même les experts en IA ne s'accordent pas totalement sur ce qu'est l'AGI.

Agent IA

Un agent IA est un outil qui utilise des technologies d'IA pour accomplir une série de tâches en votre nom, allant bien au-delà des capacités d'un simple chatbot. Ces agents peuvent gérer des tâches variées comme le dépôt de dépenses, la réservation de billets ou même l'écriture et la maintenance de code. Cependant, cet espace est en pleine évolution, et le terme "agent IA" peut avoir des significations différentes selon les contextes. L'infrastructure nécessaire pour réaliser pleinement les capacités de ces agents est encore en développement. Le concept fondamental repose sur un système autonome capable de s'appuyer sur plusieurs systèmes d'IA pour exécuter des tâches complexes en plusieurs étapes.

Points de terminaison API

Les points de terminaison API peuvent être imaginés comme des "boutons" cachés dans un logiciel, que d'autres programmes peuvent activer pour le faire fonctionner. Les développeurs utilisent ces interfaces pour créer des intégrations, permettant par exemple à une application de tirer des données d'une autre ou à un agent IA de contrôler des services tiers sans intervention humaine. La plupart des appareils intelligents et des plateformes connectées possèdent ces points de terminaison, même si les utilisateurs ordinaires ne les voient jamais. À mesure que les agents IA gagnent en capacité, ils deviennent de plus en plus aptes à localiser et utiliser ces points de terminaison de manière autonome, ouvrant ainsi des possibilités puissantes, parfois inattendues, pour l'automatisation.

Chaîne de pensée

Lorsqu'un cerveau humain est confronté à une question simple, il peut souvent répondre sans trop réfléchir, comme "quel animal est plus grand, une girafe ou un chat ?" Cependant, pour des problèmes plus complexes, il est souvent nécessaire de décomposer la question en étapes intermédiaires. Par exemple, si un agriculteur possède des poules et des vaches, et qu'ensemble ils ont 40 têtes et 120 pattes, il pourrait être nécessaire d'écrire une équation pour trouver la réponse (20 poules et 20 vaches). Dans le contexte de l'IA, le raisonnement en chaîne de pensée pour les grands modèles de langage consiste à décomposer un problème en étapes plus petites pour améliorer la qualité du résultat final. Bien que cela prenne généralement plus de temps, la réponse obtenue est souvent plus précise, notamment dans des contextes logiques ou de codage. Les modèles de raisonnement sont développés à partir de modèles de langage traditionnels et optimisés pour la pensée en chaîne grâce à l'apprentissage par renforcement.

Agent de codage

Un agent de codage est un concept plus spécifique qu'un agent IA. Il s'agit d'un programme capable de prendre des mesures de manière autonome, étape par étape, pour atteindre un objectif dans le domaine du développement de logiciels. Plutôt que de simplement suggérer du code pour qu'un humain le révise, un agent de codage peut écrire, tester et déboguer du code de manière autonome, gérant ainsi le travail itératif et d'essai-erreur qui occupe généralement la journée d'un développeur. Ces agents peuvent opérer sur l'ensemble des bases de code, repérant des bogues, exécutant des tests et appliquant des corrections avec un minimum de supervision humaine. Imaginez un stagiaire très rapide qui ne dort jamais et ne perd jamais de concentration, bien qu'un humain doive toujours revoir le travail.

Calcul

Le terme calcul, bien que multivalent, fait généralement référence à la puissance de traitement essentielle qui permet aux modèles d'IA de fonctionner. Ce type de traitement alimente l'industrie de l'IA, lui donnant la capacité d'entraîner et de déployer ses modèles puissants. Le terme est souvent utilisé comme un raccourci pour désigner les types de matériel qui fournissent cette puissance de calcul, tels que les GPU, CPU, TPU, et d'autres formes d'infrastructure qui constituent le socle de l'industrie moderne de l'IA.

Apprentissage profond

L'apprentissage profond est un sous-ensemble de l'apprentissage automatique qui s'améliore de manière autonome. Les algorithmes d'IA sont conçus avec une structure de réseau de neurones artificiels (ANN) à plusieurs couches, ce qui leur permet de faire des corrélations plus complexes par rapport aux systèmes d'apprentissage automatique plus simples, tels que les modèles linéaires ou les arbres de décision. La structure des algorithmes d'apprentissage profond s'inspire des voies interconnectées des neurones dans le cerveau humain. Les modèles d'IA en apprentissage profond sont capables d'identifier eux-mêmes des caractéristiques importantes dans les données, plutôt que d'exiger que des ingénieurs humains définissent ces caractéristiques. La structure soutient également des algorithmes qui peuvent apprendre de leurs erreurs et, à travers un processus de répétition et d'ajustement, améliorer leurs propres résultats. Cependant, les systèmes d'apprentissage profond nécessitent de nombreux points de données pour donner de bons résultats (des millions ou plus). Ils prennent également généralement plus de temps à entraîner par rapport aux algorithmes d'apprentissage automatique plus simples, ce qui tend à augmenter les coûts de développement.

Diffusion

La diffusion est la technologie au cœur de nombreux modèles d'IA générant de l'art, de la musique et du texte. Inspirés par la physique, les systèmes de diffusion "détruisent" lentement la structure des données, par exemple des photos ou des chansons, en ajoutant du bruit jusqu'à ce qu'il ne reste plus rien. En physique, la diffusion est spontanée et irréversible, comme le sucre diffusé dans le café qui ne peut pas être restauré sous forme de cube. Cependant, les systèmes de diffusion en IA visent à apprendre un processus de "diffusion inverse" pour restaurer les données détruites, acquérant ainsi la capacité de récupérer les données à partir du bruit.

Distillation

La distillation est une technique utilisée pour extraire des connaissances d'un grand modèle d'IA à l'aide d'un modèle "enseignant-élève". Les développeurs envoient des requêtes à un modèle enseignant et enregistrent les sorties. Les réponses sont parfois comparées à un ensemble de données pour évaluer leur précision. Ces sorties sont ensuite utilisées pour entraîner le modèle élève, qui est formé pour imiter le comportement de l'enseignant. La distillation peut être utilisée pour créer un modèle plus petit et plus efficace basé sur un modèle plus grand avec une perte de distillation minimale. C'est probablement ainsi qu'OpenAI a développé GPT-4 Turbo, une version plus rapide de GPT-4.

Ajustement fin

L'ajustement fin fait référence à l'entraînement supplémentaire d'un modèle d'IA pour optimiser ses performances pour une tâche ou un domaine plus spécifique que ce qui était précédemment le point focal de son entraînement, généralement en utilisant de nouvelles données spécialisées. De nombreuses startups en IA prennent de grands modèles de langage comme point de départ pour construire un produit commercial, mais cherchent à augmenter l'utilité pour un secteur ou une tâche cible en complétant les cycles d'entraînement antérieurs par un ajustement fin basé sur leurs propres connaissances et expertises spécifiques au domaine.

Réseau antagoniste génératif (GAN)

Un GAN, ou réseau antagoniste génératif, est un type de cadre d'apprentissage automatique qui sous-tend certains développements importants en IA générative en matière de production de données réalistes, y compris (mais pas seulement) les outils de deepfake. Les GAN impliquent l'utilisation d'une paire de réseaux de neurones, dont l'un s'appuie sur ses données d'entraînement pour générer une sortie qui est transmise à l'autre modèle pour évaluation. Les deux modèles sont essentiellement programmés pour essayer de se surpasser. Le générateur essaie de faire passer sa sortie devant le discriminateur, tandis que le discriminateur travaille à repérer les données générées artificiellement. Ce concours structuré peut optimiser les sorties de l'IA pour qu'elles soient plus réalistes sans nécessiter d'intervention humaine supplémentaire. Bien que les GAN fonctionnent mieux pour des applications plus étroites, comme la production de photos ou de vidéos réalistes, plutôt que pour une IA à usage général.

Hallucination

L'hallucination est le terme préféré de l'industrie de l'IA pour désigner les modèles d'IA qui inventent des informations, générant littéralement des informations incorrectes. Évidemment, c'est un énorme problème pour la qualité de l'IA. Les hallucinations produisent des sorties de GenAI qui peuvent être trompeuses et pourraient même entraîner des risques dans la vie réelle, avec des conséquences potentiellement dangereuses, comme une requête de santé qui renvoie des conseils médicaux nuisibles. Le problème des IA fabriquant des informations est considéré comme une conséquence des lacunes dans les données d'entraînement. Les hallucinations contribuent à une poussée vers des modèles d'IA de plus en plus spécialisés et/ou verticaux, c'est-à-dire des IA spécifiques à un domaine qui nécessitent une expertise plus étroite, comme moyen de réduire la probabilité de lacunes de connaissances et de diminuer les risques de désinformation.

Inférence

L'inférence est le processus d'exécution d'un modèle d'IA. C'est le fait de libérer un modèle pour faire des prédictions ou tirer des conclusions à partir de données déjà vues. Pour être clair, l'inférence ne peut pas se produire sans entraînement ; un modèle doit apprendre des motifs dans un ensemble de données avant de pouvoir extrapoler efficacement à partir de ces données d'entraînement. De nombreux types de matériel peuvent effectuer l'inférence, allant des processeurs de smartphone aux GPU puissants en passant par des accélérateurs d'IA conçus sur mesure. Mais tous ne peuvent pas exécuter des modèles de manière égale. Des modèles très grands prendraient des âges pour faire des prédictions sur, disons, un ordinateur portable par rapport à un serveur cloud avec des puces d'IA haut de gamme.

Modèle de langage de grande taille (LLM)

Les modèles de langage de grande taille, ou LLMs, sont les modèles d'IA utilisés par des assistants IA populaires, tels que ChatGPT, Claude, Gemini de Google, Llama de Meta, etc.