Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
L'intelligence artificielle et son vocabulaire en constante évolution
L'intelligence artificielle (IA) est en train de transformer notre monde, et avec elle, un nouveau vocabulaire émerge pour décrire cette révolution. En parcourant des articles sur l'IA, vous rencontrerez des termes tels que LLMs, RAG, RLHF, et bien d'autres, qui peuvent même dérouter les experts du secteur technologique. Ce glossaire est une tentative de clarifier ces termes. Nous le mettons à jour régulièrement pour suivre l'évolution rapide du domaine, tout comme les systèmes d'IA qu'il décrit.
Intelligence artificielle générale (AGI)
L'intelligence artificielle générale, souvent abrégée en AGI, est un concept complexe et parfois flou. Elle désigne généralement une IA capable de surpasser l'humain moyen dans de nombreuses tâches, voire la plupart d'entre elles. Sam Altman, PDG d'OpenAI, a décrit l'AGI comme un « humain médian » que l'on pourrait embaucher comme collègue. La charte d'OpenAI définit l'AGI comme des systèmes hautement autonomes qui dépassent les humains dans la plupart des travaux économiquement précieux. De son côté, Google DeepMind voit l'AGI comme une IA au moins aussi compétente que les humains dans la majorité des tâches cognitives. Cette diversité de définitions montre que même les experts ne sont pas toujours d'accord sur ce qu'est réellement l'AGI.
Agent IA
Un agent IA désigne un outil utilisant des technologies d'IA pour accomplir une série de tâches à votre place, allant bien au-delà des capacités d'un simple chatbot. Ces agents peuvent gérer des opérations comme le dépôt de dépenses, la réservation de billets ou même la rédaction et la maintenance de code. Cependant, le concept d'agent IA est encore en développement, et sa signification peut varier selon les personnes. L'infrastructure nécessaire pour réaliser pleinement ses capacités est encore en construction. En essence, un agent IA est un système autonome qui peut s'appuyer sur plusieurs systèmes d'IA pour exécuter des tâches complexes en plusieurs étapes.
Points de terminaison API
Les points de terminaison API peuvent être imaginés comme des « boutons » cachés à l'arrière d'un logiciel, que d'autres programmes peuvent activer pour le faire fonctionner. Les développeurs utilisent ces interfaces pour créer des intégrations, permettant par exemple à une application de tirer des données d'une autre ou à un agent IA de contrôler directement des services tiers sans intervention humaine. Bien que ces points de terminaison soient invisibles pour les utilisateurs ordinaires, ils sont omniprésents dans les appareils intelligents et les plateformes connectées. À mesure que les agents IA gagnent en capacité, ils deviennent de plus en plus aptes à découvrir et utiliser ces points de terminaison, ouvrant ainsi de nouvelles possibilités d'automatisation.
Chaîne de pensée
Lorsqu'un humain est confronté à une question simple, il peut souvent y répondre sans trop réfléchir, comme « quel animal est plus grand, une girafe ou un chat ? ». Cependant, pour des questions plus complexes, un raisonnement étape par étape est nécessaire. Par exemple, si un agriculteur possède des poules et des vaches, et qu'ensemble ils ont 40 têtes et 120 jambes, il faudra probablement écrire une équation pour trouver la réponse (20 poules et 20 vaches). Dans le contexte de l'IA, le raisonnement en chaîne de pensée pour les grands modèles de langage consiste à décomposer un problème en étapes intermédiaires pour améliorer la qualité du résultat final. Bien que cela prenne généralement plus de temps, la réponse obtenue est souvent plus précise, notamment dans des contextes logiques ou de codage.
Agent de codage
Un agent de codage est une version spécialisée d'un agent IA, appliquée au développement logiciel. Contrairement à un simple assistant qui suggère du code à un humain, un agent de codage peut écrire, tester et déboguer du code de manière autonome. Il gère le travail itératif et d'essai-erreur qui occupe souvent les développeurs. Ces agents peuvent parcourir l'ensemble des bases de code, identifier des bogues, exécuter des tests et appliquer des corrections avec peu de supervision humaine. Imaginez-le comme un stagiaire extrêmement rapide qui ne dort jamais et ne perd jamais sa concentration, bien qu'un examen humain reste nécessaire pour valider le travail.
Calcul
Le terme "calcul" est souvent utilisé pour désigner la puissance de traitement essentielle au fonctionnement des modèles d'IA. Cette capacité de traitement alimente l'industrie de l'IA, permettant la formation et le déploiement de modèles puissants. Le terme est souvent un raccourci pour désigner les types de matériel qui fournissent cette puissance, tels que les GPU, CPU, TPU, et autres infrastructures qui forment la base de l'industrie moderne de l'IA.
Apprentissage profond
L'apprentissage profond est un sous-ensemble de l'apprentissage automatique qui s'améliore de lui-même, utilisant une structure de réseau de neurones artificiels à plusieurs couches. Cela permet aux algorithmes d'établir des corrélations plus complexes par rapport aux systèmes d'apprentissage automatique plus simples, tels que les modèles linéaires ou les arbres de décision. Inspirée des connexions neuronales du cerveau humain, cette structure permet aux modèles d'IA d'identifier eux-mêmes des caractéristiques importantes dans les données, sans intervention humaine. Les systèmes d'apprentissage profond nécessitent cependant de nombreux points de données pour être efficaces et prennent généralement plus de temps à former, ce qui augmente les coûts de développement.
Diffusion
La diffusion est une technologie centrale pour de nombreux modèles d'IA générant de l'art, de la musique et du texte. Inspirés par la physique, ces systèmes « détruisent » progressivement la structure des données en ajoutant du bruit jusqu'à ce qu'il ne reste plus rien. En physique, la diffusion est un processus spontané et irréversible, mais en IA, le but est d'apprendre un processus de « diffusion inverse » pour restaurer les données détruites, permettant ainsi de récupérer les informations à partir du bruit.
Distillation
La distillation est une technique utilisée pour extraire des connaissances d'un grand modèle d'IA via un modèle « enseignant-élève ». Les développeurs envoient des requêtes à un modèle enseignant et enregistrent les sorties, qui sont ensuite utilisées pour former le modèle élève. Ce processus permet de créer un modèle plus petit et plus efficace basé sur un modèle plus grand, avec une perte minimale de distillation. C'est probablement ainsi qu'OpenAI a développé GPT-4 Turbo, une version plus rapide de GPT-4. Bien que la distillation soit couramment utilisée en interne par les entreprises d'IA, elle peut aussi être employée pour rattraper des modèles de pointe, bien que cela puisse violer les conditions de service des API d'IA.
Affinage
L'affinage consiste à entraîner un modèle d'IA pour optimiser ses performances pour une tâche ou un domaine spécifique, en utilisant de nouvelles données spécialisées. De nombreuses startups d'IA utilisent de grands modèles de langage comme base pour développer un produit commercial, mais cherchent à augmenter leur utilité pour un secteur ou une tâche cible en affinant les cycles d'entraînement antérieurs avec leur propre expertise et connaissance du domaine.
Réseau antagoniste génératif (GAN)
Un réseau antagoniste génératif, ou GAN, est un cadre d'apprentissage automatique qui soutient certains développements importants dans l'IA générative, notamment la production de données réalistes comme les outils de deepfake. Les GANs utilisent une paire de réseaux de neurones, l'un générant des données et l'autre les évaluant. Ce processus de compétition permet d'optimiser les sorties de l'IA pour les rendre plus réalistes sans intervention humaine supplémentaire. Les GANs sont particulièrement efficaces pour des applications étroites, telles que la production de photos ou de vidéos réalistes.
Hallucination
L'hallucination est le terme utilisé dans l'industrie de l'IA pour désigner les modèles qui inventent des informations incorrectes. Ce problème est un défi majeur pour la qualité de l'IA, car les hallucinations peuvent produire des sorties trompeuses et entraîner des risques dans la vie réelle, comme des conseils médicaux nuisibles. Ce phénomène est souvent attribué à des lacunes dans les données d'entraînement, ce qui pousse à développer des modèles d'IA plus spécialisés pour réduire les risques de désinformation.
Inférence
L'inférence est le processus par lequel un modèle d'IA fait des prédictions ou tire des conclusions à partir de données précédemment vues. Ce processus ne peut se produire sans entraînement préalable, car un modèle doit apprendre des motifs dans un ensemble de données avant de pouvoir extrapoler efficacement. Divers types de matériel peuvent effectuer l'inférence, des processeurs de smartphone aux GPU puissants, mais tous ne peuvent pas exécuter des modèles de manière égale. Les modèles très grands nécessitent des infrastructures puissantes pour faire des prédictions rapidement.
Modèle de langage de grande taille (LLM)
Les modèles de langage de grande taille, ou LLMs, sont les modèles d'IA utilisés par des assistants IA populaires tels que ChatGPT, Claude, Gemini de Google, Llama de Meta, Copilot de Microsoft, ou Le Chat de Mistral. Lorsque vous interagissez avec un assistant IA, vous communiquez avec un LLM qui traite votre demande, souvent avec l'aide de divers outils disponibles, comme la navigation web ou les interprètes de code. Ces modèles sont des réseaux de neurones profonds qui...