Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Une collaboration renforcée pour l'IA agentique
Dans un contexte où l'intelligence artificielle évolue rapidement, Databricks et Nvidia ont décidé de renforcer leur partenariat pour se concentrer sur le développement de l'IA agentique en milieu professionnel. Cette collaboration vise à combiner le calcul accéléré, de nouvelles architectures matérielles et des outils de développement intégrés pour répondre aux besoins croissants des entreprises. Celles-ci ne se contentent plus d'explorer l'IA générative, mais cherchent à industrialiser des agents capables de raisonner et d'interagir avec leurs données métier dans des environnements sécurisés et régulés.
Lors du récent Data + AI Summit, Databricks a révélé plusieurs innovations conçues en partenariat avec Nvidia pour accélérer la création et le déploiement d'agents d'IA. En plus des GPU, déjà largement utilisés pour l'entraînement et l'inférence, les deux entreprises travaillent sur une infrastructure complète qui inclura les futurs processeurs NVIDIA Vera. Ces outils sont spécifiquement conçus pour le développement agentique et visent à fournir aux entreprises les bases technologiques nécessaires pour construire des agents plus autonomes et performants, capables d'exploiter efficacement les données stratégiques de l'organisation.
Une plateforme commune pour l'IA d'entreprise
Depuis plusieurs années, Databricks utilise les technologies Nvidia pour soutenir certaines des charges de travail d'IA les plus exigeantes. Aujourd'hui, ce partenariat franchit une nouvelle étape avec une intégration plus poussée des infrastructures matérielles et logicielles de Nvidia au sein de la plateforme Databricks.
Au centre de cette stratégie se trouve le Databricks AI Runtime (AIR), un environnement qui permet aux équipes data et IA d'accéder aux capacités de calcul accéléré de Nvidia sans avoir à gérer elles-mêmes une infrastructure GPU complexe. Cela signifie que les entreprises peuvent entraîner, ajuster et déployer des modèles d'IA directement à proximité de leurs données gouvernées. Les GPU Nvidia Hopper, associés au réseau Quantum InfiniBand, sont utilisés pour les entraînements distribués à grande échelle, tandis que la compatibilité avec l'architecture Blackwell garantit l'accès aux futures générations de puissance de calcul.
Databricks démocratise également cet accès en annonçant la prise en charge des GPU Nvidia dans son édition gratuite. Cette décision pourrait accélérer l'adoption de l'IA avancée par les startups, les développeurs indépendants et les équipes de recherche disposant de budgets limités.
Une autre évolution notable est le support prochain des conteneurs NVIDIA NGC et des environnements CUDA personnalisés. Cela permettra aux entreprises d'exécuter leurs environnements spécialisés directement dans la plateforme Databricks, sans multiplier les couches d'infrastructure externes. Cette approche vise à réduire la complexité opérationnelle tout en maintenant des performances élevées, un défi majeur dans les projets d'IA.
Nouveaux besoins en calcul et orchestration
L'annonce de cette collaboration met en lumière l'évolution des architectures d'IA. Jusqu'à présent, les grands modèles de langage ont principalement mis l'accent sur les GPU. Cependant, les futurs agents autonomes nécessitent bien plus que de simples capacités d'inférence. Ils doivent être capables d'exécuter des appels d'outils, d'interroger des bases de données et de coordonner plusieurs étapes de raisonnement. Ils doivent également interagir avec différents systèmes métiers en temps réel, ce qui rend les processeurs essentiels dans cette chaîne de valeur.
Pour relever ce défi, Nvidia met en avant Vera, son futur processeur conçu spécifiquement pour les charges de travail agentiques. Contrairement aux CPU traditionnels, Vera est optimisé pour les tâches sensibles à la latence, caractéristiques des agents d'IA. Selon Nvidia, cette architecture pourrait offrir des performances d'agents jusqu'à 80 % supérieures et une exécution des requêtes SQL jusqu'à trois fois plus rapide. L'objectif est de répartir intelligemment les traitements : les GPU Rubin prendraient en charge l'inférence des modèles, tandis que les CPU Vera géreraient l'orchestration, les appels d'outils et les traitements analytiques.
Pour les entreprises, les agents d'IA promettent d'automatiser des processus métier entiers. Mais leur efficacité dépendra directement de la rapidité avec laquelle ils pourront accéder aux données, interagir avec les applications et exécuter leurs chaînes de raisonnement. Toute latence excessive devient alors un frein à l'adoption. Le partenariat entre Databricks et Nvidia vise donc à anticiper ce futur problème avant qu'il ne devienne un problème à grande échelle.
Cibler les secteurs gourmands en IA
Databricks et Nvidia cherchent également à simplifier le développement et le déploiement des applications d'IA agentique. Databricks Apps pourra désormais héberger NVIDIA Agent Toolkit, la plateforme open source de Nvidia dédiée à la création d'agents intelligents. Les entreprises disposeront ainsi d'un environnement intégré pour développer, déployer et gouverner leurs agents sans quitter l'écosystème Databricks.
Cette intégration apporte plusieurs éléments essentiels dans les projets d'IA avancés, tels que le raisonnement multi-étapes, l'utilisation d'outils externes, la génération augmentée par récupération (RAG) et les mécanismes de garde-fous. Les développeurs bénéficieront également de Genie Code, un assistant conçu pour simplifier l'utilisation des infrastructures Nvidia. Cet outil permettra d'identifier les goulets d'étranglement liés aux GPU et d'optimiser les performances, ainsi que de diagnostiquer les problèmes CUDA de manière conversationnelle.
Mais l'ambition des deux groupes dépasse les usages génériques de l'IA. Nvidia apporte progressivement à Databricks ses bibliothèques spécialisées dans différents secteurs industriels. Les entreprises du secteur de la santé pourront exploiter MONAI pour l'analyse d'images médicales ou BioNeMo pour la découverte de médicaments. Les acteurs de la génomique bénéficieront de Parabricks, tandis que les industriels pourront s'appuyer sur Omniverse et Isaac Sim pour les jumeaux numériques et la simulation robotique.
Pour Databricks, l'intégration des technologies Nvidia permet de devenir une plateforme unique qui regroupe données, gouvernance, calcul accéléré et outils de développement. Pour Nvidia, c'est une manière de positionner son infrastructure comme la colonne vertébrale technique de la future économie des agents.

