Tu codes avec l’IA ?
Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Un partenariat technologique majeur pour OpenAI
OpenAI a récemment annoncé une collaboration avec des leaders de l'industrie technologique, notamment AMD, Broadcom, Intel, Microsoft et NVIDIA. Ensemble, ils ont développé un nouveau protocole réseau baptisé MRC (Multipath Reliable Connection).
Amélioration des performances des superordinateurs IA
Le protocole MRC a été conçu pour optimiser les transferts de données entre les GPU dans les superordinateurs dédiés à l'intelligence artificielle. En répartissant les paquets de données sur des centaines de chemins simultanés, MRC vise à rendre ces transferts plus rapides, prévisibles et résilients. Cette approche permet de réduire les congestions au sein du réseau.
En cas de défaillance de chemins, de liens ou de commutateurs, MRC est capable de détecter et de contourner les problèmes en une microseconde. Les réseaux traditionnels peuvent nécessiter plusieurs secondes pour se stabiliser après une panne, selon OpenAI.
Avantages du protocole MRC
Grâce à sa conception multi-plan, MRC peut connecter plus de 100 000 GPU avec seulement deux niveaux de commutateurs Ethernet, contrairement aux trois ou quatre niveaux requis par les réseaux conventionnels de 800 Gb/s. Cela permet de réduire la consommation d'énergie, le nombre de composants nécessaires et le coût global du réseau.
Déploiement et impact immédiat
Le protocole MRC est déjà opérationnel sur les superordinateurs NVIDIA GB200 d'OpenAI, utilisés pour l'entraînement de modèles avancés. Parmi ces installations, on trouve le site Oracle Cloud Infrastructure à Abilene, Texas, ainsi que les superordinateurs Fairwater de Microsoft.
Lors de l'entraînement d'un modèle récent pour ChatGPT et Codex, OpenAI a pu éviter de coordonner le redémarrage de quatre commutateurs de niveau 1 grâce à MRC, ce qui aurait pu perturber les travaux en cours.
Publication et contributions
La spécification de MRC a été rendue publique aujourd'hui via le Open Compute Project (OCP), accompagnée d'un article de recherche détaillant ses fonctionnalités. Outre OpenAI, les entreprises AMD, Broadcom, Intel, Microsoft et NVIDIA ont toutes contribué au développement de ce protocole innovant.



