Brief IA : OpenAI et géants tech lancent le réseau IA révolutionnaire MRC
💻 Code & Dev

OpenAI et géants tech lancent le réseau IA révolutionnaire MRC

Brief IA
Tom Levy·2 min·1 vues

OpenAI a développé le protocole de réseau open source MRC (Multipath Reliable Connection) en collaboration avec AMD, Broadcom, Intel, Microsoft et NVIDIA. MRC permet de connecter plus de 100 000 GPU avec seulement deux couches de commutation, réduisant ainsi la consommation d'énergie et les coûts. Ce protocole est déjà opérationnel sur le superordinateur Stargate d'OpenAI, démontrant son efficacité en conditions réelles.

En bref
1OpenAI s'associe à AMD, Broadcom, Intel, Microsoft et NVIDIA pour créer le protocole réseau MRC.
2Le protocole MRC améliore la vitesse et la résilience des transferts de données entre GPU dans les superordinateurs IA.
3MRC est déjà en usage sur les superordinateurs NVIDIA GB200 d'OpenAI, optimisant l'entraînement de modèles comme ChatGPT.
💡Pourquoi c'est importantCette innovation pourrait transformer l'efficacité des superordinateurs IA, réduisant coûts et consommation énergétique.
Le brief IA que lisent les pros

Tu codes avec l’IA ?

Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Un partenariat technologique majeur pour OpenAI

OpenAI a récemment annoncé une collaboration avec des leaders de l'industrie technologique, notamment AMD, Broadcom, Intel, Microsoft et NVIDIA. Ensemble, ils ont développé un nouveau protocole réseau baptisé MRC (Multipath Reliable Connection).

Amélioration des performances des superordinateurs IA

Le protocole MRC a été conçu pour optimiser les transferts de données entre les GPU dans les superordinateurs dédiés à l'intelligence artificielle. En répartissant les paquets de données sur des centaines de chemins simultanés, MRC vise à rendre ces transferts plus rapides, prévisibles et résilients. Cette approche permet de réduire les congestions au sein du réseau.

En cas de défaillance de chemins, de liens ou de commutateurs, MRC est capable de détecter et de contourner les problèmes en une microseconde. Les réseaux traditionnels peuvent nécessiter plusieurs secondes pour se stabiliser après une panne, selon OpenAI.

Avantages du protocole MRC

Grâce à sa conception multi-plan, MRC peut connecter plus de 100 000 GPU avec seulement deux niveaux de commutateurs Ethernet, contrairement aux trois ou quatre niveaux requis par les réseaux conventionnels de 800 Gb/s. Cela permet de réduire la consommation d'énergie, le nombre de composants nécessaires et le coût global du réseau.

Déploiement et impact immédiat

Le protocole MRC est déjà opérationnel sur les superordinateurs NVIDIA GB200 d'OpenAI, utilisés pour l'entraînement de modèles avancés. Parmi ces installations, on trouve le site Oracle Cloud Infrastructure à Abilene, Texas, ainsi que les superordinateurs Fairwater de Microsoft.

Lors de l'entraînement d'un modèle récent pour ChatGPT et Codex, OpenAI a pu éviter de coordonner le redémarrage de quatre commutateurs de niveau 1 grâce à MRC, ce qui aurait pu perturber les travaux en cours.

Publication et contributions

La spécification de MRC a été rendue publique aujourd'hui via le Open Compute Project (OCP), accompagnée d'un article de recherche détaillant ses fonctionnalités. Outre OpenAI, les entreprises AMD, Broadcom, Intel, Microsoft et NVIDIA ont toutes contribué au développement de ce protocole innovant.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires