Brief IA : CXL 2.0 : la RAM mutualisée pour contrer la pénurie

CXL 2.0 : la RAM mutualisée pour contrer la pénurie

Brief IA
Tom Levy·4 min·16 vues

Les prix de la DDR5 ont triplé en un an, aggravant la crise de la mémoire dans le secteur technologique, alors que la demande en mémoire est stimulée par l'essor des GPU pour l'IA. Le protocole CXL permettrait aux datacenters de mieux gérer leurs ressources mémoire, ce qui est essentiel pour soutenir l'expansion des applications d'IA.

En bref
1Les prix de la DDR5 ont triplé en un an, impactant PC et smartphones.
2Le protocole CXL pourrait aider les datacenters à mutualiser la RAM et réduire la pression sur le marché.
3CXL 2.0 permet le partage de mémoire entre serveurs, avec une adoption croissante chez les géants du secteur.
💡Pourquoi c'est importantLa mutualisation de la RAM via CXL pourrait stabiliser les prix de la mémoire, affectant positivement le marché technologique grand public.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Une flambée des prix de la mémoire vive

En l'espace d'une année, le coût de la mémoire DDR5 a connu une hausse spectaculaire, triplant par rapport à l'année précédente. Cette augmentation est en grande partie due à la demande massive de mémoire HBM par les GPU dédiés à l'intelligence artificielle, utilisés dans les datacenters. Les fabricants de mémoire comme Samsung, SK hynix et Micron ont dû réorienter leur production vers ces puces plus lucratives, laissant moins de ressources pour la DRAM conventionnelle. Cette situation a conduit à une répercussion des coûts sur les fabricants de PC et de smartphones, qui se voient contraints d'augmenter leurs prix.

La pénurie de RAM est un sujet brûlant depuis l'hiver dernier, surtout pour les datacenters spécialisés en IA qui consomment d'énormes quantités de mémoire HBM pour alimenter les GPU de Nvidia, AMD et d'autres. Cette demande a aspiré les capacités de production des principaux fabricants, qui ont dû se concentrer sur les puces les plus rentables. En conséquence, il reste moins de DRAM conventionnelle disponible, ce qui a entraîné une multiplication par trois des prix de la DDR5 depuis le début de 2025.

CXL : une technologie prometteuse pour les datacenters

Le Compute Express Link (CXL) est un protocole d'interconnexion qui utilise les mêmes voies physiques que le PCIe. Son principe est de mutualiser la mémoire entre plusieurs serveurs, un peu comme le covoiturage optimise l'utilisation des places de parking. Au lieu de dédier une quantité fixe de RAM à chaque serveur, souvent sous-utilisée, le CXL permet de créer un pool de mémoire partagée.

Trois versions de CXL existent actuellement :

  • CXL 1.0 (2019) permet d'ajouter de la mémoire à un serveur via un slot PCIe.
  • CXL 2.0 introduit la commutation et le "memory pooling", permettant à plusieurs serveurs d'accéder à un même réservoir de mémoire, bien que chaque zone reste attribuée à un hôte à la fois.
  • CXL 3.0 va plus loin en permettant un véritable partage de mémoire entre machines avec cohérence de cache.

Les processeurs AMD Epyc et Intel Xeon actuels supportent déjà CXL 2.0, et Amazon a annoncé que ses Graviton5 sont compatibles avec la version 3.0.

Un consortium puissant derrière le CXL

CXL a été initialement développé par Intel en 2019 et est désormais géré par un consortium ouvert comprenant des géants comme Alibaba, Cisco, Dell, Google, HPE, Huawei, Meta et Microsoft. AMD, NVIDIA et Samsung ont rejoint le conseil d'administration en 2022. Avec plus de 250 membres, le consortium a publié la version 4.0 en novembre 2025, montrant un soutien massif de l'industrie.

Des entreprises comme Astera Labs, Marvell et Enfabrica travaillent déjà sur des "memory godboxes", des baies dédiées à la mémoire pouvant contenir jusqu'à 18 To de DDR5 par châssis. Enfabrica promet de réduire de moitié le coût de calcul en les connectant aux racks NVIDIA GB200. NVIDIA a d'ailleurs acquis Enfabrica en septembre dernier, voyant le potentiel de cette technologie.

Samsung et Micron proposent également des modules CXL de 128 à 256 Go. L'usage le plus immédiat de ces modules concerne l'offload des KV caches, qui sont les caches d'attention des modèles de langage. Ces caches peuvent parfois occuper plus de mémoire que le modèle lui-même. Google a déjà tenté d'optimiser ces KV caches avec un algorithme maison il y a quelques semaines.

Impact sur le marché grand public

Bien que CXL soit principalement destiné aux datacenters, ses effets se feront sentir sur le marché grand public. Actuellement, la mémoire représente environ 35 % du coût de fabrication d'un PC, contre 15 à 18 % l'année précédente. Les prix des smartphones ont également augmenté de 40 à 50 % selon les marchés. Apple, par exemple, a accepté une hausse de 230 % pour la LPDDR5X de ses iPhone 17 sans négocier, illustrant le changement de rapport de force.

Si CXL permet aux datacenters de mutualiser leur RAM, cela pourrait alléger la pression sur le marché de la mémoire grand public. Cependant, il faudra attendre plusieurs trimestres avant de constater un impact significatif. En attendant, les prix de la DRAM devraient encore augmenter de 93 à 98 % au deuxième trimestre 2026, avec une normalisation espérée au plus tôt en 2027. Ainsi, les consommateurs doivent s'attendre à payer plus cher pour leur prochain kit DDR5.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires