Pourquoi la mutualisation de la RAM est-elle importante pour les datacenters ?

Les prix de la DDR5 ont triplé en un an, aggravant la crise de la mémoire dans le secteur technologique, alors que la demande en mémoire est stimulée par l'essor des GPU pour l'IA. Le protocole CXL permettrait aux datacenters de mieux gérer leurs ressources mémoire, ce qui est essentiel pour soutenir l'expansion des applications d'IA. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

CXL 2.0 : la RAM mutualisée pour contrer la pénurie

Brief IA

Tom Levy·11 mai 2026·4 min·16 vues

⚡

En bref

1Les prix de la DDR5 ont triplé en un an, impactant PC et smartphones.

2Le protocole CXL pourrait aider les datacenters à mutualiser la RAM et réduire la pression sur le marché.

3CXL 2.0 permet le partage de mémoire entre serveurs, avec une adoption croissante chez les géants du secteur.

💡Pourquoi c'est important — La mutualisation de la RAM via CXL pourrait stabiliser les prix de la mémoire, affectant positivement le marché technologique grand public.

Une flambée des prix de la mémoire vive

En l'espace d'une année, le coût de la mémoire DDR5 a connu une hausse spectaculaire, triplant par rapport à l'année précédente. Cette augmentation est en grande partie due à la demande massive de mémoire HBM par les GPU dédiés à l'intelligence artificielle, utilisés dans les datacenters. Les fabricants de mémoire comme Samsung, SK hynix et Micron ont dû réorienter leur production vers ces puces plus lucratives, laissant moins de ressources pour la DRAM conventionnelle. Cette situation a conduit à une répercussion des coûts sur les fabricants de PC et de smartphones, qui se voient contraints d'augmenter leurs prix.

La pénurie de RAM est un sujet brûlant depuis l'hiver dernier, surtout pour les datacenters spécialisés en IA qui consomment d'énormes quantités de mémoire HBM pour alimenter les GPU de Nvidia, AMD et d'autres. Cette demande a aspiré les capacités de production des principaux fabricants, qui ont dû se concentrer sur les puces les plus rentables. En conséquence, il reste moins de DRAM conventionnelle disponible, ce qui a entraîné une multiplication par trois des prix de la DDR5 depuis le début de 2025.

CXL : une technologie prometteuse pour les datacenters

Le Compute Express Link (CXL) est un protocole d'interconnexion qui utilise les mêmes voies physiques que le PCIe. Son principe est de mutualiser la mémoire entre plusieurs serveurs, un peu comme le covoiturage optimise l'utilisation des places de parking. Au lieu de dédier une quantité fixe de RAM à chaque serveur, souvent sous-utilisée, le CXL permet de créer un pool de mémoire partagée.

Trois versions de CXL existent actuellement :

CXL 1.0 (2019) permet d'ajouter de la mémoire à un serveur via un slot PCIe.
CXL 2.0 introduit la commutation et le "memory pooling", permettant à plusieurs serveurs d'accéder à un même réservoir de mémoire, bien que chaque zone reste attribuée à un hôte à la fois.
CXL 3.0 va plus loin en permettant un véritable partage de mémoire entre machines avec cohérence de cache.

Les processeurs AMD Epyc et Intel Xeon actuels supportent déjà CXL 2.0, et Amazon a annoncé que ses Graviton5 sont compatibles avec la version 3.0.

Un consortium puissant derrière le CXL

CXL a été initialement développé par Intel en 2019 et est désormais géré par un consortium ouvert comprenant des géants comme Alibaba, Cisco, Dell, Google, HPE, Huawei, Meta et Microsoft. AMD, NVIDIA et Samsung ont rejoint le conseil d'administration en 2022. Avec plus de 250 membres, le consortium a publié la version 4.0 en novembre 2025, montrant un soutien massif de l'industrie.

Des entreprises comme Astera Labs, Marvell et Enfabrica travaillent déjà sur des "memory godboxes", des baies dédiées à la mémoire pouvant contenir jusqu'à 18 To de DDR5 par châssis. Enfabrica promet de réduire de moitié le coût de calcul en les connectant aux racks NVIDIA GB200. NVIDIA a d'ailleurs acquis Enfabrica en septembre dernier, voyant le potentiel de cette technologie.

Samsung et Micron proposent également des modules CXL de 128 à 256 Go. L'usage le plus immédiat de ces modules concerne l'offload des KV caches, qui sont les caches d'attention des modèles de langage. Ces caches peuvent parfois occuper plus de mémoire que le modèle lui-même. Google a déjà tenté d'optimiser ces KV caches avec un algorithme maison il y a quelques semaines.

Impact sur le marché grand public

Bien que CXL soit principalement destiné aux datacenters, ses effets se feront sentir sur le marché grand public. Actuellement, la mémoire représente environ 35 % du coût de fabrication d'un PC, contre 15 à 18 % l'année précédente. Les prix des smartphones ont également augmenté de 40 à 50 % selon les marchés. Apple, par exemple, a accepté une hausse de 230 % pour la LPDDR5X de ses iPhone 17 sans négocier, illustrant le changement de rapport de force.

Si CXL permet aux datacenters de mutualiser leur RAM, cela pourrait alléger la pression sur le marché de la mémoire grand public. Cependant, il faudra attendre plusieurs trimestres avant de constater un impact significatif. En attendant, les prix de la DRAM devraient encore augmenter de 93 à 98 % au deuxième trimestre 2026, avec une normalisation espérée au plus tôt en 2027. Ainsi, les consommateurs doivent s'attendre à payer plus cher pour leur prochain kit DDR5.

CXL 2.0 : la RAM mutualisée pour contrer la pénurie

Tu suis la course aux modèles IA ?

Une flambée des prix de la mémoire vive

CXL : une technologie prometteuse pour les datacenters

Un consortium puissant derrière le CXL

Impact sur le marché grand public

Pénurie de DRAM : l'IA dévore mémoire et énergie

XCENA lève 135 millions pour révolutionner la mémoire IA

Micron : voitures autonomes et robots, gouffres de DRAM

Perplexity révolutionne l'IA avec un modèle hybride sur PC

Mémoire IA : Quand l'archive devient un obstacle à l'intelligence

Anthropic et Micron : partenariat stratégique pour l'avenir de l'IA