Le premier CPU d'Arm sera intégré dans les datacenters AI de Meta plus tard cette année
Le premier CPU d'Arm, le Arm AGI CPU, sera intégré dans les datacenters AI de Meta plus tard cette année. Ce processeur peut comporter jusqu'à 136 cœurs par unité et revendique une performance par watt double par rapport aux puces x86.
Après des décennies à ne proposer que des conceptions de puces sous licence, Arm, basé au Royaume-Uni, a révélé qu'il produisait sa première puce en interne, ainsi que son premier client. Le Arm AGI CPU est conçu pour l'inférence, permettant le traitement dans le cloud pour des outils d'IA tels que des agents AI capables de générer de multiples tâches simultanément. Meta est la première entreprise à l'utiliser, ayant apparemment rencontré des difficultés pour lancer ses propres puces AI.
Meta se décrit comme le partenaire principal et co-développeur, prévoyant de travailler sur "plusieurs générations" de CPUs pour datacenters, en collaboration avec du matériel d'autres fournisseurs comme Nvidia et AMD. Des clients d'Arm tels qu'Amazon AWS, Microsoft, Google, Marvell, Nvidia, Samsung et d'autres ont félicité l'annonce. Cependant, Qualcomm, qui a récemment déclaré avoir remporté une "victoire complète" contre Arm dans une affaire judiciaire concernant les termes des accords de licence, n'a pas participé à ces félicitations.
Les détails financiers de l'accord n'ont pas été révélés, ni le nombre de puces qu'Meta prévoit d'utiliser auprès d'Arm, qui est actuellement détenu par Softbank.
Selon Arm, sa nouvelle puce fonctionne sur la plateforme Neoverse utilisée par AWS Graviton, Nvidia Vera, Microsoft et d'autres puces AI, avec jusqu'à 136 cœurs par CPU et 64 CPUs par rack de serveur refroidi par air. Arm affirme que le AGI CPU peut offrir deux fois plus de performance par watt que les CPUs x86 traditionnels tout en réduisant les goulets d'étranglement de mémoire, tirant parti des avantages d'efficacité de conception à long terme.
D'autres clients intéressés par la puce d'Arm incluent Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP et SK Telecom. Mohamed Awad, responsable de l'IA cloud chez Arm, a déclaré à CNBC que l'objectif est de devenir une option pour les entreprises qui ne peuvent pas se permettre de développer leur propre processeur en interne.
📧
Cet article vous a plu ?
Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.
