Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Google Cloud dévoile ses nouvelles puces IA TPU 8
Google Cloud a récemment annoncé le lancement de sa huitième génération de puces d'intelligence artificielle, appelées unités de traitement tensoriel (TPUs). Ces nouvelles puces, dévoilées mercredi, se déclinent en deux versions distinctes : la TPU 8t, dédiée à l'entraînement des modèles, et la TPU 8i, conçue pour l'inférence. L'inférence, dans ce contexte, fait référence à l'utilisation continue des modèles après que les utilisateurs ont soumis leurs requêtes.
Les nouvelles TPUs de Google affichent des spécifications de performance impressionnantes. Elles offrent jusqu'à trois fois plus de rapidité pour l'entraînement des modèles d'IA et une amélioration de 80 % de la performance par dollar par rapport aux générations précédentes. De plus, ces puces permettent de faire fonctionner plus d'un million de TPUs ensemble dans un seul cluster, promettant ainsi une puissance de calcul accrue pour un coût énergétique et financier réduit.
Google appelle ces puces TPUs, et non GPUs, car elles ont été initialement nommées Tensor en raison de leur faible consommation d'énergie.
Une stratégie complémentaire à Nvidia
Bien que ces avancées technologiques soient significatives, elles ne constituent pas une attaque directe contre Nvidia, du moins pour le moment. Google, à l'instar d'autres grands fournisseurs de cloud comme Microsoft et Amazon, utilise ces nouvelles puces pour compléter les systèmes basés sur Nvidia déjà présents dans son infrastructure. Google prévoit d'ailleurs d'intégrer la dernière puce de Nvidia, Vera Rubin, dans son cloud plus tard cette année.
La collaboration entre Google et Nvidia ne s'arrête pas là. Les deux entreprises travaillent ensemble pour améliorer l'efficacité des systèmes basés sur Nvidia dans le cloud de Google. Cela inclut le renforcement de la technologie de mise en réseau basée sur le logiciel Falcon, développée par Google et open-sourcée en 2023 sous l'égide de l'organisation de matériel de centre de données open source, le Open Compute Project.
Un avenir incertain pour Nvidia ?
Bien que les hyperscalers comme Google, Amazon et Microsoft développent leurs propres puces IA, Nvidia reste un acteur majeur du marché. La capitalisation boursière de Nvidia atteint près de 5 trillions de dollars, une preuve de sa position dominante. Selon l'analyste Patrick Moore, bien que la montée en puissance des TPUs de Google puisse sembler menaçante, Nvidia continue de prospérer.
En fin de compte, la croissance de Google en tant que fournisseur de cloud IA pourrait même bénéficier à Nvidia, en augmentant la demande pour ses puces, malgré l'utilisation croissante des TPUs de Google.