Brief IA : OpenAI et Broadcom révolutionnent l'IA avec la puce Jalapeño pour LLM

OpenAI et Broadcom révolutionnent l'IA avec la puce Jalapeño pour LLM

Brief IA
Tom Levy·3 min·1 vues

OpenAI et Broadcom lancent Jalapeño, une puce IA dédiée à l'inférence des grands modèles de langage. Développée en neuf mois, Jalapeño promet une efficacité énergétique supérieure aux accélérateurs actuels. La puce vise à réduire les coûts d'inférence et à améliorer la performance des services IA d'OpenAI.

En bref
1OpenAI et Broadcom lancent Jalapeño, une puce IA dédiée à l'inférence des grands modèles de langage.
2Développée en neuf mois, Jalapeño promet une efficacité énergétique supérieure aux accélérateurs actuels.
3La puce vise à réduire les coûts d'inférence et à améliorer la performance des services IA d'OpenAI.
💡Pourquoi c'est importantJalapeño pourrait transformer l'efficacité et la rentabilité des services d'IA, impactant positivement les entreprises utilisatrices.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

OpenAI et Broadcom dévoilent Jalapeño, une avancée majeure pour l'IA

Dans une collaboration stratégique avec Broadcom, OpenAI a présenté Jalapeño, une puce d'intelligence artificielle spécialement conçue pour l'inférence des grands modèles de langage (LLM). Ce processeur, développé en un temps record de neuf mois, promet de surpasser les accélérateurs actuels en termes d'efficacité énergétique.

OpenAI, déjà reconnu pour ses modèles d'IA de pointe, élargit désormais son champ d'action en s'intéressant au matériel qui les soutient. Jalapeño a été conçu pour répondre aux exigences spécifiques de l'inférence des LLM, avec pour objectif d'améliorer les performances, la latence et l'efficacité énergétique des services utilisant des modèles tels que ChatGPT, Codex et les futurs agents d'OpenAI.

Une architecture optimisée pour une efficacité maximale

La conception de Jalapeño repose sur une compréhension approfondie des contraintes des modèles de langage. OpenAI a optimisé l'architecture de la puce pour améliorer les échanges entre les unités de calcul, la mémoire et le réseau, minimisant ainsi les transferts de données qui sont souvent responsables d'une consommation énergétique élevée dans les infrastructures d'IA. Les premiers prototypes de cette puce sont déjà capables de gérer des charges de travail similaires à celles rencontrées en production, notamment avec le modèle GPT-5.3-Codex-Spark.

Broadcom apporte son expertise en matière de mise en œuvre sur silicium et ses technologies réseau, telles que Tomahawk. Celestica est impliqué dans la fabrication des cartes électroniques, des racks et l'intégration des systèmes. Cette répartition des rôles permet à OpenAI de garder la main sur la conception tout en s'appuyant sur des partenaires industriels pour une montée en puissance rapide.

Jalapeño : une stratégie pour maîtriser les coûts d'inférence

Avec Jalapeño, OpenAI cherche à contrôler l'ensemble de la chaîne technologique, des puces aux systèmes de déploiement, en passant par les logiciels d'exécution et les produits destinés aux utilisateurs. Cette stratégie vise à maîtriser les coûts d'inférence, qui représentent une part croissante des dépenses opérationnelles à mesure que l'utilisation de l'IA générative se développe dans les entreprises.

Une puce mieux adaptée permet de réduire la consommation électrique et d'augmenter le nombre de requêtes traitées par une même infrastructure. Selon OpenAI, les premiers tests indiquent des performances par watt supérieures aux accélérateurs de référence actuels, bien que les résultats détaillés soient attendus ultérieurement. Si ces promesses se concrétisent, Jalapeño pourrait améliorer la rentabilité des services d'IA et offrir une meilleure qualité de service aux entreprises utilisant les API d'OpenAI ou ChatGPT.

Les perspectives pour les entreprises avec Jalapeño

Jalapeño est également le fondement d'une plateforme de calcul appelée à évoluer sur plusieurs années. OpenAI et Broadcom prévoient un déploiement progressif dès la fin de 2026 auprès de partenaires exploitant des centres de données à l'échelle du gigawatt.

L'un des aspects les plus remarquables du projet est la rapidité de son développement. Le cycle complet de conception à fabrication de Jalapeño n'a pris que neuf mois. OpenAI a utilisé ses propres modèles d'IA pour accélérer certaines phases de conception et d'optimisation matérielle, illustrant un cercle vertueux où l'IA contribue à construire l'infrastructure nécessaire à son propre fonctionnement.

Pour le marché, cette annonce montre qu'OpenAI rejoint les rangs des entreprises investissant dans des accélérateurs propriétaires pour mieux contrôler leurs coûts, leurs performances et leur indépendance technologique. L'entreprise cherche à optimiser les charges d'inférence les plus critiques avec un matériel spécifiquement conçu pour ses besoins, tout en continuant à utiliser les GPU de fournisseurs comme Nvidia.

Cette stratégie pourrait avoir un impact bien au-delà de l'écosystème d'OpenAI. Des coûts de calcul plus faibles, une meilleure efficacité énergétique et des infrastructures plus performantes pourraient permettre des services d'IA plus rapides, plus fiables et plus abordables, tant pour les développeurs que pour les PME et les grandes entreprises. Cela renforcerait également la compétitivité d'OpenAI sur le marché.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires