Brief IA : OpenAI et Broadcom lancent Jalapeño, puce IA révolutionnaire
🤖 Modèles & LLM

OpenAI et Broadcom lancent Jalapeño, puce IA révolutionnaire

Brief IA
Tom Levy·5 min·2 vues

OpenAI et Broadcom ont lancé Jalapeño, une puce optimisée pour les modèles de langage de grande taille, marquant une avancée majeure dans l'inférence IA. Cette puce promet une efficacité énergétique supérieure, avec des tests préliminaires indiquant un rendement par watt amélioré par rapport aux normes actuelles. Jalapeño pourrait transformer l'accessibilité et la performance des IA avancées, rendant ces technologies plus abordables et disponibles à grande échelle.

En bref
1OpenAI et Broadcom lancent Jalapeño, une puce optimisée pour les modèles de langage de grande taille, marquant une avancée majeure dans l'inférence IA.
2Jalapeño promet une efficacité énergétique supérieure, avec des tests préliminaires indiquant un rendement par watt amélioré par rapport aux normes actuelles.
3Le développement rapide de Jalapeño en neuf mois souligne une collaboration étroite et innovante entre OpenAI et Broadcom.
💡Pourquoi c'est importantJalapeño pourrait transformer l'accessibilité et la performance des IA avancées, rendant ces technologies plus abordables et disponibles à grande échelle.
Le brief IA que lisent les pros

Tu suis la course aux modèles IA ?

Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

OpenAI et Broadcom lancent Jalapeño, une puce d'inférence révolutionnaire

OpenAI et Broadcom ont récemment présenté une innovation majeure dans le domaine de l'intelligence artificielle avec le lancement de Jalapeño. Ce nouvel accélérateur, désigné comme le premier Intelligence Processor d'OpenAI, est spécialement conçu pour optimiser l'inférence des modèles de langage de grande taille (LLM). Cette initiative s'inscrit dans une collaboration stratégique entre OpenAI et Broadcom pour développer une plateforme de calcul multi-générationnelle, visant à rendre l'intelligence artificielle plus rapide, fiable et accessible à un public plus large.

Lors de la présentation officielle, le PDG d'OpenAI, Sam Altman, et le président Greg Brockman ont reçu Jalapeño des mains de Hock Tan, président et PDG de Broadcom, et de Charlie Kawwas, président de la société. Cet événement marque une étape cruciale dans la stratégie d'OpenAI pour construire l'ensemble de l'infrastructure nécessaire à ses modèles et produits.

Une conception sur mesure pour les besoins des LLM

La conception de Jalapeño a été entièrement réalisée par OpenAI, en s'appuyant sur une compréhension approfondie des besoins des LLM. Cette conception a été guidée par la feuille de route d'OpenAI en matière de modèles, de kernels, de systèmes de service, et de besoins produits. En collaboration avec Broadcom et Celestica, OpenAI a travaillé à l'industrialisation de cette plateforme, intégrant des puces, des systèmes de cartes et de racks, ainsi qu'un réseau haute performance et des systèmes de production évolutifs. Jalapeño est conçu pour être suffisamment flexible pour fonctionner avec tous les LLM, en s'appuyant sur les insights d'OpenAI concernant les besoins actuels et futurs en matière d'inférence dans l'industrie de l'IA.

Des échantillons d'ingénierie de Jalapeño sont actuellement en test dans les laboratoires, exécutant des charges de travail de machine learning à des fréquences et puissances ciblées pour la production, y compris le modèle GPT-5.3-Codex-Spark. Bien que les performances finales soient encore en cours d'évaluation, les premiers résultats indiquent que Jalapeño pourrait offrir un rendement par watt significativement supérieur aux technologies actuelles. Un rapport technique détaillé sur ces performances est prévu dans les mois à venir. L'architecture de la puce est conçue pour minimiser le mouvement des données et équilibrer les ressources de calcul, de mémoire et de réseau, afin d'atteindre une utilisation réelle proche de la performance théorique maximale. L'implémentation en silicium de Broadcom, ainsi que ses technologies de réseau, notamment le silicium de réseau Tomahawk, jouent un rôle clé dans la mise à l'échelle de la plateforme.

Une plateforme d'inférence taillée pour l'avenir

Jalapeño se distingue par sa conception innovante, spécifiquement dédiée à l'inférence des LLM modernes. Contrairement aux accélérateurs à usage général, Jalapeño est conçu pour répondre aux exigences spécifiques des systèmes utilisés quotidiennement par OpenAI, tels que ChatGPT, Codex, l'API, et les futurs produits agentiques. L'objectif est d'allier la puissance et le débit des accélérateurs d'IA actuels à une latence comparable à celle des systèmes d'inférence spécialisés les plus rapides, rendant Jalapeño particulièrement adapté aux produits LLM interactifs à grande échelle.

En développant Jalapeño, OpenAI ne se contente pas de créer des modèles de pointe ou des produits basés sur ces modèles ; elle conçoit également l'infrastructure qui les supporte. Cela inclut l'architecture de la puce, les kernels, les systèmes de mémoire, le réseau, la planification, les systèmes de déploiement et l'expérience utilisateur. En optimisant chaque couche de cette infrastructure, OpenAI vise à rendre ses modèles plus rapides, plus fiables et plus abordables pour les utilisateurs.

Un développement accéléré en neuf mois

Le développement de Jalapeño a été réalisé en un temps record, seulement neuf mois depuis la conception initiale jusqu'à la fabrication. Ce programme d'accélérateur d'IA sur mesure représente ce qui est considéré comme le cycle de développement ASIC le plus rapide jamais atteint dans le domaine des semi-conducteurs avancés haute performance. Cette rapidité est le fruit d'une collaboration étroite entre les équipes d'ingénierie d'OpenAI et l'expertise en implémentation de Broadcom, ainsi que de l'utilisation de modèles d'OpenAI pour accélérer certaines parties du processus de conception et d'optimisation.

Les mêmes modèles utilisés par les utilisateurs d'OpenAI contribuent à améliorer l'infrastructure nécessaire pour exécuter les modèles futurs. Si l'intelligence artificielle peut aider les ingénieurs à concevoir de meilleures puces plus rapidement, cela pourrait réduire le coût du calcul dans toute l'industrie et favoriser l'accès démocratique à l'IA avancée.

Vers une plateforme multi-générationnelle

Jalapeño représente la première étape d'une plateforme de calcul multi-générationnelle, conçue pour un déploiement initial d'ici la fin de 2026 et destinée à s'étendre dans les années à venir. Cette plateforme combine des accélérateurs conçus par OpenAI avec l'implémentation en silicium de Broadcom, les technologies de réseau et de connectivité, et l'expertise de Celestica en matière de cartes, de racks et de systèmes.

Rendre l'IA avancée accessible à tous

L'objectif ultime de ce projet est de rendre l'inférence, là où l'IA interagit avec les utilisateurs, plus efficace. Chaque amélioration en termes de coût, de vitesse et de fiabilité peut se traduire par une réponse plus rapide de ChatGPT, une exécution de tâches Codex plus fluide, un produit API moins coûteux à développer, ou un accès plus fiable même en période de forte demande.

Démocratiser l'IA signifie rendre les modèles avancés disponibles, fiables et suffisamment abordables pour que davantage de personnes puissent en bénéficier quotidiennement. Jalapeño aide OpenAI à transformer une plus grande partie de son infrastructure en intelligence utile pour les étudiants, les développeurs, les petites entreprises, les chercheurs, les entreprises, et toute personne cherchant à apprendre, créer ou résoudre des problèmes complexes.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires