Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
OpenAI et Broadcom lancent Jalapeño, une puce d'inférence révolutionnaire
OpenAI et Broadcom ont récemment présenté une innovation majeure dans le domaine de l'intelligence artificielle avec le lancement de Jalapeño. Ce nouvel accélérateur, désigné comme le premier Intelligence Processor d'OpenAI, est spécialement conçu pour optimiser l'inférence des modèles de langage de grande taille (LLM). Cette initiative s'inscrit dans une collaboration stratégique entre OpenAI et Broadcom pour développer une plateforme de calcul multi-générationnelle, visant à rendre l'intelligence artificielle plus rapide, fiable et accessible à un public plus large.
Lors de la présentation officielle, le PDG d'OpenAI, Sam Altman, et le président Greg Brockman ont reçu Jalapeño des mains de Hock Tan, président et PDG de Broadcom, et de Charlie Kawwas, président de la société. Cet événement marque une étape cruciale dans la stratégie d'OpenAI pour construire l'ensemble de l'infrastructure nécessaire à ses modèles et produits.
Une conception sur mesure pour les besoins des LLM
La conception de Jalapeño a été entièrement réalisée par OpenAI, en s'appuyant sur une compréhension approfondie des besoins des LLM. Cette conception a été guidée par la feuille de route d'OpenAI en matière de modèles, de kernels, de systèmes de service, et de besoins produits. En collaboration avec Broadcom et Celestica, OpenAI a travaillé à l'industrialisation de cette plateforme, intégrant des puces, des systèmes de cartes et de racks, ainsi qu'un réseau haute performance et des systèmes de production évolutifs. Jalapeño est conçu pour être suffisamment flexible pour fonctionner avec tous les LLM, en s'appuyant sur les insights d'OpenAI concernant les besoins actuels et futurs en matière d'inférence dans l'industrie de l'IA.
Des échantillons d'ingénierie de Jalapeño sont actuellement en test dans les laboratoires, exécutant des charges de travail de machine learning à des fréquences et puissances ciblées pour la production, y compris le modèle GPT-5.3-Codex-Spark. Bien que les performances finales soient encore en cours d'évaluation, les premiers résultats indiquent que Jalapeño pourrait offrir un rendement par watt significativement supérieur aux technologies actuelles. Un rapport technique détaillé sur ces performances est prévu dans les mois à venir. L'architecture de la puce est conçue pour minimiser le mouvement des données et équilibrer les ressources de calcul, de mémoire et de réseau, afin d'atteindre une utilisation réelle proche de la performance théorique maximale. L'implémentation en silicium de Broadcom, ainsi que ses technologies de réseau, notamment le silicium de réseau Tomahawk, jouent un rôle clé dans la mise à l'échelle de la plateforme.
Une plateforme d'inférence taillée pour l'avenir
Jalapeño se distingue par sa conception innovante, spécifiquement dédiée à l'inférence des LLM modernes. Contrairement aux accélérateurs à usage général, Jalapeño est conçu pour répondre aux exigences spécifiques des systèmes utilisés quotidiennement par OpenAI, tels que ChatGPT, Codex, l'API, et les futurs produits agentiques. L'objectif est d'allier la puissance et le débit des accélérateurs d'IA actuels à une latence comparable à celle des systèmes d'inférence spécialisés les plus rapides, rendant Jalapeño particulièrement adapté aux produits LLM interactifs à grande échelle.
En développant Jalapeño, OpenAI ne se contente pas de créer des modèles de pointe ou des produits basés sur ces modèles ; elle conçoit également l'infrastructure qui les supporte. Cela inclut l'architecture de la puce, les kernels, les systèmes de mémoire, le réseau, la planification, les systèmes de déploiement et l'expérience utilisateur. En optimisant chaque couche de cette infrastructure, OpenAI vise à rendre ses modèles plus rapides, plus fiables et plus abordables pour les utilisateurs.
Un développement accéléré en neuf mois
Le développement de Jalapeño a été réalisé en un temps record, seulement neuf mois depuis la conception initiale jusqu'à la fabrication. Ce programme d'accélérateur d'IA sur mesure représente ce qui est considéré comme le cycle de développement ASIC le plus rapide jamais atteint dans le domaine des semi-conducteurs avancés haute performance. Cette rapidité est le fruit d'une collaboration étroite entre les équipes d'ingénierie d'OpenAI et l'expertise en implémentation de Broadcom, ainsi que de l'utilisation de modèles d'OpenAI pour accélérer certaines parties du processus de conception et d'optimisation.
Les mêmes modèles utilisés par les utilisateurs d'OpenAI contribuent à améliorer l'infrastructure nécessaire pour exécuter les modèles futurs. Si l'intelligence artificielle peut aider les ingénieurs à concevoir de meilleures puces plus rapidement, cela pourrait réduire le coût du calcul dans toute l'industrie et favoriser l'accès démocratique à l'IA avancée.
Vers une plateforme multi-générationnelle
Jalapeño représente la première étape d'une plateforme de calcul multi-générationnelle, conçue pour un déploiement initial d'ici la fin de 2026 et destinée à s'étendre dans les années à venir. Cette plateforme combine des accélérateurs conçus par OpenAI avec l'implémentation en silicium de Broadcom, les technologies de réseau et de connectivité, et l'expertise de Celestica en matière de cartes, de racks et de systèmes.
Rendre l'IA avancée accessible à tous
L'objectif ultime de ce projet est de rendre l'inférence, là où l'IA interagit avec les utilisateurs, plus efficace. Chaque amélioration en termes de coût, de vitesse et de fiabilité peut se traduire par une réponse plus rapide de ChatGPT, une exécution de tâches Codex plus fluide, un produit API moins coûteux à développer, ou un accès plus fiable même en période de forte demande.
Démocratiser l'IA signifie rendre les modèles avancés disponibles, fiables et suffisamment abordables pour que davantage de personnes puissent en bénéficier quotidiennement. Jalapeño aide OpenAI à transformer une plus grande partie de son infrastructure en intelligence utile pour les étudiants, les développeurs, les petites entreprises, les chercheurs, les entreprises, et toute personne cherchant à apprendre, créer ou résoudre des problèmes complexes.

