OpenAI et Broadcom dévoilent Jalapeño, leur premier processeur d'inférence d'IA

L'annonce met en évidence l'expansion d'OpenAI du développement de produits et de modèles d'IA à la conception de matériel spécialisé, renforçant ainsi son engagement à contrôler l'ensemble de la pile technologique qui alimente les systèmes d'IA modernes.

OpenAI et Broadcom ont présenté conjointement Jalapeño, le premier processeur intelligent d'OpenAI, ce qui représente une étape importante dans la stratégie d'infrastructure à long terme de l'entreprise. L'accélérateur a été spécialement conçu pour l'inférence de grands modèles de langage (LLM) et constitue le premier composant d'une plate-forme de calcul multigénération prévue destinée à rendre l'intelligence artificielle avancée plus rapide, plus fiable et plus accessible. L'annonce met en évidence l'expansion d'OpenAI du développement de produits et de modèles d'IA à la conception de matériel spécialisé, renforçant ainsi son engagement à contrôler l'ensemble de la pile technologique qui alimente les systèmes d'IA modernes.

Jalapeño a été développé grâce à une collaboration entre OpenAI, Broadcom et Celestica. OpenAI a contribué à la conception architecturale en s'appuyant sur sa compréhension approfondie des charges de travail LLM et des exigences futures des modèles, tandis que Broadcom a apporté son expertise en matière de mise en œuvre du silicium, de technologies de mise en réseau et de mise à l'échelle de la production. Celestica a pris en charge l'intégration de cartes, de racks et de systèmes. Le processeur a été conçu non seulement pour les propres modèles d'OpenAI, mais également pour les LLM actuels et futurs du secteur plus large de l'IA. Les échantillons d'ingénierie exécutent déjà des charges de travail d'apprentissage automatique à des fréquences et des niveaux de puissance cibles, y compris des charges de travail associées à GPT-5.3-Codex-Spark.

Les premiers résultats des tests indiquent que Jalapeño offre des performances par watt nettement supérieures à celles des accélérateurs d’IA de pointe actuels. Bien que les évaluations finales des performances soient encore en cours, OpenAI s'attend à ce que l'architecture atteigne une plus grande efficacité en réduisant les mouvements de données inutiles et en équilibrant les ressources de calcul, de mémoire et de réseau. Cette conception permet au matériel de fonctionner beaucoup plus près de ses performances théoriques maximales. Les technologies de réseau avancées de Broadcom, y compris son silicium de réseau Tomahawk, prennent en charge un déploiement à grande échelle et un fonctionnement hautes performances.

Selon Greg Brockman, président et cofondateur d'OpenAI, le monde devient de plus en plus une économie basée sur le calcul, ce qui rend une infrastructure efficace essentielle pour les futurs systèmes d'IA. Il a souligné que Jalapeño fait partie de la stratégie à long terme d'OpenAI visant à accroître la disponibilité des ressources informatiques, ce qui aboutira à des systèmes d'IA plus rapides, plus abordables et capables de relever des défis de plus en plus importants. En concevant davantage de composants de la pile technologique en interne, OpenAI vise à améliorer l’efficacité et à élargir l’accès à l’intelligence artificielle avancée.

Richard Ho, qui dirige le programme matériel d'OpenAI, a déclaré que le processeur était spécifiquement optimisé pour les noyaux, les modèles de mouvement de la mémoire, les exigences de mise en réseau et les demandes de service associées aux modèles d'IA de pointe. Il a noté que les premiers tests suggèrent que Jalapeño peut exécuter des charges de travail clés tout en fonctionnant à proximité des limites de performances théoriques du matériel. Le président-directeur général de Broadcom, Hock Tan, a décrit cette collaboration comme un engagement à long terme visant à construire l'infrastructure physique requise pour la prochaine décennie de développement de l'IA. Il a souligné que Jalapeño ne représente que la première étape d'une feuille de route multigénération destinée à prendre en charge des centres de données à l'échelle du gigawatt à partir de 2026.

Contrairement aux accélérateurs à usage général adaptés de charges de travail informatiques antérieures, Jalapeño a été conçu spécifiquement pour l'inférence LLM moderne. L'architecture est informée par les exigences opérationnelles de services tels que ChatGPT, Codex, l'API OpenAI et les futurs agents d'IA. L’objectif est de combiner le débit et les capacités de calcul des principaux accélérateurs d’IA avec la faible latence nécessaire aux applications d’IA interactives. Cette spécialisation rend Jalapeño particulièrement adapté aux services d'IA à grande échelle qui nécessitent à la fois des performances élevées et des temps de réponse rapides.

Le développement de Jalapeño démontre l’approche full-stack d’OpenAI en matière d’intelligence artificielle. La société crée non seulement des modèles avancés et des produits destinés aux utilisateurs, mais conçoit également l'infrastructure sous-jacente, notamment les architectures de puces, les systèmes de mémoire, les technologies de réseau, les plates-formes de déploiement et les systèmes de desserte. En optimisant simultanément toutes les couches de la pile technologique, OpenAI vise à améliorer la vitesse, la fiabilité et l’abordabilité de ses services d’IA.

Jalapeño renforce également l'infrastructure et le cycle d'innovation d'OpenAI. L’amélioration de l’efficacité informatique permet une formation et une inférence plus efficaces, ce qui soutient à son tour le développement de modèles d’IA plus performants. De meilleurs modèles conduisent à des produits plus solides, à une adoption accrue par les utilisateurs et à des revenus plus élevés, permettant ainsi des investissements supplémentaires dans les infrastructures futures. Ce cycle vise à rendre l’intelligence artificielle de plus en plus performante, fiable et abordable au fil du temps.

L’une des réalisations les plus remarquables associées au projet est le calendrier de développement rapide. Jalapeño est passé de la conception initiale à la fabrication en seulement neuf mois, ce qui, selon OpenAI et Broadcom, représente l'un des cycles de développement de circuits intégrés spécifiques à une application (ASIC) les plus rapides dans la fabrication avancée de semi-conducteurs. Ce calendrier accéléré a été rendu possible grâce à une étroite collaboration logiciel-matériel et à l'utilisation des propres modèles d'IA d'OpenAI pour aider aux processus de conception et d'optimisation. La société affirme que la conception de puces assistée par l’IA pourrait réduire les coûts informatiques et élargir l’accès aux technologies avancées dans l’ensemble du secteur.

Jalapeño sert de base à une plate-forme de calcul multigénération plus large qui combinera les accélérateurs conçus par OpenAI avec les technologies de réseau et de silicium de Broadcom et l'expertise en systèmes de Celestica. Les premiers déploiements sont prévus d’ici fin 2026, avec une nouvelle expansion attendue dans les années suivantes. Ces déploiements visent à prendre en charge les opérations des centres de données à grande échelle et à fournir la capacité de calcul nécessaire aux futurs systèmes d'IA.

En fin de compte, l’objectif de Jalapeño est d’améliorer l’inférence de l’IA, qui est l’étape à laquelle l’intelligence artificielle sert directement les utilisateurs. Les améliorations en termes de vitesse, de fiabilité et de rentabilité peuvent se traduire par des réponses ChatGPT plus rapides, des assistants de codage plus performants, des services API moins coûteux et un accès plus fiable pendant les périodes de forte demande. En réduisant les coûts d'infrastructure et en augmentant l'efficacité informatique, OpenAI vise à rendre les technologies avancées d'IA plus accessibles aux étudiants, développeurs, chercheurs, entreprises et organisations du monde entier.