OpenAI dévoile Jalapeño, sa première puce IA conçue avec Broadcom

Un processeur conçu pour l'inférence, pas pour l'entraînement

OpenAI entre officiellement dans la course au silicium. Jalapeño est un ASIC (Application-Specific Integrated Circuit) dédié exclusivement à l'inférence des grands modèles de langage, c'est-à-dire l'exécution des modèles déjà entraînés pour générer des réponses, comme le rapporte TechCrunch. Il ne remplace pas les GPU Nvidia pour l'entraînement des modèles, qui restera probablement sur du hardware généraliste.

Le choix est stratégique : l'inférence représente la majorité des coûts opérationnels d'un service comme ChatGPT, avec des milliards de requêtes traitées chaque jour. Même une réduction marginale du coût par token peut se traduire par des économies massives à l'échelle d'OpenAI.

Pourquoi « Jalapeño » ? OpenAI assume un nom qui tranche avec les conventions de l'industrie. Un clin d'œil assumé à la culture de l'entreprise : donner du piquant à l'infrastructure IA.

Neuf mois du design au tape-out : une vitesse record

La collaboration avec Broadcom avait été annoncée en octobre 2025. Huit mois plus tard, le chip est déjà en phase de test. Le développement complet, du design initial au tape-out (finalisation du design pour la fabrication), a été bouclé en neuf mois, comme le détaille Engadget.

Selon OpenAI, cette rapidité est le fruit d'une co-conception logiciel-hardware poussée : les équipes d'ingénierie d'OpenAI ont travaillé main dans la main avec l'expertise de fabrication de Broadcom, et les propres modèles d'IA d'OpenAI ont été utilisés pour accélérer certaines phases de design et d'optimisation.

Des performances qui restent à prouver

OpenAI affirme que les premiers tests montrent des « performances par watt substantiellement meilleures que l'état de l'art actuel », comme le rapporte Ars Technica. Aucun benchmark public n'a encore été publié : un rapport technique complet est promis « dans les mois à venir ».

Jalapeño serait déjà testé en interne, notamment avec GPT-5.3-Codex-Spark, le modèle de codage agentique d'OpenAI. Les charges de travail ciblées incluent prioritairement les modèles de code temps réel, où la latence et le coût d'inférence sont critiques, selon Decrypt.

Un déploiement prévu avant la fin 2026

Le calendrier est ambitieux : les premiers déploiements en data center sont programmés pour fin 2026. Greg Brockman, président d'OpenAI, a présenté Jalapeño comme un élément d'une stratégie d'infrastructure « full-stack » à long terme :

« En concevant davantage de couches de la pile nous-mêmes, nous pouvons servir plus d'intelligence avec une plus grande efficacité et continuer à pousser l'IA avancée vers un accès plus large », a déclaré Brockman, cité par Decrypt.

Hock Tan, CEO de Broadcom, a ajouté que la collaboration « représente un engagement fondamental à dimensionner l'infrastructure physique requise pour la prochaine décennie d'IA », évoquant des data centers à l'échelle du gigawatt avec Microsoft et d'autres partenaires dès 2026.

Ce que ça change pour l'écosystème IA

Avec Jalapeño, OpenAI rejoint le club très fermé des entreprises qui contrôlent leur propre silicium IA. Google (TPU), Amazon (Trainium, Inferentia) et Microsoft (Maia) avaient déjà ouvert la voie. Mais l'arrivée d'OpenAI change la donne pour plusieurs raisons :

Réduction de la dépendance à Nvidia : l'inférence représente le plus gros volume de calcul pour OpenAI. Disposer d'un chip optimisé en interne réduit le pouvoir de négociation de Nvidia sur les prix.
Optimisation verticale : en contrôlant le modèle, le logiciel d'inférence, le scheduling et désormais le silicium, OpenAI peut optimiser chaque couche pour ses charges de travail spécifiques.
Première génération d'une plateforme : Jalapeño est présenté comme le premier jalon d'une « plateforme de calcul multi-générationnelle ». Les futures itérations pourraient couvrir des charges plus larges, entraînement inclus.

À retenir

OpenAI a dévoilé Jalapeño le 24 juin 2026, son premier processeur d'inférence IA développé avec Broadcom.
Le chip est exclusivement dédié à l'inférence des LLM, pas à l'entraînement. Il cible prioritairement les modèles de code temps réel.
Développé en neuf mois, Jalapeño promet des performances par watt supérieures à l'état de l'art, mais aucun benchmark public n'est encore disponible.
Le déploiement en data center est prévu pour la fin 2026. C'est la première génération d'une plateforme à long terme.
Cette annonce marque un tournant stratégique : OpenAI rejoint Google, Amazon et Microsoft dans la course au silicium IA custom, réduisant sa dépendance à Nvidia.

Sources

TechCrunch · OpenAI unveils its first custom chip, built by Broadcom, 24 juin 2026
Ars Technica · OpenAI and Broadcom announce chip designed for LLM inference at scale, 24 juin 2026
Engadget · Jalapeño is the first AI chip from OpenAI and Broadcom, 24 juin 2026
Decrypt · OpenAI Turns Up the Heat With Jalapeño, Its First Custom AI Chip, 24 juin 2026

← Retour aux news Publié le 25 juin 2026 · Sources : TechCrunch, Ars Technica, Engadget, Decrypt