Nvidia Vera : le CPU IA qui équipe déjà Anthropic et OpenAI

Vera : le CPU qui ne doit rien à personne

Jensen Huang a profité du Computex 2026 à Taipei pour dévoiler Vera, le nouveau processeur CPU de Nvidia conçu pour les charges de travail d'IA agentique. Contrairement au précédent Grace, qui utilisait des cœurs Arm Neoverse standard, Vera repose sur une architecture entièrement maison : les 88 cœurs "Olympus" conçus par Nvidia.

Le positionnement est clair : Vera n'est pas une itération de Grace, mais une refonte complète. La puce offre jusqu'à 1,2 To/s de bande passante mémoire, et Nvidia affirme qu'elle surpasse les processeurs Intel Xeon et AMD EPYC sur les benchmarks de charges agentiques — ces logiciels d'IA qui planifient et exécutent des tâches de manière autonome, plutôt que de simplement répondre à des requêtes.

Cœurs Olympus custom (architecture Nvidia, pas Arm Neoverse)

1,2 To/s

Bande passante mémoire pour les charges IA intensives

H2 2026

Disponibilité cloud élargie chez les principaux fournisseurs

Anthropic, OpenAI, SpaceX : les premiers clients prestigieux

Huang a égrené la liste des premiers utilisateurs de Vera comme on lit un Who's Who de l'IA : Anthropic, OpenAI, SpaceX et Oracle sont les premiers à déployer la puce. Selon The Next Web, les premières unités ont été livrées en mai 2025, avant même l'annonce publique — signe que Nvidia préparait ce lancement depuis longtemps.

Oracle Cloud Infrastructure est le premier hyperscaler à déployer Vera à l'échelle. Les autres grands clouds devraient suivre au second semestre 2026. Les prix et volumes d'engagement n'ont pas été divulgués, mais Huang a qualifié Vera de « plus grand lancement produit de l'histoire de l'île » de Taïwan, selon des sources du Financial Times et de Bloomberg.

« Jensen Huang a passé une partie de son keynote à lire une liste d'invités. Anthropic, OpenAI, SpaceX et Oracle sont parmi les premiers gros utilisateurs de Vera. » — The Next Web, couverture du Computex 2026

Une stratégie CPU+GPU intégrée

L'enjeu stratégique est considérable. Jusqu'à présent, les GPU Nvidia dominaient l'entraînement et l'inférence IA, mais le CPU était un composant que Nvidia devait acheter ailleurs (principalement chez Intel, AMD ou via Arm). Avec Vera, Nvidia peut désormais vendre un système CPU+GPU parfaitement intégré, sans dépendance externe.

Cette verticalisation s'inscrit dans la plateforme Vera Rubin, l'architecture de supercalcul IA complète que Nvidia pousse auprès des hyperscalers. En contrôlant à la fois le CPU et le GPU, Nvidia optimise l'ensemble de la pile — bande passante, latence, consommation énergétique — pour les charges de travail d'IA agentique qui explosent en 2026.

Un marché à conquérir

Reste une inconnue de taille : la capacité de production. Les volumes expédiés à des clients payants — pas seulement à des partenaires de lancement — seront le véritable test. La production de masse a été annoncée, mais The Next Web note que « les expéditions en volume à des clients payants sont la partie la plus difficile, et elle est encore devant nous ».

Nvidia devra aussi convaincre les hyperscalers de standardiser sur Vera plutôt que sur les architectures x86 éprouvées ou les puces Arm plus ouvertes. La bataille des CPU IA ne fait que commencer, mais avec des clients comme Anthropic et OpenAI déjà à bord, Nvidia part avec une longueur d'avance sur le papier.

Ce que ça change

Pour les entreprises qui déploient des agents IA à grande échelle, Vera promet des gains de performance significatifs sur les tâches agentiques par rapport aux CPU x86 traditionnels. Les développeurs travaillant sur des plateformes comme Claude d'Anthropic ou ChatGPT d'OpenAI pourraient voir leurs workloads exécutés plus efficacement — même si les détails précis de déploiement restent sous NDA.

Pour le marché des serveurs, l'arrivée d'un troisième acteur CPU crédible (après Intel et AMD) avec le soutien financier et technologique de Nvidia est une excellente nouvelle pour la compétition et l'innovation. À condition que Vera tienne ses promesses en conditions réelles.

Analyse rapide

Vera est plus qu'un nouveau CPU : c'est le maillon manquant de la stratégie d'intégration verticale de Nvidia. Après avoir dominé le GPU dans l'IA, Nvidia veut contrôler la totalité de la plateforme serveur. La liste de clients de lancement est impressionnante, mais le véritable enjeu est industriel : produire Vera en volume et à un coût compétitif face à Intel et AMD sur leur terrain.

Le timing est intéressant : Vera arrive au moment où les charges agentiques (agent AI workloads) explosent, exactement le type de charge de travail hybride CPU+GPU que Nvidia peut optimiser. Si la promesse de performance se confirme, Vera pourrait redessiner le marché des serveurs IA en 2027.

À retenir

Vera : nouveau CPU serveur Nvidia avec 88 cœurs Olympus custom, architecture entièrement maison (pas de Arm Neoverse). Jusqu'à 1,2 To/s de bande passante mémoire.
Premiers clients : Anthropic, OpenAI, SpaceX, Oracle — premières unités livrées dès mai 2025. Oracle est le premier hyperscaler à déployer à l'échelle.
Disponibilité cloud : second semestre 2026 chez les principaux fournisseurs. Prix non divulgués.
Positionnement : CPU conçu spécifiquement pour les charges agentiques (agents IA planifiant et exécutant des tâches). Surpasse Intel Xeon et AMD EPYC sur ces benchmarks selon Nvidia.
Stratégie : intégration verticale CPU+GPU pour vendre des systèmes complets sans dépendance externe. Plateforme Vera Rubin.
Inconnue : capacité à produire en volume à un coût compétitif face à Intel et AMD.

← Retour aux news Publié le 2 juin 2026 · Source : The Next Web