Veuillez vous assurer que Javascript est activé aux fins d'accessibilité au site web. En bref : Tokens=revenues – Les arguments de NVIDIA en faveur de rendements IA évolutifs - Janus Henderson Investors - France Professional Advisor
Pour les investisseurs professionnels en France

En bref : Tokens=revenues – Les arguments de NVIDIA en faveur des retours évolutifs de l'IA

Richard Clode, gérant, résume les principaux points de la NVIDIA GTC 2026. L'IA agentique, la monétisation par jetons pour générer des rendements durables en matière d'IA et la co-conception à grande échelle remodèlent à la fois la technologie et l'économie de l'infrastructure d'IA.

18 mars 2026
4 minutes de lecture

Principaux points à retenir :​

  • Point d'inflexion de l'IA agentique : OpenClaw étend considérablement l'intensité d'utilisation et la demande de calcul de l'IA agentique au-delà des simples interfaces conversationnelles.
  • Les jetons génèrent des revenus : NVIDIA affirme que la monétisation par jetons à plusieurs niveaux peut offrir des rendements attractifs et évolutifs sur les investissements en IA ; Vera Rubin pourrait augmenter considérablement le potentiel de revenus par gigawatt.
  • Un avantage concurrentiel grâce à une co-conception extrême : en intégrant étroitement les CPU, les GPU, les LPU, la mise en réseau et les logiciels, NVIDIA vise à défendre sa position concurrentielle alors que l’inférence IA évolue vers des charges de travail à faible latence et à haut débit.

La diversité de l'IA est aussi sa résilience. La portée de l'IA réside dans sa résilience. Il ne fait aucun doute que cette technologie ne se limite pas à une seule application. C'est désormais fondamental. Il s'agit assurément d'un changement de plateforme informatique radical.

 

Jensen Huang, PDG de NVIDIA

L'événement principal de l'année pour NVIDIA, la GTC (GPU Technology Conference), est axé sur les développeurs plutôt que sur la communauté des investisseurs, mais constitue un important « état des lieux » de l'IA, mettant en lumière les développements clés du secteur. Le PDG Jensen Huang a fourni des informations importantes sur l'impact profond d'OpenClaw, agent d'IA autonome open-source, en tant que catalyseur de la prolifération de l'IA agentive. Jensen a également présenté des arguments convaincants en faveur de la monétisation par jetons pour générer des revenus, justifiant ainsi qu'il est possible d'obtenir des rendements attractifs sur les dépenses d'investissement d'IA, et que ces rendements peuvent être durables et résilients.

Le discours d'ouverture de Jensen comprenait également une défense approfondie de l'avantage concurrentiel de NVIDIA compte tenu des récentes préoccupations de ses concurrents. Il a décrit une ampleur et une rapidité impressionnantes d'innovation dans l'ensemble du système – notamment l'intégration de Groq, une quasi-acquisition récente, dans la feuille de route de l'entreprise à partir de la fin de l'année (NVIDIA a un accord de licence non exclusif de technologie d'inférence avec Groq visant à accélérer l'inférence IA à l'échelle mondiale), complétant la « co-conception extrême » de Vera Rubin, le supercalculateur IA à l'échelle d'un rack construit pour l'IA agentielle et le raisonnement. Dans un monde de centres de données à capacité énergétique limitée (construits pour répondre à la demande explosive en matière d'IA, de cloud computing, etc., mais confrontés à des limitations énergétiques), le fournisseur d'infrastructure d'IA qui délivre le plus de jetons et donc de revenus par gigawatt est roi.

Selon nous, le GTC 2026 présente quatre points clés pour les investisseurs :

1. OpenClaw représente un tournant décisif pour l'IA agentive, comparable à celui de Windows.

[OpenClaw est] le projet open-source le plus populaire de l'histoire de l'humanité, et ce en seulement quelques semaines. Cela a surpassé ce que Linux a accompli en 30 ans, et c'est dire son importance.

 

Jensen Huang

Réalisant en quelques semaines ce que Linux a accompli en 30 ans, OpenClaw est le système d'exploitation des ordinateurs agents, de la même manière que Windows a rendu possibles les ordinateurs personnels. Cet agent d'IA autonome open source gratuit permet aux utilisateurs d'aller au-delà du chat IA pour « faire du vrai travail » (par exemple, gestion de calendrier, envoi d'e-mails, vérification des vols, etc.) en se connectant à des applications comme WhatsApp, WeChat, Microsoft Teams, Telegram et les navigateurs Web.

Chacun peut désormais créer des agents personnels et chaque entreprise du monde devrait désormais avoir une stratégie OpenClaw. Alors que la demande en puissance de calcul a été multipliée par 1 000 000 en seulement deux ans, Jensen estime que nous sommes en réalité à l’aube d’un nouveau bond exponentiel compte tenu de l’intensité de calcul requise par l’IA agentielle et de l’utilisation explosive de cette nouvelle technologie.

2. Jetons = Revenus

Compte tenu du débat actuel sur le marché concernant la durabilité des dépenses d'investissement en IA et leur potentiel de monétisation/retour sur investissement (ROI), Jensen a exposé ses calculs plus en détail. Selon lui, les entreprises spécialisées dans l'IA devraient facturer les jetons par paliers. Il y aura une version gratuite pour attirer les utilisateurs, mais au-delà, la monétisation des jetons augmentera rapidement à mesure que l'interaction avec l'IA s'intensifiera. Prenons l'exemple de la nouvelle infrastructure Vera Rubin : une entreprise pourrait potentiellement générer jusqu'à 150 milliards de dollars de revenus par centre de données de 1 GW (gigawatt) dont la construction coûte 100 milliards de dollars, ce qui représente une opportunité de retour sur investissement attrayante.

3. Un fossé concurrentiel extrême en matière de co-conception

Le PDG de NVIDIA a expliqué que l'IA est un problème global nécessitant une solution globale. Vera Rubin, dont le lancement est prévu plus tard cette année, comprend sept nouvelles puces conçues conjointement pour optimiser les performances, notamment grâce à la quasi-acquisition récente de Groq, qui apporte de nouvelles compétences en matière de génération de jetons à très faible latence (rapide). Jensen a exposé comment la technologie de Groq qui accélère l'inférence pour les LLM serait intégrée en désagrégeant l'inférence pour tirer parti des forces d'un GPU en termes de débit pour le décodage de l'attention (question), mais en s'appuyant sur le LPU de Groq pour la génération de décodage (réponse) compte tenu de ses avantages en termes de bande passante. En plus de concevoir de nouveaux CPU, GPU, DPU et systèmes de stockage, Vera Rubin peut générer 350 fois plus de jetons que le Hopper (GPU) n'en générait il y a seulement deux ans. Compte tenu de l'enthousiasme récent du marché pour les actions des réseaux optiques (fournisseur de liaisons optiques à haut débit pour les centres de données d'IA), il convient de noter que Jensen a réaffirmé que le cuivre a encore un long avenir dans la feuille de route de NVIDIA, les solutions optiques et les solutions optiques co-emballées étant intégrées progressivement.

4. Un chiffre d'affaires de 1 000 milliards de dollars US est prévu pour 2025-2027.

Chaque entreprise SaaS deviendra une entreprise AaaS, une entreprise de services d'agents.

 

Jensen Huang

NVIDIA prévoit de générer plus de 1 000 milliards de dollars de revenus grâce à Blackwell et Rubin entre 2025 et 2027. Ce chiffre n'inclut pas les ventes de Hopper, de processeurs autonomes ou de LPU Groq. Le carnet de commandes devrait continuer à s'allonger jusqu'en 2026, et cette estimation pourrait très bien augmenter au fil du temps.

Sauf indication contraire, les informations relatives à l'offre commerciale de NVIDIA proviennent d'Investing.com ; Transcription du discours d'ouverture de NVIDIA GTC ; 16 mars 2026 et NVIDIA.com.

AaaS: L'agentique en tant que service est un modèle cloud basé sur un abonnement pour déployer des agents d'IA autonomes capables de prendre des décisions et d'exécuter des tâches avec une supervision limitée, souvent alimentés par de grands modèles de langage (LLM).

IA agentique : un système d’IA qui utilise un raisonnement sophistiqué et une planification itérative pour résoudre de manière autonome des problèmes complexes en plusieurs étapes. De grandes quantités de données provenant de multiples sources et d'applications tierces sont utilisées pour analyser indépendamment les problèmes, développer des stratégies et exécuter des tâches.

dépenses d'investissement : argent qu'une entreprise dépense pour des actifs majeurs à long terme tels que les biens immobiliers et les équipements (actifs corporels) ou la technologie, les logiciels, les marques de commerce, les brevets, etc. (actifs incorporels) afin de faciliter de nouveaux projets ou investissements qui soutiennent la croissance et l'expansion de l'entreprise.

Centres de données à capacité énergétique limitée : installations de centres de données où le bâtiment physique (« structure ») existe, mais où la quantité d’énergie électrique disponible pour faire fonctionner les équipements informatiques est limitée ou partiellement indisponible.

Processeur (CPU) : L’unité centrale de traitement est le centre de contrôle qui exécute le système d’exploitation et les applications de la machine en interprétant, traitant et exécutant les instructions provenant des programmes matériels et logiciels.

DPU : Une unité de traitement de données est un processeur spécialisé conçu pour décharger le processeur principal des tâches de réseau, de stockage et de sécurité. Il accélère le transfert de données et les services d'infrastructure dans les centres de données modernes, améliorant ainsi l'efficacité et l'évolutivité, deux éléments essentiels pour l'exécution des charges de travail d'IA modernes. 

Solution complète : Désignela location ou l'achat d'une baie complète d'équipements et de services serveur dans un centre de données.

Solution Full-stack : désigne une approche globale du développement logiciel qui couvre toutes les couches d’une application ou d’un projet. Elle inclut à la fois les composants front-end et back-end ainsi que toutes les autres couches nécessaires au bon fonctionnement de l’application.

GPU : une unité de traitement graphique ou GPU effectue des calculs mathématiques et géométriques complexes qui sont nécessaires au rendu graphique et sont également utilisés dans les jeux, la création de contenu et l’apprentissage automatique.

Génération de jetons à faible latence : rapidité avec laquelle un modèle d’IA générative (grand modèle de langage) peut produire chaque unité de sortie successive (« jeton ») après avoir reçu une invite.

LPU ou unité de traitement du langage : puce propriétaire et spécialisée de Groq conçue spécifiquement pour répondre aux exigences uniques de vitesse et de mémoire des grands modèles de langage (LLM).

Logiciel libre : code conçu pour être accessible au public, en termes de consultation, de modification et de distribution.

ROI (retour sur investissement) : Un ratio financier utilisé pour mesurer la performance d'un investissement, calculé en divisant le bénéfice/la perte net(te) par le coût initial de l'investissement.

SaaS : modèle de diffusion de logiciels basé sur le cloud où les applications sont accessibles via Internet, le fournisseur de services cloud étant responsable de l’infrastructure, de la sécurité et des mises à jour. applications en direct sur les serveurs des fournisseurs de logiciels.

Les opinions exprimées sont celles de l'auteur au moment de la publication et peuvent différer de celles d'autres personnes/équipes de Janus Henderson Investors. Les références faites à des titres individuels ne constituent pas une recommandation d'achat, de vente ou de détention d'un titre, d'une stratégie d'investissement ou d'un secteur de marché, et ne doivent pas être considérées comme rentables. Janus Henderson Investors, son conseiller affilié ou ses employés peuvent avoir une position dans les titres mentionnés.

 

Les performances passées ne préjugent pas des résultats futurs. Toutes les données de performance tiennent compte du revenu, des gains et des pertes en capital mais n'incluent pas les frais récurrents ou les autres dépenses du fonds.

 

Les informations contenues dans cet article ne constituent pas une recommandation d'investissement.

 

Il n'y a aucune garantie que les tendances passées se poursuivront ou que les prévisions se réaliseront.

 

Communication Publicitaire.

 

Glossaire