Jensen Huang souhaite que vous arrêtiez de cliquer. Lors de sa conférence plénière à GTC Taipei le 1er juin, le PDG de Nvidia a déclaré que le paradigme ancien de plusieurs décennies d'interaction avec les ordinateurs via des claviers, des souris et des écrans est effectivement terminé, remplacé par des agents IA qui écoutent, comprennent et agissent en votre nom.
Le point central de l'annonce est le superpuce RTX Spark, développée en partenariat avec Microsoft, que Huang a présentée comme l'ossature matérielle permettant de transformer les PC Windows d'outils passifs en de véritables partenaires proactifs. Au lieu d'ouvrir des applications et de naviguer dans des menus, les utilisateurs exprimeront simplement leurs objectifs en langage courant et laisseront les agents IA gérer le reste.
Du clic à la conversation
La puce RTX Spark est conçue pour exécuter des agents IA localement sur un PC, ce qui signifie que l'interface conversationnelle ne dépend pas entièrement du traitement cloud. Pensez-y moins comme demander à Siri de régler un minuteur et davantage comme donner à un assistant compétent une seule instruction orale ou tapée pour rechercher un sujet, rédiger un rapport, le formater et l'envoyer par e-mail à votre équipe.
Nvidia a également introduit son runtime OpenShell et sa pile NemoClaw, deux composants d'infrastructure spécifiquement conçus pour déployer ces systèmes d'IA agente de manière sécurisée, notamment dans les environnements d'entreprise où la sensibilité des données est cruciale.
Le runtime OpenShell fournit la couche d'exécution pour les agents IA, tandis que NemoClaw gère l'orchestration et les garde-fous de sécurité dont les entreprises ont besoin avant de laisser des logiciels autonomes accéder à leurs systèmes internes.
Vera Rubin et l'économie de l'inférence
Huang a également confirmé que les systèmes de rack Nvidia Vera Rubin NVL72 entreront en production complète d'ici l'automne 2026. Le chiffre clé ici : une réduction des coûts d'inférence de 10 fois par rapport aux générations précédentes. L'inférence est le processus d'exécution d'un modèle d'IA entraîné pour générer des sorties. Réduire ce coût d'un ordre de grandeur est extrêmement important, car l'inférence représente la majeure partie des dépenses informatiques à mesure que l'IA passe des laboratoires de recherche aux produits quotidiens.
Le partenariat avec Microsoft et ce qu'il signifie
La puce RTX Spark a été développée en collaboration avec Microsoft. La conférence de Huang s'appuie sur les thèmes que Nvidia a promus lors de plusieurs événements GTC tout au long de 2026, chacun renforçant l'idée que l'IA n'est pas simplement une fonctionnalité ajoutée à l'informatique existante.
Ce que cela signifie pour les investisseurs
La réduction des coûts d'inférence de 10x apportée par les systèmes Vera Rubin est sans doute le chiffre le plus significatif pour les marchés. Une inférence moins chère élargit le marché potentiel des applications d'IA dans tous les secteurs, ce qui signifie que davantage d'entreprises peuvent se permettre de déployer l'IA à grande échelle, entraînant une demande accrue pour le matériel Nvidia.
Chaque concepteur de puces majeur et fournisseur de cloud s'efforce de réduire les coûts d'inférence. AMD, Intel, Google et Amazon disposent tous de programmes silicium concurrents. Si la revendication de Nvidia d'un facteur 10 se vérifie dans des benchmarks réels, cela élargit son avance.
