Jensen Huang quer que você pare de clicar. Durante sua palestra no GTC Taipei em 1º de junho, o CEO da Nvidia declarou que o paradigma de décadas de interagir com computadores por meio de teclados, mouses e telas está efetivamente encerrado, substituído por agentes de IA que escutam, entendem e agem em seu nome.
O ponto central do anúncio é o superchip RTX Spark, desenvolvido em parceria com a Microsoft, que Huang apresentou como a base de hardware para transformar PCs com Windows de ferramentas passivas em parceiros proativos, conforme descrito por ele. Em vez de abrir aplicativos e navegar por menus, os usuários simplesmente declararão seus objetivos em linguagem simples e deixarão que agentes de IA cuidem do resto.
Do clique à conversa
O chip RTX Spark foi projetado para executar agentes de IA localmente em um PC, o que significa que a interface conversacional não depende totalmente do processamento na nuvem. Pense nisso menos como pedir ao Siri para definir um cronômetro e mais como dizer a um assistente capaz para pesquisar um tópico, redigir um relatório, formatá-lo e enviá-lo por e-mail para sua equipe, tudo a partir de uma única instrução falada ou digitada.
A Nvidia também apresentou seu runtime OpenShell e a pilha NemoClaw, duas infraestruturas especificamente desenvolvidas para implantar esses sistemas de IA agente de forma segura, especialmente em ambientes empresariais onde a sensibilidade dos dados é crucial.
O runtime OpenShell fornece a camada de execução para agentes de IA, enquanto o NemoClaw gerencia a orquestração e as proteções de segurança que as empresas precisam antes de liberar software autônomo em seus sistemas internos.
Vera Rubin e a economia da inferência
Huang também confirmou que os sistemas de rack Nvidia Vera Rubin NVL72 entrarão em produção total até o outono de 2026. O número-chave aqui: uma redução de custo de 10x na inferência em comparação com gerações anteriores. Inferência é o processo de executar um modelo de IA treinado para gerar saídas. Reduzir esse custo em uma ordem de grandeza é extremamente importante, pois a inferência é onde a maioria dos gastos com computação ocorre à medida que a IA passa de laboratórios de pesquisa para produtos cotidianos.
A parceria com a Microsoft e o que ela sinaliza
O chip RTX Spark foi desenvolvido em conjunto com a Microsoft. A palestra de Huang expande temas que a Nvidia vem avançando em múltiplos eventos GTC ao longo de 2026, cada um impulsionando a narrativa de que a IA não é apenas um recurso acoplado à computação existente.
O que isso significa para os investidores
A redução de 10x no custo de inferência dos sistemas Vera Rubin é, sem dúvida, o número mais relevante para os mercados. Inferência mais barata amplia o mercado potencial para aplicações de IA em todos os setores, o que significa que mais empresas poderão arcar com o deploy em larga escala de IA, resultando em maior demanda pelo hardware da Nvidia.
Cada grande projetista de chips e provedor de nuvem está correndo para reduzir os custos de inferência. AMD, Intel, Google e Amazon têm todos programas de silício concorrentes. Se a afirmação de 10x da Nvidia se mantiver em benchmarks do mundo real, ampliará a liderança da empresa.
