O domínio da Nvidia na computação de IA repousa há muito tempo em dois pilares: seu hardware e seu software. As GPUs recebem toda a atenção, mas o verdadeiro vínculo vem do CUDA, a plataforma de programação proprietária em torno da qual milhões de desenvolvedores construíram seus fluxos de trabalho. A OpenAI agora está atacando diretamente esse segundo pilar.
A empresa está se preparando para lançar uma ferramenta projetada para permitir que modelos de IA sejam executados em hardware não Nvidia, utilizando sua linguagem de código aberto Triton como uma alternativa viável ao CUDA.
A evolução silenciosa da Triton
Triton não é novo. A OpenAI o lançou pela primeira vez em julho de 2021 como uma linguagem de código aberto para escrever kernels de GPU de alto desempenho em Python. A proposta era direta. CUDA é poderosa, mas notoriamente complexa. Triton visa oferecer desempenho comparável com código muito mais acessível ao desenvolvedor médio.
Desde então, o projeto tem ganhado impulso constantemente. Atualmente, serve como backend para frameworks populares como o PyTorch. A versão mais recente, Triton 3.7, foi lançada em 2026, sinalizando que a OpenAI não está tratando isso como um projeto secundário.
A estratégia de diversificação de hardware
O impulso de software da OpenAI não existe em um vácuo. A empresa tem explorado ativamente alternativas aos chips da Nvidia desde 2025, em parte devido à insatisfação com alguns dos chips de inferência da Nvidia. Inferência é o processo de executar realmente um modelo de IA treinado, em oposição a treiná-lo inicialmente.
A empresa anunciou uma parceria com a AMD que inclui uma capacidade computacional substancial de 6 GW alimentada pela AMD. A OpenAI descreveu isso como algo complementar aos seus acordos existentes com a Nvidia, não como uma substituição.
Além da AMD, a OpenAI tem conversado com startups como Cerebras e Groq, ambas que desenvolveram chips especializados otimizados para cargas de trabalho de inferência. A empresa também está desenvolvendo chips personalizados de inferência de IA com a Broadcom, com planos de produção previstos para 2026.
O que isso significa para os investidores
O ecossistema CUDA da Nvidia possui milhões de desenvolvedores, anos de conhecimento institucional e integração profunda em praticamente todos os principais frameworks de IA.
A AMD tem aprimorado sua plataforma ROCm para melhorar a compatibilidade com cargas de trabalho de IA. Projetos abertos como o ZLUDA surgiram para traduzir código CUDA para executar em hardware não Nvidia. E agora, o maior consumidor individual de computação de IA do planeta está ativamente desenvolvendo ferramentas para tornar a vantagem de software da Nvidia menos relevante.
Para a AMD e o ecossistema mais amplo de chips alternativos, os movimentos da OpenAI representam um possível ponto de inflexão. A maior barreira à adoção de hardware não-Nvidia sempre foi a compatibilidade de software. Se o Triton se tornar um padrão verdadeiramente multiplataforma, eliminará a principal objeção que os desenvolvedores de IA têm ao considerar AMD ou silício personalizado.
