A OpenAI encerrou o aluguel de seu futuro da Nvidia. A empresa anunciou uma parceria com a Broadcom para desenvolver aceleradores de IA personalizados especificamente otimizados para modelos de linguagem de grande porte, com uma meta de implantação que se estende do segundo semestre de 2026 até o final de 2029.
A escala é impressionante: 10 gigawatts de aceleradores de IA personalizados.
Como realmente é a parceria
A divisão de trabalho aqui é clara. A OpenAI cuida do design do acelerador, trazendo seu profundo entendimento das cargas de trabalho de LLM diretamente para a arquitetura de silício. A Broadcom assume a responsabilidade pelo desenvolvimento, fabricação e implantação desses sistemas, integrando-os à sua própria tecnologia de rede Ethernet.
Este não é o primeiro envolvimento da OpenAI com chips personalizados. Relatos surgiram em setembro de 2025 indicando que a empresa estava trabalhando com a Broadcom em um chip acelerador “XPU” previsto para produção em 2026. O anúncio de 13 de outubro confirma e amplia significativamente esse esforço.
“Desenvolver nossos próprios aceleradores contribui para o ecossistema mais amplo,” disse o CEO da OpenAI, Sam Altman.
O CEO da Broadcom, Hock Tan, apresentou a ambição de forma mais direta, descrevendo o objetivo como “co-desenvolver e implantar 10 gigawatts de aceleradores de próxima geração.”
As instalações serão implementadas nas próprias instalações da OpenAI e nos centros de dados afiliados.
Por que a OpenAI precisa do seu próprio silício
Relata-se que a OpenAI possui mais de 800 milhões de usuários ativos semanais acessando seus serviços de IA baseados em nuvem. Executar modelos de linguagem de grande escala nesse nível é extremamente caro, e aceleradores personalizados permitem que a OpenAI incorpore diretamente em hardware suas insights arquiteturais — em vez de escrever software que contorne as limitações de um chip, você projeta o chip conforme as necessidades exatas do seu software.
Este é o mesmo plano que o Google adotou com seus chips TPU (Tensor Processing Unit). A Amazon seguiu com seus chips Trainium e Inferentia para a AWS. A Microsoft tem seus aceleradores Maia.
O que isso significa para o cenário competitivo
A integração de rede Ethernet da Broadcom é um detalhe significativo. A inferência de IA em escala não se trata apenas de chips rápidos — trata-se de mover dados entre chips de forma eficiente. Ao combinar sua expertise em redes com os designs de aceleradores da OpenAI, a Broadcom pode oferecer uma solução end-to-end.
A linha do tempo de implantação de 2026 a 2029 é relevante para qualquer um que modele as finanças da OpenAI. Chips personalizados levam tempo para gerar retornos, mas, uma vez operacionais, podem reduzir drasticamente os custos de computação por consulta da OpenAI. Com 800 milhões de usuários ativos semanais e em crescimento, até ganhos de eficiência modestos por inferência se traduzem em economias medidas em bilhões anuais.
