ByteDance e Oracle adotam o CPU Arm AGI, Arm prevê receita de US$ 20 bilhões até 2028

Em 3 de junho, Xin Dongxi relatou que o CEO da Arm, Rene Haas, realizou uma palestra principal durante a Computex 2026 ontem, anunciando que ByteDance e Oracle já adotaram o chip CPU de data center de desenvolvimento próprio da Arm, o Arm AGI.

ByteDance

No mês passado, a Arm elevou sua previsão de demanda para a CPU Arm AGI em duas vezes, estimando que atingirá 2 bilhões de dólares americanos (aproximadamente 13,5 bilhões de yuans chineses) nos exercícios financeiros de 2027 e 2028, além de prever que o produto gerará receita anual de 15 bilhões de dólares americanos (aproximadamente 101,6 bilhões de yuans chineses) em cerca de cinco anos.

Rene Haas disse em entrevista à mídia estrangeira ontem que impedir a exportação de CPUs de IA para a China “é quase impossível”, pois as CPUs de IA têm aplicações amplas, tornando difícil identificar quais CPUs são especificamente destinadas à IA, e difícil estabelecer limites específicos de desempenho e largura de banda de memória, como se faz com chips de IA.

Na segunda-feira desta semana, a NVIDIA lançou o superchip RTX Spark baseado na arquitetura Arm e a CPU de data center Vera; à noite, as ações da Arm subiram continuamente, alcançando uma alta de 16% até o fechamento de terça-feira. Desde o início deste ano, as ações da Arm acumulam uma alta de 263%.

ByteDance

O fundador e CEO da NVIDIA, Jensen Huang, também apareceu na palestra de Rene Haas na terça-feira e brincou assim que subiu ao palco: “Veja o preço das ações dele — cada vez que lanço um produto, o preço das ações dele sobe, enquanto o meu não acontece nada.”

ByteDance

Rene Haas respondeu astutamente: "Você era acionista antes, e depois vendeu suas ações."

Huang Renxun respondeu imediatamente: "Sim, sim, oh, preciso de dinheiro em caixa."

Os dois pareciam velhos conhecidos, conversaram animadamente por 15 minutos, intercalando esquetes cômicas e piadas, fazendo toda a plateia rir sem parar; eles próprios também riam tanto que mostravam todos os dentes.

ByteDance

Esta foi realmente a conversa mais animada da área de tecnologia que já vi recentemente.

Por exemplo, após elogiar amplamente a CPU Arm, Huang Renxun resumiu: “A palavra-chave é ‘Arm é perfeito’.”

Rene Haas interrompeu: "Outra palavra-chave é 'obrigado'."

Huang Renxun imediatamente fala chinês: “Onde isso, onde isso, não seja tímido.”

Então Rene Haas reclamou: "Agora esse confronto não é justo." (referindo-se a que Huang fala chinês como sendo injusto)

Em seguida, Huang Renxun acrescentou gentilmente: “You're welcome.”

ByteDance

Huang Renxun também brincou dizendo que "uma das maiores vantagens da Arm é não precisar se preocupar com problemas de cadeia de suprimentos", pois a cadeia de suprimentos de IP é eletrônica e pode usar quantos elétrons forem necessários.

“Então eu amo o seu modelo de negócios,” começou Huang Renxun, lembrando-se do passado. “Vocês sabem, eu tentei, eu realmente tentei me tornar a Arm; eu trabalhei com Rene antes, e depois tentamos colaborar novamente, mas não foi nada de mais, ainda assim fiquei muito triste.”

Rene Haas disse: "Se as duas empresas se fundirem, nos tornaremos a maior empresa do mundo."

“I like this,” Huang Renxun laughed. “That’s a great idea.”

Parece que ambos lamentam que a NVIDIA não tenha conseguido adquirir a Arm.

Por fim, na parte da entrega dos presentes, Rene Haas provocou uma onda de nostalgia, presenteando Huang Renxun com um notebook Microsoft Surface RT equipado com o chip NVIDIA Tegra 3, e imitou a assinatura de Huang Renxun.

ByteDance

NVIDIA Tegra 3, o primeiro processador móvel quad-core Arm lançado pela NVIDIA há alguns anos.

Huang Renxun apontou para a foto na tela grande e se gabou: “O que aconteceu quando éramos jovens? Preciso dizer que acho que pareço mais jovem. Vocês concordam? Acho que me mantenho bastante bem.”

ByteDance

Rene Haas riu até ficar embaçado.

ByteDance

Então Huang Renxun pegou o presente de forma abrupta e, com a voz elevada: "Isso é para mim? Se eu assinar e devolver, se tornará um tesouro."

Rene Haas disse: "Não, você assina e me devolve, aqui tem contrato e nota fiscal, não podemos fazer isso. Nós conhecemos esse jogo."

ByteDance

Voltando ao tópico da indústria séria, durante esta palestra, Rene Haas fez a Huang Renxun algumas perguntas-chave:

1. Por que fazer RTX Spark?

2. Como equilibrar os prós e contras entre agentes locais e agentes na nuvem?

3. Os agentes realmente conseguem operar independentemente, sem o sistema operacional subjacente?

4. Como Huang Renxun vê os fatores que restringem o crescimento nos próximos anos?

Huang Renxun também pintou um grande quadro para o desenvolvimento do mercado: atualmente, a indústria de computadores é limitada pelo número de pessoas que usam computadores; com agentes inteligentes capazes de usar computadores autonomamente, não seremos mais bilhões de pessoas usando computadores, mas centenas de bilhões, e possivelmente até mais do que agentes inteligentes, robôs e veículos autônomos que usam computadores.

Então, a questão é: qual pode ser a escala dos produtos de computador?

“Sinto que, até agora, o desfecho já está decidido; esse setor de trilhões de dólares pode se tornar dez vezes maior, e estamos em caminho,” disse Huang Renxun.

Rene Haas também compartilhou os últimos avanços e os planos futuros da Arm nas áreas de CPU para PCs de agentes e data centers.

Ele mencionou casualmente que conversou esta semana com the Chairman and CEO of TSMC, C.C. Wei, e the Senior Vice President and COO, Stacy Lee, who said they had never seen the semiconductor industry cycle experience such sustained prosperity for four consecutive years.

01. Aula rápida com Jensen Huang: Como projetar um PC de agente?

Huang Renxun respondeu a várias questões-chave levantadas por Rene Haas, e essas opiniões são muito relevantes para o desenvolvimento futuro do AI PC e para as abordagens de design de chips.

1. Por que criar o produto RTX Spark?

PCs e sistemas operacionais existem há 40 anos; a programação manual será substituída por agentes inteligentes que utilizarão ferramentas dentro dos PCs. Como reestruturar a arquitetura, modificar os sistemas operacionais e reinventar os computadores no futuro?

NVIDIA percebeu que sistemas de agentes precisam de um excelente CPU, é por isso que adotou o Arm.

O superchip RTX Spark possui um CPU de 20 núcleos, com excelente desempenho em thread único, e a memória precisa armazenar muitos parâmetros.

Então, a NVIDIA criou um novo formato de dados chamado NVFP4 para comprimir grandes linguagens, construir modelos o máximo possível e integrar IA muito inteligente na memória do sistema.

NVIDIA também deseja integrar o CUDA e o CUDA Tile, usados para aceleração de cálculo, combinando o processamento de núcleos tensoriais em um único processador.

2. Como equilibrar e decidir entre agentes executados localmente e agentes executados na nuvem?

Esses PCs Arm se tornarão agentes que operam de forma autônoma.

Hoje, se você esquecer seu notebook em casa ou no hotel, não poderá usá-lo.

Mas no futuro, você só precisará pegar o celular para se comunicar remotamente com o PC e dar instruções aos agentes.

Huang Renxun disse: "A essência de um dispositivo de computação pessoal é que você pode fazer qualquer coisa com esse dispositivo sem gastar tempo."

Use algumas APIs em nuvem apenas quando necessário; sempre que possível, realize as tarefas localmente no seu computador.

3. Executar o agente, o sistema operacional é importante? Se o agente for considerado um sistema operacional, ele realmente consegue realizar tarefas de forma independente e não depender tanto do sistema operacional subjacente?

A importância do sistema operacional não diminuiu, e pode até ser maior do que antes.

Este também é o ponto de controvérsia frequentemente mencionado quando se fala sobre o surgimento da IA: “a software está morto”, e Huang Renxun acha que nada poderia ser mais absurdo.

As pessoas podem conhecer apenas 10% a 20% das funcionalidades de muitas ferramentas.

Agora, você pode dizer ao agente o que deseja.

O agente sabe exatamente como usar essas ferramentas, pois já leu os arquivos Skills, que são essencialmente os manuais de uso dessas ferramentas. Agora, ele utilizará o MCP ou CLI conectado a essas ferramentas para desbloquear todos esses recursos e atender às suas necessidades.

Essas ferramentas serão mais valiosas do que nunca, pois funcionam sobre sistemas operacionais, então precisamos do sistema Windows e continuaremos precisando dessas APIs e ferramentas por um longo período.

4. Quais são os fatores limitantes de crescimento nos próximos anos?

“Vimos restrições em quase todos os aspectos,” disse Huang Renxun. A NVIDIA planejou com antecedência e fez um excelente planejamento da cadeia de suprimentos, com um crescimento de quase 100% em relação ao ano anterior, e um crescimento muito acelerado esperado para o próximo ano, que a cadeia de suprimentos será capaz de suportar.

But the demand is actually higher.

Huang Renxun afirmou que novos modelos de aplicação de computação realmente exigem uma nova arquitetura, e uma grande conquista atual é que agentes são capazes de produzir IA prática, o que explica por que o crescimento de todos é tão incrível.

Quando a IA se torna prática, os tokens gerados podem gerar lucro. Quando os tokens geram lucro, todos querem criar tokens com um aumento de trilhões de vezes.

Agora, a IA não é apenas um chatbot que responde perguntas; ela pode pensar, usar ferramentas, ler, continuar pensando, planejar e tentar, exigindo um aumento significativo no número de tokens gerados. A rentabilidade dos tokens está impulsionando a demanda por capacidade de processamento, criando um efeito acumulativo.

02. Chip para PC ARM: Apple, Google e Qualcomm aprovam, em estreita colaboração com NVIDIA e MediaTek

Na área de PCs, empresas como Google, Apple, NVIDIA e Qualcomm desenvolveram chips para PCs baseados na arquitetura Arm, e a Arm tem colaborado com Apple, Google, Microsoft e outras por décadas.

ByteDance

Rene Haas afirmou que a Arm tem a honra de colaborar com a NVIDIA no desenvolvimento do superchip RTX Spark baseado na arquitetura Arm. Este chip possui um CPU Grace personalizado com 20 núcleos, cada um baseado na arquitetura Arm.

“Eu acredito que este é o processador com o maior número de núcleos CPU atualmente disponível em notebooks,” disse Rene Haas, ao combiná-lo com a GPU Blackwell, este chip oferece 1 PFLOPS de desempenho AI FP4, 128 GB de memória unificada e suporte nativo total ao Windows na plataforma Arm.

ByteDance

O papel da Arm neste contexto é colaborar estreitamente com NVIDIA e MediaTek utilizando a estratégia de subsistemas de computação da Arm.

O subssistema de cálculo combina todos os componentes necessários para construir um SoC personalizado (CPU, GPU, IP do sistema, controlador de memória) para formar um sistema de solução final completo.

Arm colaborou com MediaTek para concluir este trabalho, e a MediaTek pode fornecer uma solução completa.

Rene Haas também apresentou a rota da Arm CSS para PCs de agentes, onde a próxima geração otimizará núcleos de CPU personalizados projetados especificamente para PCs.

ByteDance

03. CPU de agente autodesenvolvido pela Arm: OpenAI e ByteDance são parceiros

Rene Haas disse que mais de 25 bilhões de chips Arm foram fabricados em Taiwan, e o primeiro CPU de propriedade da Arm, o Arm AGI, lançado em março deste ano, é produzido pela TSMC em Taiwan.

ByteDance

O CPU Arm AGI foi projetado especificamente para infraestrutura de agentes de IA, utilizando o processo de fabricação TSMC de 3 nm e design dual Chiplet. Cada CPU integra 136 núcleos Arm Neoverse V3 de alto desempenho, com 2 MB de cache L2, suporte a frequência de 3,7 GHz, largura de banda de memória de 6 GB/s por núcleo, latência de memória inferior a 100 ns, interface PCIe Gen 6 com 96 canais e suporte ao protocolo CXL 3, com TDP de 300 W.

Parceiros da Arm AGI CPU incluem OpenAI, Meta, Cerebras, SAP, SK Telecom, Rebellions, entre outros. Rene Haas anunciou que a demanda de mercado por este chip é mais forte do que no momento do lançamento, com Oracle e ByteDance também se juntando a essa família, validando que a Arm AGI CPU consegue resolver problemas do mundo real.

Of course, not all companies want to buy an Arm AGI CPU. For companies interested in developing their own chips, Arm offers a variety of IP and compute subsystems (CSS), committed to providing customers with any solution they desire.

ByteDance

No data center, o Axion CPU conectado aos mais recentes chips de IA do Google, TPU 8t e TPU 8i, é um chip baseado na tecnologia Arm Neoverse, capaz de reduzir o consumo de energia em 60% em comparação com CPUs x86, mantendo o desempenho inalterado.

O CPU Graviton desenvolvido pela Amazon também utiliza a arquitetura Arm. O CEO da Amazon, Andy Jassy, revelou anteriormente: “Dois grandes clientes perguntaram se poderiam comprar todos os nossos instâncias Graviton de 2026.”

NVIDIA também lançou esta semana sua nova geração de CPU Vera baseada em Arm.

ByteDance

A Arm planeja transformar seu CPU desenvolvido internamente em uma empreitada de longo prazo e apresenta um plano de caminho de três anos.

ByteDance

O segundo geração do CPU Arm AGI já está em desenvolvimento, com mais núcleos, maior eficiência energética e melhor desempenho em comparação com a geração anterior.

O terceiro geração de CPU Arm AGI também está prestes a chegar.

All of these are based on the compute subsystems that Arm intends to deliver alongside the chips.

04. Conclusão: Após a explosão dos agentes, os holofotes da competição por poder de processamento se voltam para a CPU

As palestras de líderes da indústria de chips desta semana, como Jensen Huang, Chen Liwu e Rene Haas, refletem algumas tendências comuns da indústria de CPU — agentes inteligentes estão alterando a lógica de computação, abrindo uma nova porta de oportunidades de mercado para as CPUs.

Nos últimos anos, o foco da competição por capacidade de processamento estava principalmente nos GPUs, essenciais para o treinamento de IA. No entanto, com a explosão das aplicações de agentes este ano, a demanda por inferência de agentes aumentou significativamente, exigindo grande quantidade de gerenciamento de estado, chamadas de ferramentas e orquestração de fluxos — tarefas intensivas em CPU.

Intel e AMD ainda estão consolidando a vantagem dos processadores x86 no segmento de data centers. Enquanto isso, novos participantes, incluindo Amazon, Google e NVIDIA, estão apostando basicamente na rota de CPUs Arm. Até a Arm tomou uma decisão "contrária aos seus princípios", entrando oficialmente no mercado de CPUs para data centers este ano.

Um fenômeno muito interessante é que a indústria de chips está formando uma nova tendência de integração vertical.

Empresas de chips com amplas linhas de produtos, como NVIDIA, Intel e AMD, estão cada vez mais enfatizando suas características de pilha completa, e a ênfase em suas soluções converge para os mesmos benefícios: maior eficiência energética, disponibilidade de tudo o que você precisa e redução de custos.

As principais empresas de diversos setores também estão entrando em “outros campos”: as gigantes de nuvem estão descendo para desenvolver seus próprios chips, as empresas de chips estão subindo para oferecer soluções completas de equipamentos e as empresas de IP semicondutor estão subindo para desenvolver chips.

No contexto em que os tokens se tornam novas moedas competitivas e a demanda por poder de processamento cresce exponencialmente, como gerar mais cálculos úteis por watt será o foco principal da próxima competição de chips.

Este artigo é do número oficial do WeChat "Xin Dongxi", autor: ZeR0, editor: Mo Ying