A fuga de talentos de IA do Meta e a onda de gastos de US$ 135 bilhões em chips

Artigo escrito por Ada, Deep潮 TechFlow

Pang Ruoming deixou antes mesmo de se aquecer no seu posto de trabalho na Meta.

Em julho de 2025, Zuckerberg atraiu o engenheiro chinês mais cobiçado no campo de infraestrutura de IA da Apple com um pacote de remuneração plurianual no valor total superior a US$ 200 milhões. Pang Ruoming foi alocado no Superintelligence Lab da Meta para liderar a construção da infraestrutura para o próximo modelo de IA.

7 meses depois, a OpenAI o recrutou.

Segundo o The Information, a OpenAI realizou uma campanha de recrutamento que durou vários meses direcionada a Pang Ruoming. Apesar de Pang ter dito a colegas que “estava muito feliz trabalhando na Meta”, ele acabou decidindo sair. Segundo a Bloomberg, seu pacote de compensação na Meta estava vinculado a marcos, e deixar a empresa antecipadamente significava abrir mão da maior parte das ações não realizadas.

200 milhões de dólares não compram 7 meses de lealdade.

Esta não é uma simples história de mudança de emprego.

A saída de uma pessoa, o sinal de muitos

Pang Ruoming não foi o primeiro a sair.

Na semana passada, Mat Velloso, responsável pelo produto da plataforma de desenvolvedores do Meta Superintelligence Lab, também anunciou sua saída. Ele havia deixado o Google DeepMind em julho do ano passado para se juntar ao Meta, permanecendo por menos de oito meses. Anteriormente, em novembro de 2025, Yann LeCun, ganhador do Prêmio Turing e cientista-chefe de IA do Meta, que passou 12 anos na empresa, anunciou sua saída para empreender e desenvolver o “modelo do mundo” que sempre defendeu. Russ Salakhutdinov, vice-presidente de pesquisa em IA generativa do Meta e um dos principais discípulos de Geoffrey Hinton, também anunciou recentemente sua saída.

Para entender a fuga de talentos do Meta AI, é preciso primeiro entender o quão grave foi o impacto do Llama 4.

Em abril de 2025, a Meta lançou oficialmente os modelos Scout e Maverick da série Llama 4. Os dados oficiais são impressionantes, afirmando que superaram completamente o GPT-4.5 e o Claude Sonnet 3.7 em benchmarks-chave como MATH-500 e GPQA Diamond.

No entanto, este modelo-chave, que carrega as ambições da Meta, rapidamente "mostrou sua verdadeira natureza" em testes cegos independentes de terceiros na comunidade de código aberto, apresentando uma queda acentuada entre sua capacidade real de generalização e raciocínio e as alegações de marketing. Diante das fortes críticas da comunidade, o cientista-chefe de IA, Yann LeCun, acabou admitindo que a equipe "utilizou versões diferentes do modelo para executar diferentes conjuntos de testes, a fim de otimizar a pontuação final".

Na rigorosa comunidade acadêmica e de engenharia de IA, isso toca a linha vermelha inperdoável. Em outras palavras, a equipe treinou o Llama 4 para ser apenas um "estudante de cidade pequena" especializado em resolver provas anteriores, e não um "aluno destaque" com inteligência de ponta. Se for uma prova de matemática, ele mostra o melhor em matemática; se for de programação, ele mostra o melhor em programação — cada teste individual parece muito forte, mas na realidade, não se trata do mesmo modelo.

Isso na academia de IA é chamado de "seleção de cerejas"; no sistema de educação voltado para exames, é chamado de "fraude na prova".

Para a Meta, que sempre se apresentou como “farol do código aberto”, essa crise destruiu diretamente seu ativo mais valioso no ecossistema de desenvolvedores: a confiança. O custo imediato foi a “perda total de confiança” de Zuckerberg nos princípios técnicos da equipe original de GenAI, dando início à subsequente chegada de executivos externos e ao enfraquecimento dos departamentos centrais de infraestrutura.

Ele gastou entre US$ 14,3 bilhões e US$ 15 bilhões para adquirir 49% da empresa de rotulagem de dados Scale AI, nomeando Alexandr Wang, de 28 anos, CEO da Scale AI, como chefe de IA da Meta e criando o Meta Superintelligence Lab (MSL). O ganhador do Prêmio Turing, LeCun, agora precisa relatar a esse jovem de 28 anos no novo架构. Em outubro, a Meta demitiu cerca de 600 cargos no MSL, incluindo membros do departamento de pesquisa FAIR, criado por LeCun.

O modelo principal originalmente planejado para lançamento no verão de 2025, o Llama 4 Behemoth, também foi adiado repetidamente, sendo remarcado do verão para o outono e, finalmente, suspenso indefinidamente.

A Meta passou a desenvolver o próximo modelo de texto, codinome "Avocado", e o próximo modelo de imagem/vídeo, codinome "Mango". Segundo relatos, o Avocado tem como objetivo competir com o GPT-5 e o Gemini 3 Ultra. Originalmente programado para lançamento até o final de 2025, foi adiado para o primeiro trimestre de 2026 devido a resultados insatisfatórios nos testes de desempenho e otimização do treinamento. A Meta está considerando lançá-lo como fechado, abandonando a tradição aberta da série Llama.

A Meta cometeu dois erros fatais em seus modelos de IA. O primeiro foi falsificar benchmarks, o que destruiu diretamente a confiança da comunidade de desenvolvedores; o segundo foi forçar o departamento de pesquisa básica, como o FAIR, que exige uma dedicação de dez anos, dentro de uma organização de produtos focada em KPIs trimestrais. Juntos, esses dois fatores são a causa fundamental da atual fuga de talentos.

Chip desenvolvido internamente: outra perna quebrada

Os talentos estão saindo, e os chips também estão com problemas.

Segundo o The Information, a Meta encerrou na semana passada o projeto de seu chip de treinamento de IA mais avançado em desenvolvimento interno.

O plano de chips proprietários da Meta é chamado MTIA (Meta Training and Inference Accelerator). O roadmap inicial da empresa é ambicioso: as versões MTIA v4, codinome “Santa Barbara”, v5, codinome “Olympus”, e v6, codinome “Universal Core”, estão programadas para serem entregues entre 2026 e 2028. O Olympus foi projetado como o primeiro chip da Meta baseado na arquitetura 2nm chiplet, com o objetivo de atender simultaneamente ao treinamento de modelos de alto desempenho e à inferência em tempo real, visando finalmente substituir os chips da NVIDIA nos clusters de treinamento da Meta.

Agora, este chip de treinamento mais avançado foi cortado.

O Meta não está sem progresso; a MTIA já obteve alguns resultados na inferência. O chip de inferência MTIA v3, codinome "Iris", já foi implantado em grande escala nos data centers do Meta, principalmente nos sistemas de recomendação do Facebook Reels e do Instagram, reduzindo supostamente o custo total de propriedade em 40% a 44%. Mas inferência e treinamento são duas coisas diferentes. Inferência é executar o modelo; treinamento é treinar o modelo. O Meta consegue desenvolver chips de inferência por conta própria, mas ainda não consegue produzir chips de treinamento que possam competir diretamente com os da NVIDIA.

Esta não foi a primeira vez na história. Em 2022, a Meta tentou desenvolver seu próprio chip de inferência, mas, após falhar em uma implantação em pequena escala, desistiu completamente e fez um grande pedido à NVIDIA.

O fracasso dos chips desenvolvidos internamente acelerou diretamente a onda de aquisições externas da Meta.

Compras pânico de US$ 135 bilhões

Em janeiro de 2026, a Meta anunciou um orçamento de gastos com capital de US$ 115 bilhões a US$ 135 bilhões para este ano, quase o dobro dos US$ 72,2 bilhões do ano passado. A maior parte desse dinheiro será gasta em chips.

Dentro de 10 dias, três grandes ordens foram executadas consecutivamente:

Em 17 de fevereiro, a Meta assinou um acordo de cooperação estratégica de longo prazo e intergeracional com a NVIDIA. A Meta implantará “milhões de unidades” das GPU Blackwell e da nova geração Vera Rubin da NVIDIA, além da CPU independente Grace. Analistas estimam que o valor da transação está na casa de centenas de bilhões de dólares, tornando a Meta o primeiro cliente de supercomputação do mundo a implantar em larga escala a CPU independente Grace da NVIDIA.

Em 24 de fevereiro, a Meta assinou um acordo plurianual de chips no valor de US$ 60 bilhões a US$ 100 bilhões com a AMD. A Meta adquirirá os mais recentes GPU da série MI450 e CPUs EPYC de sexta geração da AMD. Como parte do acordo, a AMD emitiu warrants para até 160 milhões de ações ordinárias da AMD, equivalente a aproximadamente 10% das ações da AMD, a um preço de US$ 0,01 por ação, com vencimento em etapas conforme a realização de marcos de entrega.

Em 26 de fevereiro, segundo relato do The Information, a Meta assinou um acordo plurianual no valor de bilhões de dólares com o Google para alugar chips TPU do Google Cloud para treinar e executar seu próximo modelo de linguagem de grande porte. Ao mesmo tempo, ambas as partes estão discutindo a possibilidade da Meta comprar diretamente TPU a partir de 2027 para implantar em seus próprios data centers.

Uma empresa de mídia social fez pedidos potencialmente superiores a US$ 1 trilhão em conjunto a três fornecedores de chips em 10 dias.

This is not a diversified strategy. This is panic buying.

Três níveis lógicos da ansiedade por poder de mineração

Por que a Meta está com tanta pressa?

Primeiro, não se pode mais contar com chips desenvolvidos internamente. O projeto de chips de treinamento mais avançados foi cancelado, o que significa que, no futuro previsível, o Meta só poderá atender às suas necessidades de treinamento de IA por meio de aquisições externas. Os chips MTIA para inferência conseguem lidar com negócios maduros, como sistemas de recomendação, mas para treinar modelos avançados como o Avocado, que compete com o GPT-5, é necessário usar hardware da NVIDIA ou de nível equivalente.

Em segundo lugar, os concorrentes não esperarão. A OpenAI já obteve recursos massivos da Microsoft, da SoftBank e do fundo soberano dos Emirados Árabes Unidos. A Anthropic garantiu o fornecimento de 1 milhão de chips TPU e Trainium da Google e da Amazon. O Google Gemini 3 foi totalmente treinado em TPU. Se o Meta não conseguir suficiente poder de computação, nem sequer garantirá sua vaga na corrida.

Em terceiro lugar, e talvez o mais fundamental, Zuckerberg precisa compensar a falta de capacidade de pesquisa e desenvolvimento com poder de compra. A falha do Llama 4, a perda de talentos-chave e os contratempos com chips próprios combinados tornaram a narrativa de IA da Meta frágil diante de Wall Street. Assinar grandes contratos com NVIDIA, AMD e Google agora transmite, pelo menos, um sinal: temos dinheiro, estamos comprando, não desistimos.

A estratégia atual da Meta é: se não conseguir resolver o software, destrua o hardware; se não conseguir reter pessoas, compre chips. Mas a competição em IA não é um jogo que se vence apenas assinando cheques. A capacidade de processamento é uma condição necessária, mas não suficiente. Sem uma equipe de modelos de ponta e uma rota técnica clara, quantos chips forem comprados serão apenas estoques caros em armazéns.

O dilema do comprador

Ao olhar para trás nas três transações do Meta em fevereiro, um detalhe interessante foi ignorado pela maioria.

A Meta comprou da NVIDIA os Blackwell atuais e o Vera Rubin futuro; com a AMD, comprou os MI450 e o MI455X futuro; alugou da Google os TPU Ironwood atuais e planeja comprá-los diretamente no próximo ano.

Três fornecedores, três arquiteturas de hardware e ecossistemas de software completamente diferentes.

Isso significa que o Meta precisa alternar constantemente entre três ecossistemas subjacentes totalmente distintos: CUDA da NVIDIA, ROCm da AMD e XLA/JAX do Google. Embora a estratégia de múltiplos fornecedores possa dispersar riscos da cadeia de suprimentos e reduzir prêmios na aquisição de hardware, isso trará um aumento exponencial na complexidade de engenharia.

Essa é exatamente a fraqueza mais mortal atual da Meta: fazer com que um modelo com trilhões de parâmetros seja treinado eficientemente em três conjuntos de hardware com modelos de programação subjacentes completamente diferentes exige mais do que engenheiros que entendam CUDA; exige arquitetos capazes de construir do zero um framework de treinamento multiplataforma.

Há possivelmente menos de 100 pessoas como essa no mundo. Pang Ruoming é uma delas.

Gastar 100 bilhões de dólares para adquirir o conjunto mais complexo de hardware do mundo, ao mesmo tempo em que perde os cérebros capazes de operar esses hardwares, é a cena mais mágica dessa aposta de Zuckerberg.

A aposta de Zuckerberg

Ao ampliar o campo de visão, o caminho de Zuckerberg em relação à IA nos últimos 18 meses é surpreendentemente semelhante ao ritmo com que ele investiu totalmente no metaverso naquela época:

Ver a tendência, investir pesado, contratar em grande escala, enfrentar obstáculos, mudar drasticamente a estratégia e investir pesado novamente.

De 2021 a 2023 foi a metaverso, e a cada ano perdeu bilhões, acabando com a ação caindo de 380 dólares para 88 dólares. De 2024 a 2026 é a IA, com o mesmo gasto desenfreado, reestruturações organizacionais frequentes e a mesma narrativa de “confie em mim, tenho visão”.

Diferentemente disso, o momento atual da IA é realmente muito mais concreto do que o metaverso. E o Meta tem dinheiro para gastar; seu negócio de publicidade gerou fluxo de caixa abundante, com receita do Meta de US$ 59,9 bilhões no quarto trimestre de 2025, um aumento de 24% em relação ao ano anterior.

O problema é que o dinheiro pode comprar chips, pode comprar poder de computação, e até mesmo as pessoas sentadas nas mesas de trabalho, mas não pode comprar as pessoas que ficam.

Pang Ruoming escolheu a OpenAI, Russ Salakhutdinov escolheu sair, e LeCun escolheu empreender.

A aposta atual de Zuckerberg é que, desde que compre suficientes chips, construa data centers grandes o suficiente e gaste dinheiro suficiente, sempre será possível encontrar ou treinar pessoas capazes de usar esses recursos.

Esta aposta pode se sustentar. Afinal, a Meta é uma das empresas de tecnologia mais ricas do mundo, e mais de US$ 100 bilhões em fluxo de caixa operacional é sua fortaleza mais sólida. Desde a OpenAI até a Anthropic, da Google até outros concorrentes, a Meta continua recrutando talentos. Segundo o Quantum Bit, cerca de 40% dos 44 membros da equipe de superinteligência da Meta vêm da OpenAI.

Mas a crueldade das competições de IA é que o poder de computação, a lista de talentos e o desempenho dos modelos são todos públicos; o escândalo de falsificação de benchmark do Llama 4 prova que, nesse setor, não é possível manter a liderança apenas com apresentações e relações públicas.

O mercado só reconhece uma coisa: o seu modelo é bom o suficiente.

Posição na cadeia alimentar

A corrida armamentista de IA entra em 2026, e a hierarquia da cadeia alimentar já está claramente definida:

No topo estão a OpenAI e o Google. A OpenAI possui os modelos mais poderosos, a maior base de usuários e o financiamento mais agressivo. O Google possui integração vertical completa com chips próprios, modelos próprios e infraestrutura de nuvem própria. A Anthropic vem em seguida, consolidada na primeira linha graças à força do produto do modelo Claude e ao suporte de capacidade de processamento da Google e da Amazon.

Meta? Investiu mais dinheiro, assinou mais contratos de chips e realizou as reestruturações organizacionais mais frequentes, mas até agora não lançou um modelo de ponta que convença o mercado.

A história da IA da Meta é um pouco como o Yahoo de 2005. Na época, o Yahoo também era uma das empresas mais ricas da internet, gastando dinheiro freneticamente em aquisições, mas não conseguiu criar um mecanismo de busca como o Google. Dinheiro não é tudo. Zuckerberg precisa refletir sobre o que a Meta realmente quer fazer com IA, em vez de comprar tudo o que estiver em alta.

Claro, ainda é cedo para escrever o obituário do Meta. 3,58 bilhões de usuários ativos mensais, receita trimestral de US$ 59,9 bilhões e o maior conjunto de dados sociais do mundo são ativos que qualquer concorrente tem dificuldade para replicar.

Se o próximo modelo, codinome Avocado, for entregue conforme planejado em 2026 e retornar ao primeiro escalão, todos os gastos e reestruturações de Zuckerberg serão apresentados como “coragem estratégica para reverter a situação”. Mas, se novamente não atingir as expectativas, os 135 bilhões de dólares investidos resultarão apenas em fileiras de waferes de silício aquecidos e energizados.

After all, the AI arms race in Silicon Valley never lacks super buyers waving checks. What’s missing are those who know how to use this computing power to forge the future.