NVIDIA Rubin SOCAMM Memory Cut Gera Pânico no Mercado e Queda do MU

Artigo escrito por Corrente de Pesquisa

Em 4 de junho, à noite, o instituto de pesquisa independente mais influente da indústria de semicondutores, SemiAnalysis, publicou um boletim matinal.

A informação central é apenas uma frase: A capacidade de DRAM SOCAMM por gabinete da NVIDIA Vera Rubin NVL72 pode cair de cerca de 55 TB para cerca de 28 TB em relação às expectativas anteriores. A maioria dos sistemas Rubin utilizará módulos SOCAMM de 96 GB, em vez dos 192 GB amplamente esperados anteriormente pelo mercado.

Após a notícia se espalhar, a reação do mercado foi direta e brutal: a demanda por memória foi reduzida pela metade, um golpe para Micron. O MU caiu mais de 10% durante o pregão, desabando de seu recorde histórico de US$ 1.089 alcançado no dia anterior para US$ 971, perdendo mais de US$ 100 bilhões em valor de mercado em um único dia.

O pânico é real, mas a questão é: a direção do pânico está correta?

Primeiro, deixe as contas claras

Vera Rubin NVL72 é o próximo supercomputador de topo da NVIDIA. Cada rack contém 72 GPUs Rubin e 36 CPUs Vera. As GPUs utilizam HBM4, com 288 GB cada, totalizando cerca de 20,7 TB por rack — essa parte permanece inalterada. A mudança está na parte da CPU.

Cada CPU Vera possui 8 slots SOCAMM, cada um dos quais pode acomodar módulos de diferentes capacidades. As especificações oficiais divulgadas pela NVIDIA na CES 2026 são de "até 1,5 TB de LPDDR5X por CPU Vera", correspondendo à configuração com todos os 8 módulos de 192 GB instalados. Com 36 CPUs, isso totaliza 54 TB.

O relatório da SemiAnalysis afirma que a configuração real de saída provavelmente não estará totalmente preenchida. A maioria dos sistemas usará módulos de 96 GB, 8 × 96 GB = 768 GB por CPU, e 36 CPUs resultam em aproximadamente 28 TB.

De 55 TB para 28 TB, a capacidade foi reduzida em quase metade; os títulos sensacionalistas escrevem isso como "a exigência de memória foi reduzida à metade".

Mas o mercado errou uma variável chave nessa conta.

Lógica falha do pânico

Primeiro, o SOCAMM é projetado com encaixe, não é soldado.

Este é o detalhe técnico mais facilmente ignorado em toda a história. Diferentemente do GB300 Blackwell Ultra, que possui LPDDR soldada diretamente na placa-mãe, a plataforma Vera Rubin utiliza módulos SOCAMM2 padronizados pela JEDEC, removíveis, substituíveis em quente e atualizáveis posteriormente. Hoje, insira 96 GB; amanhã, se o cliente precisar, retire e troque por 192 GB ou até 256 GB, tão simples quanto trocar um módulo de memória.

A NVIDIA destacou esse design especificamente na CES 2026: o tempo de montagem de todo o painel de computação foi reduzido de 2 horas para 5 minutos. A modularidade, manutenibilidade e atualizabilidade são uma das maiores evoluções arquiteturais da Vera Rubin em comparação com o Blackwell.

Reduzir a configuração inicial de venda não significa que a demanda desapareceu permanentemente. É mais como uma estratégia de "embarcar primeiro e pagar depois".

Em segundo lugar, a razão para a redução da capacidade não é a falta de necessidade, mas sim "não ser suficiente".

O fundador da SemiAnalysis, Dylan Patel, disse em um tweet uma frase significativa: “Gosto muito de uma coisa: as pessoas que compartilham nosso relatório deixam de fora a maior parte do conteúdo. Isso acontece com frequência.”

Os comentários dos leitores no Digg sobre esta notícia também são muito esclarecedores: 77,8% dos comentários consideram que a disseminação secundária é um clickbait distorcido.

O que foi esquecido? O contexto.

A oferta global de LPDDR5X em 2026 estará extremamente apertada. A Micron afirmou claramente na reunião da Wolfe em finais de maio que a demanda por memória supera significativamente a capacidade de fornecimento, e essa situação deve persistir além de 2026. A capacidade total de HBM da Micron para o ano fiscal de 2026 já foi esgotada, o preço médio do DRAM aumentou mais de 110% em relação ao ano anterior, e a margem bruta atingiu 74%. A Samsung e a SK Hynix também estão operando em plena capacidade com venda total da produção.

Nesse contexto, o problema enfrentado pela NVIDIA não é que os clientes não queiram mais memória, mas sim “não consigo obter tantos chips LPDDR5X para preencher cada slot”.

Reduzir a configuração padrão de SOCAMM por rack é, essencialmente, um gerenciamento de cadeia de suprimentos em nível de engenharia: em vez de atrasar a entrega de todo o rack por falta de memória, é preferível enviar com uma configuração mais baixa para que a capacidade de processamento entre em operação o mais rápido possível.

Este não é um sinal de contração da demanda; pelo contrário, é um sinal de que a demanda está superando a oferta.

Terceiro, menos memória ≠ menos rack.

O mercado fez uma multiplicação simples: reduzir a memória por rack pela metade → reduzir a demanda total pela metade. Mas esta equação tem outra variável: o volume de envios.

Se cada rack de SOCAMM for reduzido de 55 TB para 28 TB, a NVIDIA poderá montar mais racks sob as mesmas restrições de fornecimento de LPDDR5X. Anteriormente, um lote de memória era suficiente para apenas 100 racks; agora, é suficiente para quase 200.

O consumo total de LPDDR5X não diminuiu, apenas foi distribuído para mais racks. Para a NVIDIA, essa é uma escolha prática para levar o Rubin ao mercado mais rapidamente; para os fabricantes de memória, o volume total de pedidos pode não diminuir.

Além disso, a demanda por memória no lado CPU para cenários de inferência é muito flexível. Nem todas as cargas de trabalho precisam de 1,5 TB de LPDDR5X. O treinamento de grandes modelos consome muita memória, mas muitas tarefas de inferência, especialmente agentic AI e inferência com longos contextos, podem ajustar dinamicamente o KV cache entre HBM e LPDDR por meio do NVLink-C2C. Para muitos clientes, 768 GB de memória no lado CPU já são suficientes.

Por que a Micron ainda caiu 10%?

Porque a SemiAnalysis é apenas a segunda palha que quebra as costas do camelo.

A última gota foi a Broadcom. Antes da abertura do mercado norte-americano em 4 de junho, a Broadcom divulgou seus resultados do Q2. Os números em si não eram ruins: receita de US$ 22,19 bilhões, um aumento de 48% em relação ao ano anterior, e EPS Non-GAAP de US$ 2,44, acima das expectativas. Mas o CEO, Hock Tan, não elevou a previsão anual de receita de chips de IA para US$ 100 bilhões, e o mercado considerou isso "insuficiente". A ação da Broadcom despencou 15%, arrastando todo o setor de semicondutores para uma queda generalizada.

A Micron não teve nenhuma notícia negativa corporativa no dia. Múltiplas mídias, como TipRanks, Motley Fool e 24/7 Wall St., esclareceram que se tratou de uma queda em cadeia. A Micron, como ativo central na cadeia de memória para IA, está fortemente ligada ao sentimento sobre gastos de capital em IA; as orientações da Broadcom levaram o mercado a reavaliar as expectativas de crescimento para toda a cadeia de chips de IA.

O relatório da SemiAnalysis se espalhou no mesmo dia, fornecendo aos traders que já buscavam razões para vender uma narrativa perfeita: não apenas o sentimento geral de IA havia enfraquecido, mas também os números específicos da demanda por memória estavam diminuindo.

Uma ação com capitalização de mercado de um trilhão de dólares, que subiu 900% no último ano e acabou de atingir uma nova máxima no dia anterior. Neste ponto, qualquer título negativo é um catalisador para tomar lucros. O pânico não precisa estar correto, apenas precisar de uma desculpa.

Interpretação da corrente

Três julgamentos.

Primeiro, o relatório da SemiAnalysis em si é preciso, mas a interpretação do mercado está errada. A configuração padrão do Rubin NVL72 para SOCAMM provavelmente estará de fato abaixo do máximo teórico, determinada pela realidade da cadeia de suprimentos e pela elasticidade da demanda dos clientes. Mas entre "configuração padrão reduzida" e "encolhimento da demanda por memória", existe uma arquitetura modular com módulo upgradeável e uma realidade industrial em que a demanda excede amplamente a oferta.

Em segundo lugar, o risco principal da Micron atualmente não está no SOCAMM, mas no HBM4. Em fevereiro deste ano, a SemiAnalysis relatou que, nas encomendas da plataforma Rubin da NVIDIA para HBM4, a participação da Micron foi de zero, com a SK Hynix detendo 70% e a Samsung 30%. Embora a Micron tenha anunciado em março a produção em massa e o envio do HBM4, sua participação de mercado é esperada em apenas 18%. Por outro lado, a posição da Micron no campo SOCAMM é muito sólida: ela foi a primeira empresa a lançar o SOCAMM2 de 256 GB e tem sido parceira central da NVIDIA nas soluções SOCAMM nos últimos cinco anos. A redução na configuração do SOCAMM tem um impacto real muito menor sobre a Micron do que a marginalização de sua participação no HBM4.

Em terceiro lugar, a natureza desta queda é um realinhamento de lucros em uma ação de trilhões de dólares após atingir um novo recorde histórico, amplificada por dois catalisadores independentes. Broadcom forneceu um impacto emocional, enquanto a SemiAnalysis forneceu material narrativo. A combinação dos dois fez uma ação que subiu nove vezes nos últimos 12 meses recuar 10%. Do ponto de vista da negociação, isso não é chamado de "pânico"; isso é chamado de "normal".

Dylan Patel está certo nesse tweet: a maioria das pessoas que compartilharam seu relatório realmente ignorou a parte mais importante do relatório.

A coisa mais perigosa em investir em semicondutores não é errar a direção, mas acertar o título e errar a fórmula.