Huawei propõe τ Scaling como novo motor de crescimento para semicondutores além da Lei de Moore

Nos últimos 60 anos, a indústria de semicondutores impulsionou o progresso reduzindo o tamanho dos transistores (Lei de Moore), tornando-os cada vez menores, mais densos e com custos mais baixos.

Mas agora não é mais possível seguir por este caminho:

Lucros com processos abaixo de 7nm caíram drasticamente
Custo da máquina de litografia é astronômico
O custo de design de um único chip em processo avançado supera 1 bilhão de dólares
O custo por transistor aumentou em vez de diminuir

A equipe de semicondutores da Huawei validou uma nova direção com 6 anos e 381 chips em produção:

Não compare tamanhos, compare tempo.

Propor a teoria de escala τ (τ Scaling):

Trate o "tempo" como o indicador central de otimização, comprimindo o tempo característico τ em toda a cadeia, desde a chave de transistores (picosegundos) até tarefas em data centers (segundos), abrangendo 12 ordens de grandeza.

Em poucas palavras:

Antes, era sobre quem era menor; agora, é sobre quem é mais rápido, com menor latência e maior eficiência.

I. O que é exatamente o τ scaling?

τ é o atraso / constante de tempo de cada camada, dividido em quatro camadas:

Transistor: velocidade de comutação
Circuito: Atraso na transmissão do sinal
Chip: computational and memory access latency
Sistema: Sincronização de tempo de comunicação ponto a ponto

O objetivo é otimizar conjuntamente toda a pilha, usando o mesmo conjunto de métricas para工艺, circuitos, arquitetura e sistema, em vez de cada um trabalhar isoladamente.

II. Implementação no dispositivo móvel: LogicFolding

Sem aprimorar o processo, empilhe os chips verticalmente e use ligações híbridas ultra-precisas para distribuir as rotas críticas em várias camadas, equivalente a “adicionar andares” ao chip.

Densidade de transistores: de 155 para 238 milhões por mm², aumento de 55%
Eficiência energética: aumento de 41%, frequência principal aumentada em cerca de 13%
SRAM frequency: up more than 40%
Kirin 2026 atinge 3,1 GHz, meta de 4 GHz para 2029

III. Implementação do data center de IA: latência minimizada em toda a cadeia

80% do consumo de energia e 70% dos custos do cluster de IA estão na transferência de dados; o foco principal é reduzir o tempo de comunicação.

1. Unified Bus

Elimine a camada de protocolo múltipla e reduza a latência de acesso remoto de dezenas de microssegundos para cerca de 100 nanosegundos, 500 vezes mais rápido.

2. Hi-ONE Light Interconnection

Módulo único de 8 Tb/s, substituição de cabo de cobre por fibra óptica, alcance expandido de 1 metro para 100 metros, compatível com clusters de milhares de GPUs.

3. Dobramento 3D

Resolver o problema do encapsulamento 2.5D, em que a área cresce rapidamente enquanto as interfaces não acompanham, movendo a memória, a alimentação e as portas ópticas para a superfície vertical, dimensionando-as em sincronia com a capacidade de processamento.

Previsão: A integração de hardware de IA aumentará mais de 100 vezes até 2035

Quatro: Reintegração de lógica e memória

Nos anos iniciais, CPU e memória evoluíram separadamente; agora, na era da IA, o transporte de dados é mais crítico do que o cálculo, exigindo uma integração 3D próxima entre memória e lógica, deslocando o poder da cadeia de suprimentos em direção à memória e ao empacotamento.

V. Os desafios restantes

As ferramentas EDA devem ser compatíveis com projetos de empilhamento 3D
Os diferenciais de processo entre wafers e as perdas de interconexão vertical precisam ser otimizados.
Para acompanhar os novos padrões de eficiência energética e benchmark

Conclusão

A era do tamanho da Lei de Moore terminou; a era da escala temporal começou.

Não é necessário se prender à máquina de litografia mais avançada; ainda é possível melhorar continuamente desempenho e eficiência energética por meio de empilhamento 3D, arquitetura de sistema e otimização de interconexões.

Esta será a rota principal dos semicondutores nos próximos 10 anos.