Huawei propone τ Scaling como nuevo motor de crecimiento para semiconductores más allá de la Ley de Moore

icon MarsBit
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
El equipo de semiconductores de Huawei ha propuesto τ Scaling, un nuevo marco para mejorar el rendimiento mediante la eficiencia temporal, no el tamaño de los transistores. Después de seis años de investigación y pruebas en 381 chips, el equipo redujo las constantes de tiempo (τ) en 12 órdenes de magnitud, desde transistores hasta centros de datos. LogicFolding está dirigido a chips móviles, mientras que Unified Bus e interconexiones ópticas Hi-ONE buscan infraestructura de IA. El método mejora el rendimiento, la eficiencia energética y la escalabilidad sin lithografía avanzada. A medida que las regulaciones CFT se endurecen, el enfoque de Huawei podría influir en la liquidez de los mercados de criptomonedas al permitir una infraestructura de cadena de bloques más eficiente.

Durante los últimos 60 años, la industria de semiconductores ha impulsado el progreso reduciendo el tamaño de los transistores (ley de Moore), haciéndolos cada vez más pequeños, densos y económicos.

Pero ahora este camino ya no es posible:

  • Los beneficios de los procesos por debajo de 7 nm se han desplomado
  • El costo de la fotolitografía es astronómico
  • El costo de diseño de un solo chip con proceso avanzado supera los 1.000 millones de dólares.
  • El costo por transistor aumenta en lugar de disminuir

El equipo de semiconductores de Huawei ha validado una nueva dirección con 6 años y 381 chips en producción:

No se trata de tamaño, sino de tiempo.

Proponer la teoría de escalamiento τ (τ Scaling):

Trate el "tiempo" como el indicador clave de optimización, comprimiendo el tiempo característico τ en toda la cadena, desde el interruptor de transistores (picosegundos) hasta las tareas del centro de datos (segundos), abarcando 12 órdenes de magnitud.

En resumen:

Antes se comparaba quién era más pequeño, ahora se compara quién es más rápido, con menor latencia y mayor eficiencia.

¿Qué es exactamente la escala τ?

τ es el retardo / constante de tiempo de cada capa, dividido en cuatro capas:

  • Transistor: switching speed
  • Circuito: Retraso en la transmisión de la señal
  • Chip: Cómputo, latencia de acceso a memoria
  • Sistema: Sincronización de tiempo de extremo a extremo

El objetivo es optimizar conjuntamente toda la pila: procesos, circuitos, arquitectura y sistema, utilizando las mismas métricas, en lugar de trabajar por separado.

II. Implementación en móvil: LogicFolding

Sin mejorar el proceso, apilar los chips verticalmente y utilizar una unión híbrida ultra precisa para distribuir las rutas críticas en múltiples capas, equivalente a agregar pisos al chip.

  • Densidad de transistores: de 155 a 238 millones por mm², un aumento del 55%
  • Eficiencia energética: +41%, frecuencia principal aumentada en casi un 13%
  • Frecuencia SRAM: sube más del 40%
  • Kirin alcanza 3.1 GHz en 2026, con objetivo de 4 GHz para 2029

Tres: Implementación del centro de datos de IA: latencia minimizada en toda la cadena

El 80 % del consumo energético y el 70 % de los costos del clúster de IA están en la transferencia de datos; el núcleo es reducir el tiempo de comunicación.

1. Unified Bus

Eliminación de múltiples protocolos, reduciendo la latencia de acceso remoto de decenas de microsegundos a aproximadamente 100 nanosegundos, 500 veces más rápido.

2. Hi-ONE Light Interconnection

Módulo único de 8 Tb/s, reemplazo de cable de cobre por fibra óptica, distancia extendida de 1 metro a 100 metros, compatible con clústeres de miles de GPUs.

3. Plegado 3D

Resolver el problema del encapsulado 2.5D, donde el área crece rápidamente pero las interfaces no siguen el ritmo, trasladando la memoria, la alimentación y los puertos ópticos a la superficie vertical para escalar junto con la capacidad de cómputo.

  • Predicción: En 2035, la integración de hardware de IA aumentará más de 100 veces.

Cuatro: Reintegración de lógica y memoria

En los primeros años, la CPU y la memoria evolucionaron por separado; ahora, en la era de la IA, mover datos es más crucial que el cálculo, por lo que la memoria y la lógica deben integrarse estrechamente en 3D, y el poder en la cadena de suministro se desplaza hacia la memoria y el empaquetado.

V. Los desafíos restantes

  • Las herramientas EDA deben adaptarse al diseño apilado en 3D
  • Se deben optimizar las diferencias de proceso entre obleas y las pérdidas por interconexión vertical.
  • Para complementar los nuevos estándares de eficiencia energética y Benchmark

Conclusión

Ha terminado la era de la escala de la ley de Moore, y ha comenzado la era de la escala temporal.

No necesitas insistir en la máquina de litografía más avanzada; con apilamiento 3D, arquitectura de sistema y optimización de interconexiones, aún puedes mejorar continuamente el rendimiento y la eficiencia energética.

Esta será la línea principal de la industria de semiconductores en los próximos 10 años.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.