Huawei Mengusulkan τ Scaling sebagai Mesin Pertumbuhan Semikonduktor Baru di Luar Hukum Moore

Selama 60 tahun terakhir, industri semikonduktor telah mendorong kemajuan dengan memperkecil ukuran transistor (Hukum Moore), membuatnya semakin kecil, semakin padat, dan biaya semakin rendah.

Tapi sekarang jalan ini tidak bisa dilanjutkan:

Pendapatan proses di bawah 7nm anjlok
Biaya mesin lithography sangat mahal
Biaya desain chip proses maju melebihi 1 miliar dolar AS
Biaya per transistor naik, bukan turun

Tim semikonduktor Huawei telah membuktikan arah baru melalui 6 tahun dan 381 jenis chip produksi massal:

Jangan berlomba-lomba dalam ukuran, ganti dengan berlomba-lomba dalam waktu.

Mengusulkan teori τ scaling:

Jadikan "waktu" sebagai indikator optimasi utama, kurangi waktu fitur τ secara menyeluruh, dari saklar transistor (pikodetik) hingga tugas pusat data (detik), mencakup 12 tingkat besaran.

Singkatnya:

Dulu yang lebih kecil menang, sekarang yang lebih cepat, latensi lebih rendah, dan efisiensi lebih tinggi.

Apa itu τ scaling?

τ adalah delay/time constant masing-masing lapisan, terdiri dari empat lapisan:

Transistor: Kecepatan Saklar
Sirkuit: Latensi transmisi sinyal
Chip: Komputasi, latensi akses memori
Sistem: Sinkronisasi waktu komunikasi end-to-end

Tujuannya adalah mengoptimalkan seluruh stack secara bersama-sama dengan τ, menggunakan satu set indikator yang sama untuk proses, sirkuit, arsitektur, dan sistem, bukan lagi bekerja secara terpisah.

Dua: Peluncuran di perangkat seluler: LogicFolding

Tanpa meningkatkan proses, chip ditumpuk secara vertikal, dan ikatan campuran ultra-precise digunakan untuk mendistribusikan jalur kritis ke beberapa lapisan, seolah-olah menambahkan lantai ke chip.

Kepadatan transistor: dari 155 → 238 juta per mm², meningkat 55%
Efisiensi energi: naik 41%, frekuensi utama meningkat hampir 13%
Frekuensi SRAM: Naik lebih dari 40%
Kirin 2026 mencapai frekuensi 3,1 GHz, target 4 GHz pada 2029

Tiga: Penerapan Pusat Data AI: Latensi Ditekan Secara End-to-End

80% konsumsi energi dan 70% biaya klaster AI berada pada pemindahan data, intinya adalah meminimalkan waktu komunikasi.

Unified Bus

Menghilangkan lapisan protokol ganda, menurunkan latensi akses jarak jauh dari puluhan mikrodetik menjadi sekitar 100 nanodetik, 500 kali lebih cepat.

2. Hi-ONE Optical Interconnect

Modul tunggal 8 Tb/s, ganti kabel tembaga dengan serat optik, jarak diperluas dari 1 meter menjadi 100 meter, kompatibel dengan klaster ribuan GPU.

3. Lipat 3D

Menyelesaikan masalah “area meningkat cepat, antarmuka tertinggal” pada封装 2.5D, pindahkan memori, daya, dan port optik ke permukaan vertikal, dan skala sesuai dengan peningkatan daya komputasi.

Prediksi: Integrasi perangkat keras AI meningkat lebih dari 100 kali pada tahun 2035

Empat, Reintegrasi Logika dan Memori

Di masa awal, CPU dan memori berkembang secara terpisah, tetapi di era AI saat ini, pemindahan data lebih penting daripada komputasi, sehingga memori dan logika harus diintegrasikan secara ketat dalam 3D, dengan kekuatan industri beralih ke memori dan packaging.

Lima: Tantangan yang tersisa

Alat EDA harus disesuaikan dengan desain stack 3D
Perbedaan proses antar wafer dan kerugian interkoneksi vertikal perlu dioptimalkan
Harus disesuaikan dengan standar efisiensi energi dan Benchmark baru

Kesimpulan

Era ukuran hukum Moore berakhir, era penskalaan waktu dimulai.

Tidak perlu terpaku pada mesin lithografi paling canggih, dengan stacking 3D, arsitektur sistem, dan optimasi interkoneksi, kinerja dan efisiensi energi tetap dapat terus ditingkatkan.

Ini akan menjadi jalur inti semikonduktor dalam 10 tahun ke depan.