Huawei mencadangkan τ Scaling sebagai enjin pertumbuhan semikonduktor baru di luar Hukum Moore

Dalam 60 tahun terakhir, industri semikonduktor telah mendorong kemajuan dengan memperkecil saiz transistor (Hukum Moore), membuatnya semakin kecil, semakin rapat, dan lebih murah.

Tetapi sekarang jalan ini tidak boleh dilalui:

Keuntungan proses di bawah 7nm merosot tajam
Harga mesin lithography sangat mahal
Kos reka bentuk cip tunggal proses canggih melebihi US$1 bilion
Kos sebatang transistor meningkat, bukan menurun

Pasukan semikonduktor Huawei telah mengesahkan arah baharu dengan 6 tahun dan 381 jenis cip pengeluaran:

Jangan bandingkan saiz, ganti dengan bandingkan masa.

Mengusulkan teori penskalaan τ (τ Scaling):

Jadikan "masa" sebagai indikator utama pengoptimuman, mampatkan masa ciri τ sepanjang keseluruhan laluan, dari suis transistor (pikodetik) hingga tugas pusat data (saat), merangkumi 12 peringkat.

Singkatnya:

Dulu, siapa yang lebih kecil, sekarang siapa yang lebih pantas, latensi lebih rendah, dan kecekapan lebih tinggi.

Apakah sebenarnya τ scaling?

τ ialah latensi / pemalar masa setiap lapisan, terdiri daripada empat lapisan:

Transistor: Kelajuan suis
Litar: Penundaan penghantaran isyarat
Cip: Pengiraan, latensi akses memori
Sistem: Segerakan masa komunikasi hingga ke hujung

Matlamatnya ialah menekan τ secara menyeluruh, di mana proses, litar, arsitektur, dan sistem menggunakan set indikator yang sama untuk pengoptimuman, bukan lagi bekerja secara berasingan.

Dua: Pelaksanaan pada peranti mudah alih: LogicFolding

Tanpa meningkatkan proses, susun cip secara menegak dan gunakan pengikatan campuran ultra-precise untuk membahagikan laluan utama ke pelbagai lapisan, seolah-olah menambahkan tingkat kepada cip.

Kepadatan transistor: satu generasi meningkat dari 155 → 238 juta per mm², meningkat 55%
Kecekapan tenaga: Naik 41%, peningkatan frekuensi utama hampir 13%
Frekuensi SRAM: Naik lebih dari 40%
Kirin 2026 mencapai frekuensi 3.1GHz, sasaran 2029 ialah 4GHz

Tiga: Pelaksanaan pusat data AI: Penurunan latensi sepanjang rantai

80% penggunaan tenaga dan 70% kos kumpulan AI berada dalam pemindahan data, intinya adalah meminimumkan masa komunikasi.

1. Unified Bus

Menghapus lapisan protokol berganda, mengurangkan latensi akses jauh dari beberapa mikro saat ke sekitar 100 nanodetik, 500 kali lebih pantas.

2. Hi-ONE Light Interconnect

Modul tunggal 8 Tb/s, ganti wayar tembaga dengan gentian optik, jarak diperluas dari 1 meter ke 100 meter, sesuai dengan kluster beribu-ribu GPU.

3. Lipatan 3D

Selesaikan masalah “luas meningkat cepat, antaramuka tertinggal” dalam pengepakan 2.5D dengan memindahkan memori, bekalan kuasa, dan port cahaya ke permukaan menegak, serta mengembangkan secara serentak dengan kekuatan pengiraan.

Ramalan: Pada tahun 2035, integrasi peranti keras AI akan meningkat lebih daripada 100 kali

Empat: Penggabungan semula logik dan memori

Pada awalnya, CPU dan memori berkembang secara terpisah, tetapi di era AI, pemindahan data lebih penting daripada pengiraan, sehingga memori dan logik perlu diintegrasikan secara rapat dalam 3D, dengan kekuasaan industri beralih kepada memori dan pembungkusan.

Lima: Cabaran yang tinggal

Alat EDA perlu disesuaikan dengan reka bentuk susunan 3D
Perbezaan proses antara wafer dan kehilangan sambungan vertikal perlu dioptimakan
Perlu diselaraskan dengan piawaian kecekapan dan benchmark baru

Kesimpulan

Zaman saiz Hukum Moore telah berakhir, dan zaman penskalaan masa telah bermula.

Tidak perlu memaksakan diri mendapatkan mesin litografi paling canggih; dengan stacking 3D, arsitektur sistem, dan pengoptimuman interkoneksi, anda masih boleh terus meningkatkan prestasi dan kecekapan.

Ini akan menjadi garis panduan utama semikonduktor dalam 10 tahun ke depan.