AI China tertinggal daripada AS dalam akses kepada cip latihan kelas tinggi dan kuasa pengiraan

Kekurangan kuasa pengiraan

Sejak akhir tahun lalu, GPU tempatan seperti Moore Threads, Muxi Shares, Biren Technology, dan TianShu Intelligent Chip telah memicu gelombang modal. Namun, di bawah pesta kekayaan pasaran sekunder, satu garisan gelap yang tidak boleh diabaikan semakin jelas, dan isu yang timbul daripadanya semakin mendesak.

Dalam beberapa tahun terakhir, cip AI buatan tempatan terutamanya berfokus pada tugas "inferens" yang相对安全 dan lebih tepi, seperti pelan DouBao baru-baru ini yang merancang pembelian 50,000 cip TianShu ZhiXin untuk tugas inferens, bagi memenuhi permintaan frekuensi tinggi daripada aplikasi AI terbesar di China.

Dalam urutan puncak piramida kekuatan pengiraan untuk latihan AI, cip tempatan semasa ini hanya mampu terlibat dalam tugas-tugas sisi yang bersifat membantu.

Cip latihan AI terutama digunakan untuk melatih model kecerdasan buatan, di mana berlaku banyak operasi matriks dan penyesuaian parameter, oleh itu ia memerlukan keupayaan pengiraan yang kuat dan nisbah kecekapan tenaga yang tinggi, dengan prestasi yang lebih canggih dan harga yang sangat mahal, seperti NVIDIA A100, H100, H200, dan siri AMD MI300;

Sebaliknya, tugas cip inferens adalah lebih ringan. Digunakan dalam fasa penghantaran selepas latihan model, ia terutamanya bertanggungjawab menjalankan tugas inferens model, dengan keperluan tinggi terhadap ketepatan masa; cip inferens perlu mempunyai ciri-ciri respons pantas dan penggunaan kuasa rendah sambil menjamin ketepatan.

Perbandingan yang sesuai ialah, latihan membuat model AI "mempelajari pengetahuan", manakala inferens membuat model besar "menggunakan pengetahuan". Dalam peringkat pembelajaran, cip latihan perlu memanggil data dalam jumlah besar untuk "memberi makan" pembaruan dinamik parameter berukuran miliaran, trilion, atau bahkan sepuluh trilion, tidak hanya memerlukan kekuatan pengiraan yang hebat, tetapi juga konfigurasi lebar pita dan kemampuan komunikasi yang cekap, serta menjamin kestabilan di bawah kluster beribu-ribu kad.

Kesenjangan model China dan Amerika Serikat berakar pada tempat-tempat "tak terlihat" ini, terutama ketiadaan cip latihan high-end.

Di bawah hukum Scaling Law model besar, semakin besar parameter model, semakin meningkat secara linear keperluan komputasi, sementara kos pengeluaran komputasi dan peranti keras yang meledak secara eksponen menjadikan latihan model besar sebagai "permainan eksklusif" hanya untuk segelintir raksasa teknologi.

Di antara raksasa teknologi Amerika, Meta sahaja merancang untuk melabur lebih daripada 1.2 juta unit GPU kelas atas pada akhir 2026, dengan perbelanjaan tahunan melebihi US$145 bilion; menurut pengiraan, jumlah kuasa pengkomputeran AI yang dimiliki oleh Google setara dengan 5 juta unit NVIDIA H100, dengan satu syarikat sahaja menyumbang seperempat daripada jumlah global.

Empat syarikat—Amazon, Microsoft, Alphabet, dan Meta—mengeluarkan perbelanjaan modal sebanyak US$725 bilion pada tahun ini, meningkat 77% secara tahunan, setara dengan 13% daripada jumlah keseluruhan pelaburan domestik swasta Amerika Syarikat untuk setahun. Morgan Stanley juga meramalkan bahawa pada tahun 2027, perbelanjaan modal syarikat teknologi Amerika Syarikat berpotensi mencapai rekod sejarah US$1.1 trilion.

Sekarang, Amerika Syarikat menguasai lebih daripada 70% GPU kelas atas global, dan selepas larangan cip, cip kelas atas yang boleh digunakan di dalam negara hanya 1/8 daripada jumlah di Amerika. Laporan Stanford AI Index Report 2026 menyatakan bahawa bilangan pusat data di Amerika Syarikat (5,427) adalah lebih daripada 10 kali ganda jumlah di China.

Menurut pengiraan Akademi Informasi dan Komunikasi China (CAICT), pada awal 2025, skala komputasi Amerika Serikat adalah 2400 EFLOPS, sementara China 1053 EFLOPS, dengan Amerika Serikat lebih dari dua kali ganda China.

Kekuatan pengiraan yang dimiliki oleh empat raksasa teknologi tersebut, masing-masing, sudah melebihi jumlah keseluruhan perusahaan AI di China.

Kelebihan kuasa pengiraan yang telak ini membolehkan perusahaan Amerika menyelesaikan lebih daripada sepuluh putaran eksperimen iterasi model besar dalam satu tahun.

Musk pula lebih mewah lagi, dengan xAI miliknya yang memiliki Colossus 2, yang diklaim sebagai kumpulan AI GW pertama di dunia. Oleh sebab itu, dia berani menyatakan bahawa sedang melatih tujuh model secara serentak—dua model dengan 1 trilion parameter, dua model dengan 1.5 trilion parameter, satu model dengan 6 trilion parameter, dan satu model dengan 10 trilion parameter; “estetika kekerasan” semacam ini hanya mungkin dilakukan apabila kuasa pengiraan sangat mencukupi.

Sementara itu, akibat pengawasan eksport semikonduktor oleh Amerika Syarikat, bahagian perusahaan China dalam chip AI high-end yang dihantar dalam beberapa tahun terakhir terus menurun (berdasarkan statistik epoch.AI).

Dapat dikatakan tanpa berlebihan, jurang besar dalam kapasiti pengiraan akan menyebabkan AI China terus berada dalam fasa mengejar, serta membuat proses model besar tempatan menyusul rakan sebaya Amerika menjadi lebih sukar.

Perbezaan antara generasi

Langkah inovasi China tidak dapat dihentikan, "siapa pun yang berpikir China tidak mampu membuat (chip) benar-benar salah menilai. Kesenjangan antara China dan Amerika Serikat hanyalah dalam tingkat nanodetik."

Pendiri NVIDIA, Jensen Huang, telah berulang kali memuji kemajuan semikonduktor China di forum awam.

Elon Musk juga sering menyampaikan pandangan serupa di X — “China pasti akan menyelesaikan masalah ketergantungan pada chip, dan di bidang kekuatan komputasi AI, pasti akan jauh melampaui negara-negara lain di dunia”, “China akan memenangkan perlombaan AI di Bumi”.

Tokoh-tokoh terkenal di dunia teknologi memuji perkembangan AI China dengan sangat berlebihan, sehingga mudah membuat orang percaya. Ucapan-ucapan ini jelas memiliki nada mempromosikan secara berlebihan hingga menyebabkan kehancuran. Sebahagian media Amerika terus-menerus menyebarkan opini bahawa jurang antara model China dan Amerika sangat kecil, cuba mengaburkan fakta dan menyembunyikan beberapa kebenaran objektif.

Untuk ini, semua bidang AI di dalam negara harus tetap tenang dan bijak.

Jika kini model besar canggih China tidak banyak berbeza dengan pesaing Amerika dalam menyelesaikan masalah standardisasi, maka jurangnya akan menjadi lebih jelas dalam persekitaran industri dan perniagaan yang kompleks.

Berbanding dengan model canggih dari perusahaan Amerika seperti Anthropic, China masih merupakan pengejar. Penilaian CAISI Amerika menyatakan bahawa DeepSeek V4 Pro terkuat di dalam negara tertinggal sebanyak 8 bulan daripada model terkini Amerika.

Li Ka-shing baru-baru ini menunjukkan dalam temu bual dengan The Wall Street Journal bahawa, dengan model terkemuka Amerika seperti Claude Fable 5 yang dilancarkan oleh Anthropic sebagai tolok ukur, Amerika kini memimpin China sebanyak 15 bulan.

Model besar mengikuti hukum Scaling, semakin besar jumlah parameter model, semakin banyak data latihan, dan semakin besar daya komputasi yang dikerahkan, semakin baik prestasi model tersebut. Kini, model besar paling mutakhir di Amerika telah memasuki era parameter sepuluh triliun, dan kecepatan iterasinya terus mempercepat.

Anthropic telah mencapai Mythos paling kuat dengan 10 triliun parameter, dan melatihnya memerlukan biaya 10 miliar dolar AS; xAI sedang melatih 7 model secara serentak dengan Colossus 2, termasuk model dengan 6 triliun dan 10 triliun parameter; OpenAI hanya memerlukan satu bulan untuk mengiterasi model dengan 4 triliun parameter.

Model terkuat China, DeepSeek V4 Pro, mempunyai jumlah parameter sebanyak 1.6 trilion, berbeza sekitar 6 kali ganda dengan frontier Amerika yang berukuran sepuluh trilion.

Siri Claude di Anthropic telah diakui sebagai model AI pemrograman terkuat dalam dua tahun terakhir, sementara Mythos sekali lagi memperbaharui persepsi awam, dengan prestasi yang lebih kuat berbanding model unggulan sebelumnya, Oups 4.6.

OpenBSD dikenali di industri sebagai sistem paling selamat, tetapi Mythos berjaya menemui lubang keamanan yang tidak dikesan selama 27 tahun, serta mencari lubang keamanan yang tidak dikesan selama beberapa tahun hingga puluhan tahun dalam FFmpeg dan kernel Linux, semuanya ditemui secara autonom tanpa bergantung kepada manusia.

Perlu diketahui, "pra-pelatihan" model besar menentukan hadapan kemampuan model, dan tidak mungkin melalui "pelatihan selepas" untuk menyesuaikan model dengan parameter triliunan hingga mencapai tahap kemampuan model dengan parameter sepuluh triliun. Faktor penentu pra-pelatihan ialah cip komputasi berprestasi tinggi, yang menentukan skala parameter dan kelajuan iterasi pelatihan.

Ketua Eksekutif iFlytek, Liu Qingfeng, secara terus terang mengatakan bahawa semua pembesar model besar terkemuka, terutamanya raksasa Amerika, sedang membina platform komputasi berskala super besar. Sementara itu, komputasi tempatan memang menghadapi masa kesukaran, yang menyebabkan had dalam melatih konteks teks sangat panjang.

Terlihat bahawa perbezaan kuasa pengiraan adalah punca perbezaan model antara China dan Amerika Syarikat.

Kebangkitan tempatan

Sebuah perusahaan menguasai 90% pasaran cip latihan AI kelas atas global—ini membantu NVIDIA mempertahankan takhta sebagai syarikat dengan nilai pasaran terbesar di dunia. Nilai pasaran keseluruhannya pernah melebihi GDP Jerman, ekonomi terbesar ketiga di dunia pada tahun 2025.

Data dari TrendForce menunjukkan bahawa pada Q1 2026, NVIDIA menguasai 68% pasaran server GPU global, AMD memegang 5%-6%, manakala pengeluar GPU tempatan keseluruhan kurang daripada 4%.

Dengan keunggulan pertama, rintangan teknikal yang kuat, penghubungan berkelajuan tinggi, ekosistem perisian, serta kerjasama dengan proses canggih TSMC, NVIDIA menguasai pasaran sepenuhnya. Dalam skenario latihan high-end, prestasi NVIDIA GB300 lebih unggul berbanding AMD MI325, serta lebih baik daripada Cambricon Siyuan 690 dan Moore Threads MTT40, terutamanya dalam latihan model besar dengan parameter triliunan, prestasinya 30% lebih tinggi daripada pesaing.

Di bawah larangan eksport, Huang Renxun sebelum ini telah menyatakan bahawa pangsa pasaran NVIDIA di China (bahagian baharu) hampir habis, hanya meninggalkan pasaran sedia ada. Di bawah dasar penggantian tempatan, syarikat-syarikat seperti Huawei Ascend 910, Higon DCU Shen Suan No. 2, Cambricon MLU370/590, serta Moore dan Muxi, telah muncul berturut-turut.

Di antaranya, Ascend 910 adalah chip kekuatan pemprosesan terkuat Huawei, dengan kekuatan pemprosesan Ascend 910B mencapai 640TOPS (INT8), setara dengan chip NVIDIA A100.

Dari segi prestasi mutlak, GPU tempatan masih memiliki jurang, tetapi boleh bermula dengan skenario inferens dan tepi. Saat ini, GPU tempatan secara umum memenuhi keperluan inferens awam kerajaan dan perniagaan di dalam negara, dengan jurang berbanding produk pertengahan NVIDIA berkurang kepada 15%-20%, menjadikannya layak untuk menggantikan.

Perlu ditekankan bahawa, walaupun prestasi pengiraan penting, ekosistem perisian teknologi di sebaliknya adalah kelemahan utama GPU tempatan. Seperti yang ditunjukkan oleh Akademik Kebangsaan China Zheng Weimin, masalah utama cip AI tempatan ialah ekosistem yang tidak cukup baik; jika ekosistemnya baik, orang akan menggunakannya walaupun prestasinya hanya 60%.

Boleh dikatakan bahawa ekosistem perisian adalah halangan paling ketat di lintasan GPU, dan kemampuan NVIDIA di bidang ini juga sukar digantikan.

Ekosistem CUDA telah diperdalam selama lebih dari sepuluh tahun, dan kini memiliki lebih dari 4 juta pembangun, puluhan ribu model sumber terbuka, serta rantai alat pihak ketiga lengkap, mencakup latihan AI, inferensi, render grafik, dan pengiraan saintifik, dengan rintangan ekosistem yang tak tertandingi.

Data dari IDC menunjukkan bahawa lebih daripada 95% model AI di seluruh dunia dibangunkan berdasarkan ekosistem CUDA. Sementara itu, GPU tempatan, dengan sokongan dasar, perlu bekerjasama secara jangka panjang dengan rantai nilai, serta memerlukan kesabaran yang mencukupi daripada media dan pasaran modal.

Pada Januari tahun ini, Zhipu bekerjasama dengan Huawei untuk melepaskan model generasi gambar terbaru, GLM-Image, yang dibangun di atas peranti Huawei Ascend Atlas 800T A2 dan kerangka kerja AI Ascend MindSpore, menyelesaikan siklus tertutup penuh dari pemprosesan data hingga latihan model, menjadikannya model multimodal SOTA pertama yang dilatih sepenuhnya menggunakan cip tempatan;

Moore Threads bersama Beijing Academy of Artificial Intelligence juga telah menyelesaikan pelatihan penuh model otak tubuh yang dikembangkan sendiri oleh Zhiyuan, RoboBrain 2.5, berdasarkan kluster komputasi cerdas MTT S5000 dan kerangka FlagOS-Robo. Prestasi ini pertama kali membuktikan kelayakan kluster komputasi buatan dalam negeri dalam pelatihan model besar kecerdasan tubuh.

Tampak bahawa GPU tempatan telah mencapai kemajuan dalam kesesuaian dan pembinaan ekosistem, serta bergerak dari "terobosan tunggal" di sisi inferens kepada "kesesuaian bertahap" di sisi latihan—ini merupakan kemajuan yang besar.

Ringkasan

Secara keseluruhan, dalam konteks impor cip canggih luar negara yang terhambat, lebih baik menggabungkan pendekatan barat dan timur dengan menggunakan dua kaki untuk berjalan, sambil memberikan sokongan utama kepada cip komputasi tempatan untuk memenuhi permintaan pasaran yang mendesak.

Ketulusan permintaan tidak diragukan lagi, "teori gelembung" masih ada, tetapi suara-suara tersebut tidak semakin kuat. Semangat pasaran global terhadap pembinaan AI telah melampaui sejarah perkembangan awal mana-mana industri sebelum ini.

Sejak awal tahun ini, pasaran modal global kembali mengalami gelombang siklus AI super, dengan saham Samsung, SK Hynix, Broadcom, dan TSMC mencatatkan rekod tertinggi baru. Di pasaran tempatan, teknologi keras seperti Cambricon juga menunjukkan pertumbuhan pesat, dengan kapitalisasi pasaran raksasa modul cahaya InnoLight sekali waktu melebihi Kweichow Moutai.

Mengulas sejarah perkembangan semikonduktor Korea Selatan, Korea Selatan menyokong industri cip penyimpanan dengan sepenuh tenaga negara, bertahan melalui masa-masa gelap, dan akhirnya mengalahkan Jepun untuk menjadi penguasa mutlak dalam industri penyimpanan dunia.

Sama ada chip penyimpanan, chip telefon, atau bahkan chip AI semasa ini, China masih berada dalam fasa mengejar, dan ini bukan pencapaian yang boleh diraih dalam sehari semalam. Namun, dengan pasaran yang besar, bakat AI yang terus muncul, dan kekuatan modal yang besar, GPU tempatan telah mula menunjukkan keupayaan yang sesuai untuk memenuhi keperluan sebenar banyak syarikat AI.

Dalam permainan AI mengenai nasib negara ini, China dan Amerika Syarikat adalah lawan, tetapi juga saling memerlukan teknologi, pasaran, dan sumber daya satu sama lain.

Artikel ini berasal dari akaun WeChat: Juetao WAVE, disunting oleh Yang Xuran, ditulis oleh Xie Zefeng, judul asal: 〈Masalah Kekuatan Pengiraan di Bawah Permainan AI AS-China | Juetao〉