A.I. China tertinggal dari AS dalam akses ke chip pelatihan kelas atas dan daya komputasi

Kekurangan daya komputasi

Sejak akhir tahun lalu, GPU buatan dalam negeri seperti Moore Threads, Muxi Shares, Biren Technology, dan TianShu Intelligent Chip telah memicu gelombang modal. Namun, di bawah pesta kekayaan di pasar sekunder, garis gelap yang tak bisa diabaikan semakin jelas, dan masalah yang ditimbulkannya pun menjadi semakin mendesak.

Dalam beberapa tahun terakhir, chip AI buatan dalam negeri terutama berfokus pada tugas "inferensi" yang relatif aman dan lebih tepi, seperti baru-baru ini rencana Doubao untuk membeli 50.000 chip TianShu ZhiXin untuk tugas komputasi inferensi, guna memenuhi permintaan frekuensi tinggi dari aplikasi AI terbesar di Tiongkok ini.

Sementara itu, dalam urutan puncak piramida komputasi untuk pelatihan AI, chip domestik saat ini hanya dapat berpartisipasi dalam tugas-tugas tepi yang bersifat membantu.

Chip pelatihan AI terutama digunakan untuk pelatihan model kecerdasan buatan, di mana terjadi banyak operasi matriks dan penyesuaian parameter, sehingga memerlukan kemampuan komputasi yang kuat dan rasio efisiensi energi tinggi, dengan performa lebih unggul dan harga yang sangat mahal, seperti NVIDIA A100, H100, H200, serta seri AMD MI300;

Sebaliknya, tugas chip inferensi jauh lebih ringan. Digunakan pada tahap penyebaran setelah pelatihan model, chip ini terutama bertanggung jawab untuk menjalankan tugas inferensi model, dengan persyaratan tinggi terhadap real-time; chip inferensi perlu memiliki respons cepat dan konsumsi daya rendah sambil mempertahankan akurasi.

Sebuah perumpamaan yang tepat adalah, pelatihan membuat model AI "mempelajari pengetahuan", sedangkan inferensi membuat model besar "menggunakan pengetahuan tersebut". Pada tahap pembelajaran, chip pelatihan harus memanfaatkan sejumlah besar data untuk "memberi makan" pembaruan dinamis parameter sebesar miliaran, triliunan, bahkan sepuluh triliun, tidak hanya memerlukan daya komputasi yang kuat, tetapi juga konfigurasi bandwidth dan kemampuan komunikasi yang efisien, serta menjamin stabilitas di bawah kluster berbasis puluhan ribu kartu.

Kesenjangan antara model Tiongkok dan AS berakar pada tempat-tempat "tak terlihat" ini, terutama ketiadaan chip pelatihan kelas atas.

Di bawah hukum Scaling Law model besar, semakin besar parameter model, semakin meningkat secara linier kebutuhan komputasi, sementara biaya komputasi dan perangkat keras yang tumbuh secara eksponensial menjadikan pelatihan model besar sebagai "permainan eksklusif" hanya untuk segelintir raksasa teknologi.

Di antara raksasa teknologi Amerika, hanya Meta yang berencana untuk menerapkan lebih dari 1,2 juta GPU kelas atas pada akhir 2026, dengan investasi tahunan lebih dari $145 miliar; menurut perkiraan lain, total daya komputasi AI yang dimiliki Google setara dengan 5 juta unit NVIDIA H100, atau sepertiga dari total global.

Empat perusahaan Amazon, Microsoft, Alphabet, dan Meta mengeluarkan belanja modal sebesar $725 miliar tahun ini, meningkat 77% secara tahunan, sebesar 13% dari total investasi domestik sektor swasta AS untuk seluruh tahun ini. Morgan Stanley bahkan memperkirakan bahwa pada tahun 2027, belanja modal perusahaan teknologi AS berpotensi mencapai rekor historis $1,1 triliun.

Saat ini, Amerika Serikat menguasai lebih dari tujuh puluh persen GPU kelas atas global, dan setelah larangan chip, chip kelas atas yang tersedia di dalam negeri hanya seperdelapan dari milik Amerika. Laporan Stanford AI Index Report 2026 menyatakan bahwa jumlah pusat data di Amerika Serikat (5.427) lebih dari sepuluh kali lipat dari Tiongkok.

Menurut perhitungan Institut Informasi dan Komunikasi Tiongkok (CAICT), hingga awal 2025, kapasitas komputasi Amerika Serikat mencapai 2400 EFLOPS, sedangkan Tiongkok 1053 EFLOPS, sehingga kapasitas Amerika Serikat lebih dari dua kali lipat dari Tiongkok.

Keempat raksasa teknologi tersebut memiliki kapasitas komputasi yang masing-masing melebihi total kapasitas komputasi semua perusahaan AI di Tiongkok.

Keunggulan daya komputasi yang menakjubkan ini memungkinkan perusahaan-perusahaan Amerika menyelesaikan belasan siklus eksperimen iterasi model besar dalam satu tahun.

Musk bahkan lebih mewah, dengan xAI-nya yang memiliki Colossus 2, yang disebut sebagai "klaster AI GW pertama di dunia". Oleh karena itu, ia memiliki dasar untuk menyatakan bahwa sedang melatih tujuh model secara bersamaan—dua model dengan 1 triliun parameter, dua model dengan 1,5 triliun parameter, satu model dengan 6 triliun parameter, dan satu model dengan 10 triliun parameter. "Estetika kekerasan" semacam ini hanya mungkin dilakukan jika daya komputasi sangat melimpah.

Sementara itu, karena pembatasan AS terhadap ekspor chip, pangsa perusahaan China dalam chip AI high-end yang dikirimkan dalam beberapa tahun terakhir terus menurun (menurut statistik epoch.AI).

Dapat dikatakan tanpa berlebihan bahwa kesenjangan besar dalam daya komputasi akan membuat AI Tiongkok tetap berada dalam fase mengejar dalam jangka panjang, serta membuat proses model besar buatan dalam negeri menyusul rekan-rekan Amerika menjadi lebih sulit.

Perbedaan generasi

Langkah inovasi Tiongkok tidak dapat dihentikan, "siapa pun yang berpikir Tiongkok tidak mampu membuat (chip) benar-benar salah menilai. Kesenjangan antara Tiongkok dan AS hanyalah tingkat nanodetik."

Pendiri NVIDIA, Jensen Huang, telah berulang kali memuji kemajuan semikonduktor Tiongkok di forum publik.

Elon Musk juga sering menyampaikan pandangan serupa di X—“Tiongkok pasti akan menyelesaikan masalah ketergantungan pada chip, dan di bidang kekuatan komputasi AI, pasti akan jauh melampaui negara-negara lain di dunia”, “Tiongkok akan memenangkan kompetisi AI di Bumi”.

Tokoh-tokoh terkenal di dunia teknologi memuji-muji perkembangan AI Tiongkok secara berlebihan, sehingga mudah membuat orang percaya. Pernyataan-pernyataan ini jelas memiliki indikasi memanjakan hingga merusak. Sebagian media Amerika terus-menerus menyebarkan opini bahwa kesenjangan model antara Tiongkok dan Amerika sangat kecil, berusaha mengaburkan fakta dan menyembunyikan beberapa kebenaran objektif.

Untuk ini, semua bidang terkait AI di dalam negeri harus tetap tenang dan jernih.

Jika saat ini model besar canggih Tiongkok memiliki perbedaan kecil dibandingkan pesaing AS dalam menyelesaikan masalah standar, maka perbedaan tersebut akan menjadi lebih jelas dalam lingkungan industri dan perusahaan yang kompleks.

Dibandingkan dengan model mutakhir dari perusahaan Amerika Serikat seperti Anthropic, Tiongkok masih merupakan pengejar. Menurut penilaian CAISI Amerika Serikat, DeepSeek V4 Pro terkuat di dalam negeri tertinggal sekitar 8 bulan dari model mutakhir Amerika.

Li Ka-shing baru-baru ini menunjukkan dalam wawancara dengan The Wall Street Journal bahwa, dengan model top Amerika Serikat seperti Claude Fable 5 yang diluncurkan oleh Anthropic sebagai tolok ukur, Amerika Serikat saat ini memimpin China sekitar 15 bulan.

Model besar mengikuti hukum Scaling, semakin besar jumlah parameter model, semakin banyak data pelatihan, dan semakin besar daya komputasi yang diinvestasikan, semakin baik kinerja modelnya. Saat ini, model besar paling mutakhir di Amerika telah memasuki era parameter sepuluh triliun, dan kecepatan iterasinya terus mempercepat.

Anthropic telah mencapai Mythos dengan 10 triliun parameter, dan melatihnya memerlukan biaya 10 miliar dolar AS; xAI sedang melatih secara bersamaan tujuh model Colossus 2, termasuk model dengan 6 triliun dan 10 triliun parameter; OpenAI membutuhkan hanya satu bulan untuk mengiterasi satu model dengan 4 triliun parameter.

Model terkuat dari Tiongkok, DeepSeek V4 Pro, memiliki total parameter sebesar 1,6 triliun, berbeda sekitar 6 kali dari frontier AS yang berukuran sepuluh triliun.

Serangkaian Claude dari Anthropic telah diakui sebagai model AI pemrograman terkuat dalam dua tahun terakhir, sementara Mythos sekali lagi memperbarui persepsi publik, dengan kinerjanya yang bahkan lebih kuat dibandingkan flagship sebelumnya, Oups 4.6.

OpenBSD dikenal sebagai sistem paling aman di industri, namun Mythos menemukan kerentanan yang tidak terdeteksi selama 27 tahun, serta mencari dan menemukan kerentanan yang tidak terdeteksi selama beberapa bahkan puluhan tahun di FFmpeg dan kernel Linux, semuanya ditemukan secara mandiri tanpa bantuan manusia.

Perlu diketahui bahwa "pelatihan awal" model besar menentukan batas atas kemampuan model, dan tidak mungkin melalui "pelatihan lanjutan" untuk menyesuaikan model dengan parameter triliunan hingga mencapai tingkat kemampuan model dengan parameter 10 triliun. Faktor penentu dalam pelatihan awal adalah chip komputasi high-end, yang menentukan skala parameter dan kecepatan iterasi pelatihan.

Ketua科大讯飞 Liu Qingfeng secara terbuka mengatakan bahwa saat ini semua produsen model besar terkemuka, terutama raksasa Amerika Serikat, sedang membangun platform komputasi skala super besar. Sementara itu, komputasi dalam negeri saat ini memang menghadapi masa kesulitan, yang menyebabkan keterbatasan dalam pelatihan konteks teks sangat panjang.

Terlihat bahwa kesenjangan daya komputasi adalah akar dari perbedaan model antara Tiongkok dan Amerika Serikat.

Kebangkitan produk lokal

Sebuah perusahaan memonopoli 90% pangsa pasar global untuk chip pelatihan AI kelas atas—hal ini membantu NVIDIA mempertahankan tahta sebagai perusahaan dengan kapitalisasi pasar terbesar di dunia. Total kapitalisasi pasarnya pernah melebihi PDB Jerman, ekonomi terbesar ketiga di dunia, pada tahun 2025.

Data dari TrendForce menunjukkan bahwa pada Q1 2026, NVIDIA menguasai 68% pasar server GPU global, AMD menduduki 5%-6%, sementara produsen GPU lokal secara keseluruhan kurang dari 4%.

Dengan keunggulan pertama, hambatan teknis yang sangat kuat, konektivitas berkecepatan tinggi, ekosistem perangkat lunak, serta kemitraan dengan proses produksi canggih TSMC, NVIDIA mendominasi pasar. Dalam skenario pelatihan high-end, performa NVIDIA GB300 lebih unggul dibanding AMD MI325, serta lebih baik daripada Cambricon Siyuan 690 dan Moore Threads MTT40, terutama dalam pelatihan model besar dengan parameter triliunan, performanya lebih unggul 30% dibanding pesaing.

Di bawah larangan ekspor, Huang Renxun sebelumnya menyatakan bahwa pangsa pasar (baru) NVIDIA di Tiongkok hampir habis, tersisa hanya pasar stok. Dukungan kebijakan substitusi lokal, termasuk Huawei Ascend 910, Higon DCU Shen Suan Nomor 2, Cambricon MLU370/590, serta perusahaan-perusahaan seperti Moore dan Muxi, secara bertahap muncul.

Di antaranya, Ascend 910 adalah chip kekuatan komputasi terkuat Huawei, dengan kekuatan komputasi Ascend 910B mencapai 640 TOPS (INT8), sebanding dengan chip NVIDIA A100.

Dari segi kinerja absolut, GPU buatan dalam negeri masih memiliki kesenjangan, tetapi dapat mulai fokus pada skenario inferensi dan edge. Saat ini, GPU buatan dalam negeri pada dasarnya memenuhi kebutuhan inferensi umum untuk pemerintah dan perusahaan di dalam negeri, dengan kesenjangan dibandingkan produk menengah NVIDIA berkurang menjadi 15%-20%, sehingga layak untuk digantikan.

Perlu ditekankan bahwa meskipun kinerja daya komputasi sangat penting, ekosistem perangkat lunak di baliknya adalah kelemahan utama GPU buatan dalam negeri. Seperti halnya CUDA yang menjadi fondasi kekaisaran GPU NVIDIA, Profesor Zheng Weimin dari Akademi Teknik Tiongkok menunjukkan bahwa masalah inti chip AI buatan Tiongkok adalah ekosistemnya yang belum baik; jika ekosistemnya baik, bahkan dengan kinerja hanya 60% pun akan tetap digunakan.

Dapat dikatakan bahwa ekosistem perangkat lunak adalah hambatan paling kuat di jalur GPU, dan kemampuan NVIDIA di bidang ini juga sulit digantikan.

Ekosistem CUDA telah mengalami pengembangan selama lebih dari sepuluh tahun, kini memiliki lebih dari 4 juta pengembang, puluhan ribu model open-source, dan rantai alat pihak ketiga lengkap, mencakup pelatihan AI, inferensi, rendering grafis, dan komputasi ilmiah, dengan hambatan ekosistem yang tak tertandingi.

Data IDC menunjukkan bahwa saat ini lebih dari 95% model AI di seluruh dunia dikembangkan berdasarkan ekosistem CUDA. Sementara itu, GPU buatan dalam negeri, dengan dukungan kebijakan, memerlukan kolaborasi jangka panjang dengan rantai industri, serta kesabaran yang memadai dari media dan pasar modal.

Pada Januari tahun ini, Zhipu bekerja sama dengan Huawei untuk melepaskan model generasi gambar baru, GLM-Image, yang didasarkan pada perangkat Huawei Ascend Atlas 800T A2 dan kerangka kerja AI Ascend MindSpore, menyelesaikan siklus penuh dari pemrosesan data hingga pelatihan model, dan merupakan model multimodal SOTA pertama yang dilatih sepenuhnya menggunakan chip domestik;

Moore Threads juga bekerja sama dengan Beijing Academy of Artificial Intelligence, menggunakan klaster komputasi cerdas MTT S5000 dan kerangka FlagOS-Robo untuk menyelesaikan pelatihan penuh dari model otak tubuh hasil pengembangan sendiri oleh Zhiyuan, RoboBrain 2.5. Hasil ini pertama kali membuktikan kelayakan klaster komputasi dalam negeri dalam pelatihan model besar kecerdasan tubuh.

Dapat dilihat bahwa GPU buatan dalam negeri telah mencapai kemajuan dalam kompatibilitas dan pembangunan ekosistem, serta sedang berpindah dari "terobosan tunggal" di sisi inferensi menuju "adaptasi bertahap" di sisi pelatihan, yang merupakan kemajuan signifikan.

Summary

Secara keseluruhan, dalam konteks hambatan impor chip canggih luar negeri, sebaiknya menggabungkan pendekatan barat dan timur dengan menggunakan dua kaki untuk berjalan, sekaligus secara fokus mendukung chip komputasi domestik guna memenuhi permintaan pasar yang mendesak.

Kebenaran permintaan tidak diragukan lagi, "teori gelembung" masih ada, tetapi suaranya tidak semakin keras. Semangat pasar global terhadap pembangunan AI telah melampaui setiap tahap awal perkembangan industri sebelumnya.

Sejak awal tahun ini, pasar modal global kembali memasuki siklus AI super, dengan saham Samsung, SK Hynix, Broadcom, dan TSMC mencatatkan rekor tertinggi baru. Di pasar domestik, teknologi keras seperti Cambricon juga menunjukkan kenaikan tajam, dengan kapitalisasi pasar perusahaan raksasa modul optik InnoLight sempat melebihi Kweichow Moutai.

Mengulas sejarah perkembangan semikonduktor Korea, Korea mendukung industri chip penyimpanan dengan kekuatan nasional, melewati masa-masa gelap, dan akhirnya mengalahkan Jepang untuk menjadi raja mutlak industri penyimpanan dunia.

Baik chip penyimpanan, chip ponsel, maupun chip AI saat ini, Tiongkok masih berada dalam tahap mengejar, dan ini bukanlah pencapaian yang bisa diraih dalam sekejap. Namun, berkat pasar yang besar, bakat AI yang terus bermunculan, serta kekuatan modal yang luas, GPU buatan dalam negeri mulai menunjukkan kemampuan adaptasi tertentu dan mampu memenuhi kebutuhan nyata banyak perusahaan AI.

Dalam permainan AI tentang nasib negara ini, Tiongkok dan Amerika Serikat sama-sama merupakan lawan sekaligus memiliki teknologi, pasar, dan sumber daya yang dibutuhkan oleh pihak lain.

Artikel ini berasal dari akun WeChat: Juetao WAVE, Editor: Yang Xuran, Penulis: Xie Zefeng, judul asli: "Masalah Komputasi di Bawah Persaingan AI AS-Cina | Juetao"