DeepSeek V4 dan Meituan LongCat 2.0 Pecah Halangan Parameter Triliun

Syarikat AI tempatan mula mencuba untuk membina jalan mereka sendiri.

Pada awal tahun ini, kalangan teknologi luar negara memperhatikan masalah pengiraan China.

Pada Januari, Musk dalam podcast menyatakan bahawa China akan jauh melebihi wilayah lain di dunia dalam kekuatan AI. Pada Februari, CEO OpenAI, Altman, mengatakan bahawa kemajuan teknologi China dalam bidang kecerdasan buatan adalah “mengagumkan cepat”. CEO NVIDIA, Jensen Huang, juga telah beberapa kali menyatakan secara terbuka: “Membatasi teknologi AI China justru akan mempercepat pengembangan sendiri.”

Tahun 2025 boleh dikatakan sebagai tahun pengumpulan pihak bekalan. GPU tempatan seperti Moore Threads dan Muxi Semiconductor berurusan secara berturut-turut di pasaran modal, memperdalam asas industri model besar tempatan. Pada tahun 2026, perubahan meresap ke hulu rantai pasaran; pada akhir April, beberapa model besar tempatan melancarkan versi baharu.

Pada 20 April, Moonshot melancarkan model Kimi K2.6 yang mahir dalam penulisan kod jangka panjang; pada 24 April, DeepSeek V4 dilancarkan; seterusnya, LongCat-2.0-Preview dari Meituan dibuka untuk ujian percubaan, dengan kedua-duanya memiliki jumlah parameter melebihi satu trilion dan menyokong konteks super panjang 1M.

Perlu ditekankan bahawa DeepSeek V4 telah berjaya berpindah dan disesuaikan dari sistem NVIDIA ke platform Huawei Ascend; manakala LongCat2.0 Meituan adalah model bahasa parameter triliunan yang sepenuhnya dilatih dan dijalankan berdasarkan kekuatan komputasi tempatan, menggunakan antara 50,000 hingga 60,000 cip kekuatan komputasi tempatan.

Selama ini, para praktisi AI di China secara umum mengikuti penyelesaian matang yang sudah ada. Kini, syarikat-syarikat AI tempatan mula mencuba membina landasan mereka sendiri.

Membina jalan di padang gurun

Bagaimana anda menyelesaikan tugas yang sukar?

Jawapan penulis sains fiksi Arthur Clarke ialah: "Satu-satunya cara adalah menjadikan perkara yang mustahil sebagai titik permulaan untuk kemajuan."

DeepSeek V4 daripada tarikh asal sehingga pelancaran akhir, tarikh telah disesuaikan beberapa kali. Secara umum, pihak luar menduga salah satu sebabnya ialah keperluan untuk memindahkan kod teras keluar dari CUDA NVIDIA.

Ekosistem CUDA, setelah dipertajam selama lebih dari sepuluh tahun, telah menjadi platform pembangunan yang kuat dan dilengkapi dengan alat-alat yang lengkap. Ekosistem kekuatan komputasi tempatan masih berada dalam peringkat awal pembinaan. Proses pemindahan kod bermaksud pasukan pembangunan perlu melakukan banyak kerja semula struktur kerangka asas.

Akhirnya, DeepSeek berjaya; dua hari selepas pelancaran V4, JPMorgan dalam laporan mereka menyatakan bahawa V4 berjaya disesuaikan dengan cip HuaWei Ascend, mengesahkan kebolehjadian kuasa komputasi tempatan dalam inferensi AI terkini; selain itu, DeepSeek berjaya mengurangkan kos inferensi secara ketara melalui inovasi teknikal asas seperti arsitektur perhatian campuran.

DeepSeek menggunakan pendekatan teknikal untuk mengurangkan kos dan meningkatkan kecekapan, menyelesaikan migrasi ketat dengan menulis semula separuh daripada jumlah kerja model besar. Pada hari yang sama, LongCat-2.0-Preview dari Meituan dijalankan secara langsung di atas kuasa komputasi tempatan.

Dalam aspek kejuruteraan, apakah cabaran yang dihadapi oleh kekuatan pengiraan tempatan? Mari kita lihat contoh LongCat-2.0-Preview.

Tantangan pertama adalah dari segi fizikal. Kapasiti dan lebar pita memori grafik pada infrastruktur peranti tempatan berbeza dengan cip NVIDIA; semasa melatih dan menghantar model dengan trilion parameter, pasukan Meituan menghadapi cabaran besar dalam kejuruteraan, memerlukan lebih banyak usaha untuk menyesuaikan strategi selari dan mengoptimumkan memori grafik.

Tantangan kedua ialah kematangan ekosistem perisian; untuk memastikan ketepatan dan kebolehulangan penuh sepanjang latihan, berdasarkan ciri-ciri cip tempatan, pasukan perlu menulis semula dan mengoptimumkan operator inti, serta mengembangkan operator sepenuhnya tentatif sendiri.

Tantangan ketiga ialah kestabilan kluster beribu-ribu kad, di mana kegagalan peranti keras sukar dielakkan pada kluster berskala besar yang menggunakan 50,000 hingga 60,000 kad kuasa komputasi tempatan. Untuk tujuan ini, pasukan membina satu sistem kesalahan sepenuhnya dan pemulihan automatik.

Akhirnya, berdasarkan ciri-ciri peranti tempatan, pasukan melakukan reka bentuk yang selaras secara khusus terhadap kerangka latihan dan struktur model, memecahkan had penyesuaian kerangka am, serta meningkatkan prestasi pengiraan.

Pengoptimuman algoritma DeepSeek telah menurunkan ambang kekuatan pengiraan dan menurunkan harga model; amalan kejuruteraan Meituan pula membuktikan kelayakan cip tempatan. Penjelajahan ini juga telah membentuk kemampuan dan pengalaman kejuruteraan untuk ekosistem cip tempatan.

Liang Wenheng pernah berkata: "Kami tidak bermaksud menjadi ikan lele, tetapi tanpa sengaja menjadi ikan lele," dan kini "kesan ikan lele" telah muncul, DeepSeek tidak berjalan sendirian.

Dari titik tunggal ke sistem

Tang Dao-sheng dari Tencent Cloud pernah memberikan perumpamaan ini: “Model besar adalah enjin, pengguna adalah pemandu.” Pengguna mudah memperhatikan prestasi enjin, tetapi pemandu yang cekap akan sedar bahawa bahan bakar dan sasis sama pentingnya.

Perkembangan pengiraan China bergantung pada kemajuan kolaboratif keseluruhan rantaian industri. Syarikat-syarikat utama di setiap peringkat terus memperbaiki kelemahan.

Di sisi pengeluaran, data awam menunjukkan bahawa pengeluaran cip China terus meningkat, tetapi mempunyai struktur "berbentuk dumbbell", di mana proses matang di atas 28nm mendominasi, manakala kapasiti proses canggih 14nm dan di bawahnya masih jarang.

Menghadapi kenyataan ketiadaan mesin lithography EUV, syarikat-syarikat seperti SMIC dan Hua Hong Semiconductor sedang memajukan usaha proses seperti multi-patterning untuk mencari keseimbangan di dalam had fizikal. Laporan pelbagai pihak menunjukkan, kadar keberhasilan proses N+2 SMIC (setara 7nm) telah melepasi 80%, bermakna ia telah melintasi ambang pengeluaran komersial.

Di sisi kekuatan pengiraan, cip tempatan masih menunjukkan jurang dalam kekuatan pengiraan per kad berbanding NVIDIA. Praktik produk seperti Huawei Ascend 910C menunjukkan bahawa dengan mencapai nisbah akselerasi linear kluster yang ekstrem, latihan model berskala besar juga boleh dilaksanakan.

“Yang menguasai ekosistem, menguasai dunia.” Salah satu sebab utama mengapa tembok pertahanan yang dibina oleh NVIDIA CUDA begitu kuat ialah kerana ia membentuk piawaian kompatibiliti perisian dan peranti yang serba ada.

Industri juga menyedari perkara ini. Sebagai contoh, Cambricon melancarkan platform perisian asas yang kompatibel dengan kerangka utama, mengurangkan rintangan migrasi untuk pembangun. Sistem sumber terbuka yang dipimpin oleh Akademi Kecerdasan Buatan Zhiyuan membina antaramuka bawah yang seragam, membolehkan model lapisan atas berjalan di pelbagai cip tempatan yang berbeza.

Syarikat-syarikat internet besar di dalam negara juga banyak mengambil tindakan, strategi dua landasan Baidu dan pelaburan berbilion dolar ByteDance semuanya mencari penyelesaian yang lebih baik untuk infrastruktur pengiraan.

Berdasarkan data awam, dalam beberapa tahun terakhir, Meituan sekurang-kurangnya telah melabur dalam 21 syarikat yang bergerak di bidang semikonduktor/hardware pintar dan model besar umum. Ini termasuk Moortian dan Muxi Shares di lapisan pengiraan cip, serta Aixin Yuanzhi di bidang cip visual; juga termasuk banyak syarikat seperti Guangzhou Zhongshan dan Dongfang Suangxin di segmen khusus seperti bahan baru.

Sambil terus memantau perkembangan teknikal, modal industri juga berperan sebagai pelabur dan rakan kongsi dalam kapasiti pengiraan, secara perlahan membentuk kitaran positif.

Dari dunia digital ke tugas sebenar

Sekarang, kecerdasan buatan berada pada titik balik penting dalam gelombang ketiganya, di mana model besar mendorongnya dari kecerdasan buatan lemah menuju kecerdasan buatan umum, dan lebih penting lagi, mendorong robot dari era robot khusus 1.0 ke era kecerdasan tubuh umum 2.0.

Perkataan Wang Zhongyuan, Ketua Akademi Kecerdasan Buatan Beijing Zhiyuan, menekankan bahawa titik fokus utama kemampuan AI ialah dunia fizikal.

Di satu sisi, banyak pengeluar tempatan sedang berusaha membolehkan model besar membaca ribuan buku di awan, meningkatkan kebijaksanaan dan ketepatan penalaran logik model. Di sisi lain, model besar juga perlu "melangkah ribuan batu", contohnya model Wenxin telah ditanamkan ke dalam sistem pengambilan keputusan kereta auto-pilot; penyelesaian pengawasan kualiti industri model Hunyuan telah digunakan dalam pelbagai skenario lini pengeluaran.

Perkhidmatan penghantaran makanan, perjalanan ke tempat, dan perjalanan serta penginapan Meituan membentuk rangkaian pelaksanaan tugas paling kompleks dalam kehidupan harian. Di sini terdapat jumlah besar skenario sebenar: dari kelajuan penyajian makanan di dapur restoran, kepada laluan penghantar di tengah hujan lebat, hingga ke satu permintaan larut malam pengguna: "Ingin makan hotpot."

Wang Xing pernah secara jelas menyatakan bahawa Aplikasi Meituan perlu dinaik taraf terlebih dahulu menjadi 'Aplikasi berasaskan AI'. Ini bermakna, matlamat latihan LongCat bukan sahaja menjawab 'di mana daging goreng yang sedap', tetapi juga 'mencari restoran itu, memilih kupon kumpulan terbaik, kemudian membuat tempahan untuk dua tempat duduk pada Jumaat malam pukul 7'.

Ini bermakna kesan penghantaran tugas adalah sangat penting, dan menjelaskan mengapa Meituan menekankan keperluan untuk membina asas AI dunia fizikal.

Dari peningkatan parameter hingga pencapaian kekuatan pengiraan, model besar tempatan sedang melangkah dari "boleh digunakan" ke "mudah digunakan".

Tidak ada jalan pintas di sini. Di masa depan, apabila algoritma, kekuatan pengiraan, modal, dan skenario terus menghasilkan tindak balas kimia, cerita AI China juga akan berpindah dari “tembusan titik tunggal” ke halaman “evolusi sistem”.

Artikel ini berasal daripada akaun微信公众号 "Lan Dong Business", penulis: Yu Weilin