DeepSeek V4 dan Meituan LongCat 2.0 Menerobos Batas Triliun Parameter

Perusahaan AI domestik mulai mencoba membangun jalur mereka sendiri.

Pada awal tahun ini, komunitas teknologi luar negeri memperhatikan masalah komputasi Tiongkok.

Pada Januari, Musk dalam sebuah podcast menyatakan bahwa Tiongkok dalam kekuatan komputasi AI akan jauh melampaui wilayah lain di dunia. Pada Februari, CEO OpenAI, Altman, mengatakan bahwa kemajuan teknologi Tiongkok di bidang kecerdasan buatan sangat menakjubkan. CEO NVIDIA, Jensen Huang, juga beberapa kali menyatakan secara terbuka: "Membatasi teknologi AI Tiongkok justru akan mempercepat pengembangan mandirinya."

Tahun 2025 dapat disebut sebagai tahun konsolidasi sisi pasokan. GPU buatan dalam negeri seperti Moore Threads dan Muxi Semiconductor secara berturut-turut melantai di pasar modal, memperdalam dasar industri model besar buatan dalam negeri. Pada tahun 2026, perubahan menyebar ke hilir rantai pasokan, pada akhir April, beberapa model besar buatan dalam negeri merilis versi baru.

Pada 20 April, Moonshot meluncurkan model Kimi K2.6 yang unggul dalam penulisan kode jangka panjang; pada 24 April, DeepSeek V4 dirilis; kemudian LongCat-2.0-Preview dari Meituan dibuka untuk pengujian, dengan total parameter kedua model melebihi satu triliun dan keduanya mendukung konteks super panjang hingga 1M.

Perlu dicatat bahwa DeepSeek V4 telah berhasil bermigrasi dan disesuaikan dari sistem NVIDIA ke platform Huawei Ascend; sementara itu, LongCat2.0 dari Meituan adalah model besar dengan parameter triliunan yang seluruh proses pelatihan dan inferensinya didasarkan pada daya komputasi domestik, menggunakan 50.000 hingga 60.000 chip daya komputasi domestik.

Untuk waktu yang lama, para praktisi AI di Tiongkok secara umum mengadopsi strategi memanfaatkan solusi matang yang sudah ada. Sekarang, perusahaan AI domestik mulai mencoba membangun jalur mereka sendiri.

Membangun jalan di padang gurun

Bagaimana cara Anda menyelesaikan tugas yang sulit?

Jawaban penulis fiksi ilmiah Arthur Clarke adalah: "Satu-satunya cara adalah menjadikan hal yang tidak mungkin sebagai titik awal kemajuan."

DeepSeek V4 dari jadwal awal hingga rilis akhir, jadwalnya telah diubah beberapa kali. Secara umum, pihak luar menduga salah satu alasannya adalah kebutuhan untuk memindahkan kode inti dari CUDA milik NVIDIA.

Ekosistem CUDA, setelah belasan tahun disempurnakan, telah menjadi platform pengembangan yang kuat dan dilengkapi berbagai alat. Ekosistem daya komputasi lokal masih berada pada tahap awal pembangunan. Proses migrasi kode berarti tim pengembang perlu melakukan sejumlah besar pekerjaan重构 kerangka dasar.

Akhirnya, DeepSeek berhasil melakukannya; dua hari setelah peluncuran V4, JPMorgan dalam laporannya menyatakan bahwa V4 berhasil disesuaikan dengan chip Ascend Huawei, memvalidasi kelayakan daya komputasi domestik dalam inferensi AI mutakhir; selain itu, DeepSeek secara signifikan menurunkan biaya inferensi melalui inovasi teknis dasar seperti arsitektur perhatian campuran.

DeepSeek menggunakan pendekatan teknis untuk mengurangi biaya dan meningkatkan efisiensi, menyelesaikan migrasi intensif dengan menulis ulang setengah dari beban kerja model besar. Pada hari yang sama, LongCat-2.0-Preview dari Meituan berjalan langsung di infrastruktur komputasi domestik.

Dalam aspek teknis, apa saja tantangan dalam pengembangan daya komputasi domestik? Mari kita lihat contoh LongCat-2.0-Preview.

Tantangan pertama bersifat fisik. Kapasitas dan bandwidth memori GPU pada infrastruktur hardware lokal berbeda dari chip NVIDIA. Dalam pelatihan dan penyebaran model dengan parameter triliunan, tim Meituan menghadapi tantangan teknis yang signifikan, memerlukan lebih banyak upaya untuk menyesuaikan strategi paralel dan mengoptimalkan penggunaan memori GPU.

Tantangan kedua adalah tingkat kematangan ekosistem perangkat lunak; untuk menyesuaikan dengan karakteristik chip buatan dalam negeri dan memastikan akurasi serta reproduktibilitas penuh selama pelatihan, tim perlu menulis ulang dan mengoptimalkan operator inti, serta mengembangkan operator deterministik sepenuhnya secara mandiri.

Tantangan ketiga adalah stabilitas klaster ribuan GPU; pada klaster berskala sangat besar yang menggunakan 50.000 hingga 60.000 kartu komputasi lokal, kegagalan perangkat keras tidak dapat dihindari. Untuk itu, tim telah membangun sistem kesalahan toleran dan pemulihan otomatis yang lengkap.

Terakhir, berdasarkan karakteristik perangkat keras lokal, tim melakukan desain yang disesuaikan secara khusus pada kerangka pelatihan dan struktur model, sehingga mengatasi keterbatasan adaptasi kerangka umum dan meningkatkan kinerja komputasi.

Optimasi algoritma DeepSeek menurunkan ambang kebutuhan daya komputasi dan menurunkan harga model; praktik teknik Meituan membuktikan kelayakan chip domestik. Eksplorasi ini juga memberikan kontribusi terhadap pengembangan kemampuan dan pengalaman teknis bagi ekosistem chip domestik.

Liang Wenheng pernah berkata: "Kami tidak bermaksud menjadi ikan lele, tetapi tanpa sengaja menjadi ikan lele," dan kini "efek ikan lele" telah terwujud, DeepSeek tidak sendirian.

Dari titik tunggal ke sistem

Tang Dao Sheng dari Tencent Cloud pernah memberikan perumpamaan ini: “Model besar adalah mesin, pengguna adalah pengemudi.” Pengguna mudah memperhatikan kinerja mesin, tetapi pengemudi yang hebat akan menyadari bahwa bahan bakar dan sasis sama pentingnya.

Perkembangan daya komputasi Tiongkok bergantung pada kemajuan kolaboratif seluruh rantai industri. Perusahaan inti di setiap tahap terus memperbaiki kelemahan mereka.

Di sisi manufaktur, data publik menunjukkan bahwa produksi chip Tiongkok terus meningkat, namun memiliki struktur "berbentuk dumbbell", di mana proses matang di atas 28nm mendominasi, sementara kapasitas proses canggih 14nm dan di bawahnya masih langka.

Menghadapi kenyataan kurangnya mesin lithografi EUV, perusahaan-perusahaan seperti SMIC dan Hua Hong Semiconductor sedang mendorong pengembangan proses multi-patterning untuk mencari keseimbangan di dalam batas fisik. Berbagai laporan menunjukkan bahwa tingkat hasil proses N+2 SMIC (setara 7nm) telah melewati 80%, yang berarti telah melampaui ambang produksi komersial.

Di sisi daya komputasi, chip buatan dalam negeri masih memiliki kesenjangan dalam daya komputasi per kartu dibandingkan dengan NVIDIA. Praktik produk seperti Huawei Ascend 910C menunjukkan bahwa melalui rasio percepatan linier klaster yang ekstrem, pelatihan model dengan volume besar juga dapat dilakukan.

“Yang menguasai ekosistem menguasai dunia.” Salah satu alasan utama mengapa parit perlindungan yang dibangun oleh NVIDIA CUDA sangat dalam adalah karena telah membentuk standar kompatibilitas perangkat lunak dan perangkat keras yang universal.

Para profesional industri juga menyadari hal ini. Misalnya, Cambricon meluncurkan platform perangkat lunak dasar yang kompatibel dengan kerangka kerja utama, sehingga menurunkan hambatan migrasi bagi pengembang. Sistem open-source yang dipimpin oleh Akademi Kecerdasan Buatan Zhiyuan telah membangun antarmuka dasar yang seragam, memungkinkan model lapisan atas berjalan di berbagai chip domestik yang berbeda.

Perusahaan internet besar di Tiongkok juga banyak bergerak, strategi ganda Baidu dan investasi triliunan yuan oleh ByteDance, semuanya mencari solusi lebih baik untuk fondasi komputasi.

Berdasarkan data publik, dalam beberapa tahun terakhir, Meituan setidaknya telah menginvestasikan pada 21 perusahaan yang bergerak di bidang semikonduktor/hardware cerdas dan model besar umum. Di antaranya, termasuk Moortian dan Muxi Holdings di lapisan kekuatan chip, serta Aixin Yuanzhi di bidang chip visual; juga perusahaan-perusahaan seperti Guangzhou Zhongshan dan Dongfang Suangxin di segmen细分 seperti bahan baru.

Sambil terus memantau perkembangan teknis, modal industri juga berperan sebagai investor dan mitra pembangun daya komputasi, secara perlahan membentuk siklus positif.

Dari dunia digital ke tugas nyata

Saat ini, kecerdasan buatan berada pada titik balik penting dari gelombang ketiga, di mana model besar mendorongnya dari kecerdasan buatan sempit menuju kecerdasan buatan umum, dan yang lebih penting lagi, mendorong robot dari era robot khusus 1.0 memasuki era kecerdasan tubuh umum 2.0.

Kata Wang Zhongyuan, Direktur Institut Riset Kecerdasan Buatan Beijing Zhiyuan, menekankan bahwa titik fokus penting dari kemampuan AI adalah dunia fisik.

Di satu sisi, banyak produsen lokal sedang berupaya membuat model besar dapat "membaca sepuluh ribu buku" di cloud, meningkatkan kecerdasan dan ketatnya penalaran logis model. Di sisi lain, model besar juga perlu "berkeliling sepuluh ribu mil"—misalnya, model Wenxin telah diintegrasikan ke dalam sistem keputusan mobil otonom; solusi pemeriksaan kualitas industri model Hunyuan telah diterapkan di berbagai skenario lini produksi.

Layanan pesan-antar makanan, layanan ke tempat, dan akomodasi perjalanan Meituan membentuk jaringan eksekusi tugas paling kompleks dalam kehidupan sehari-hari. Di sini ada sejumlah besar skenario nyata: dari kecepatan penyajian makanan di dapur restoran, hingga rute pengiriman kurir di tengah hujan deras, hingga satu kalimat pengguna larut malam: "Ingin makan hotpot."

Wang Xing secara jelas menyatakan bahwa Aplikasi Meituan harus pertama kali ditingkatkan menjadi 'Aplikasi berbasis AI'. Ini berarti, tujuan pelatihan LongCat bukan hanya menjawab 'daging goreng siapa yang enak', tetapi juga 'menemukan restoran itu, memilih kupon diskon terbaik, lalu memesan 2 kursi pada Jumat malam pukul 7'.

Ini berarti efektivitas pengiriman tugas sangat penting, dan menjelaskan mengapa Meituan menekankan pentingnya membangun dasar AI untuk dunia fisik.

Dari peningkatan parameter hingga pencapaian daya komputasi, model bahasa besar buatan dalam negeri sedang melangkah dari “bisa digunakan” ke “lebih mudah digunakan”.

Tidak ada jalan pintas di jalan ini. Di masa depan, ketika algoritma, daya komputasi, modal, dan skenario terus menghasilkan reaksi kimia, kisah AI Tiongkok juga akan beralih dari “terobosan titik tunggal” ke halaman “evolusi sistem”.

Artikel ini berasal dari akun WeChat "Lan Dong Business", penulis: Yu Weilin