Tahap Penting AI China: Model DeepSeek 1.6T Parameter Berjaya Dilatih Sepenuhnya di Ascend 910C Tempatan

iconKuCoinFlash
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Pasukan gabungan yang merangkumi Kolej Shenzhen HeTao, HIT (Shenzhen), Institut Big Data Shenzhen, dan Huawei telah menyelesaikan latihan penuh selepas pengecasan model DeepSeek-V4-Pro dengan 1.6 trilion parameter di platform AI Ascend 910C tempatan. Berita ini menandakan kali pertama kumpulan pihak ketiga mencapai latihan penuh model dengan 1.6T parameter menggunakan lebih daripada 1,000 cip Ascend 910C. Pasukan tersebut meningkatkan penggunaan pengiraan model sebanyak lebih 30% dan kecekapan operator utama sebanyak 14%, tanpa sebarang kegagalan sistem semasa 1,500+ langkah latihan. Berita AI + kripto ini menonjolkan kemampuan dan infrastruktur AI tempatan yang semakin berkembang.
ME AI mesej, berdasarkan pemantauan Beating, pasukan kerjasama yang terdiri daripada Shenzhen Hekou College, Universiti Teknologi Harbin (Shenzhen), Shenzhen Institute of Big Data, dan pasukan berkaitan Huawei, bersama dengan pasukan kerjasama platform komputasi AI Shenzhen Smart City, telah mengumumkan kejayaan menjalankan latihan penuh parameter (Post-training) untuk model besar 1.6 trilion parameter DeepSeek-V4-Pro di platform komputasi AI tempatan. Ini merupakan pertama kalinya pihak ketiga di seluruh dunia menyelesaikan latihan penuh parameter untuk model berskala 1.6 trilion parameter di platform komputasi tempatan. Berbeza daripada pra-latihan (Pre-training) dari awal, fasa latihan selepas (termasuk utama SFT dan pembelajaran penguatan RL) berfokus pada pengajaran model untuk mengikuti arahan dan melaksanakan tugas tertentu melalui arahan berkualiti tinggi dan penyesuaian preferensi manusia. Namun, bagi model MoE berskala 1.6 trilion parameter, latihan penuh parameter masih menuntut keperluan yang sangat ketat terhadap kapasiti memori GPU, lebar pita komunikasi antara pelbagai kad (seperti komunikasi semua-ke-semuanya yang dipicu oleh routing MoE), serta kestabilan kluster berskala besar. Pasukan kerjasama ini bergantung kepada kluster komputasi Huawei Ascend 910C yang melibatkan lebih daripada seribu cip, dan berjaya mengatasi bottleneck komunikasi melalui pengoptimuman strategi pembawaan teragih dan keseimbangan beban. Dalam proses latihan yang berlangsung lebih daripada 1500 langkah, sistem tidak mengalami sebarang gangguan, penggunaan keupayaan komputasi model (MFU) melebihi 30%, kecekapan operator utama meningkat sebanyak 14%, dan semua indikator mencapai piawaian operasi perindustrian. Analisis industri menunjukkan bahawa kejayaan kluster Huawei Ascend 910C dalam menjalankan latihan model berskala trilion parameter membuktikan kelayakan teknikal cip AI tempatan dalam menjalankan tugas latihan mendalam untuk model berskala super besar. Sebelum ini, pra-latihan inti dalam pembangunan model besar bergantung kepada kluster GPU NVIDIA, manakala komputasi tempatan sebelum ini terutamanya digunakan untuk inferens (Inference) atau penyesuaian parameter kecil. Kejayaan kerjasama ini menandakan bahawa ekosistem komputasi tempatan sedang mempercepat peralihan dari “hanya menyokong inferens” kepada “menjalankan latihan penuh parameter untuk model berskala super besar” dalam satu lingkaran teknologi yang lengkap. (Sumber: MLion)
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.