Tahap Penting AI China: Model DeepSeek 1.6T Parameter Berjaya Dilatih Sepenuhnya di Ascend 910C Tempatan

ME AI mesej, berdasarkan pemantauan Beating, pasukan kerjasama yang terdiri daripada Shenzhen Hekou College, Universiti Teknologi Harbin (Shenzhen), Shenzhen Institute of Big Data, dan pasukan berkaitan Huawei, bersama dengan pasukan kerjasama platform komputasi AI Shenzhen Smart City, telah mengumumkan kejayaan menjalankan latihan penuh parameter (Post-training) untuk model besar 1.6 trilion parameter DeepSeek-V4-Pro di platform komputasi AI tempatan. Ini merupakan pertama kalinya pihak ketiga di seluruh dunia menyelesaikan latihan penuh parameter untuk model berskala 1.6 trilion parameter di platform komputasi tempatan. Berbeza daripada pra-latihan (Pre-training) dari awal, fasa latihan selepas (termasuk utama SFT dan pembelajaran penguatan RL) berfokus pada pengajaran model untuk mengikuti arahan dan melaksanakan tugas tertentu melalui arahan berkualiti tinggi dan penyesuaian preferensi manusia. Namun, bagi model MoE berskala 1.6 trilion parameter, latihan penuh parameter masih menuntut keperluan yang sangat ketat terhadap kapasiti memori GPU, lebar pita komunikasi antara pelbagai kad (seperti komunikasi semua-ke-semuanya yang dipicu oleh routing MoE), serta kestabilan kluster berskala besar. Pasukan kerjasama ini bergantung kepada kluster komputasi Huawei Ascend 910C yang melibatkan lebih daripada seribu cip, dan berjaya mengatasi bottleneck komunikasi melalui pengoptimuman strategi pembawaan teragih dan keseimbangan beban. Dalam proses latihan yang berlangsung lebih daripada 1500 langkah, sistem tidak mengalami sebarang gangguan, penggunaan keupayaan komputasi model (MFU) melebihi 30%, kecekapan operator utama meningkat sebanyak 14%, dan semua indikator mencapai piawaian operasi perindustrian. Analisis industri menunjukkan bahawa kejayaan kluster Huawei Ascend 910C dalam menjalankan latihan model berskala trilion parameter membuktikan kelayakan teknikal cip AI tempatan dalam menjalankan tugas latihan mendalam untuk model berskala super besar. Sebelum ini, pra-latihan inti dalam pembangunan model besar bergantung kepada kluster GPU NVIDIA, manakala komputasi tempatan sebelum ini terutamanya digunakan untuk inferens (Inference) atau penyesuaian parameter kecil. Kejayaan kerjasama ini menandakan bahawa ekosistem komputasi tempatan sedang mempercepat peralihan dari “hanya menyokong inferens” kepada “menjalankan latihan penuh parameter untuk model berskala super besar” dalam satu lingkaran teknologi yang lengkap. (Sumber: MLion)