中国のAIのマイルストーン:1.6兆パラメーターのDeepSeekモデルが国内のAscend 910Cで完全に学習完了

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
深沢和陶学院、哈工大(深圳)、深セン大規模データ研究所、そして華為が共同で、国内のAscend 910C AIプラットフォーム上で、1.6兆パラメータのDeepSeek-V4-Proモデルの完全なトレーニングを完了しました。このオンチェーンニュースは、1,000個以上のAscend 910Cチップを用いて、第三者グループが初めて1.6Tパラメータモデルの完全トレーニングを達成したことを示しています。このチームは、モデルの計算利用率を30%以上向上させ、主要なオペレーターの効率を14%向上させ、1,500回以上のトレーニングステップでシステム障害を一切発生させませんでした。このAI+暗号通貨のニュースは、国内のAI能力とインフラの着実な成長を示しています。
ME AIのニュース、動察Beatingの監測によると、深圳河套学院、哈工大(深圳)、深圳市大数据研究院および華為関連チームで構成され、深智城AI算力プラットフォームと協力する共同開発チームは、中国製AI算力プラットフォーム上で1.6兆パラメータの大規模モデルDeepSeek-V4-Proの全パラメータ後学習(Post-training)を成功裏に実行した。これは、世界で初めて第三者機関が中国製算力プラットフォーム上で1.6兆パラメータ規模のモデルの全パラメータ後学習を完了した事例である。ゼロから始める前学習(Pre-training)と比較して、後学習段階(主に監督微調SFTと強化学習RLを含む)は、高品質な指示と人間の好みの整合性を通じて、モデルに指示を遵守させ特定のタスクを実行させる点に焦点を当てる。しかし、1.6兆パラメータのMoEアーキテクチャモデルにおいて、全パラメータ後学習は、基盤ハードウェアのVRAM容量、複数GPU間通信帯域幅(MoEルーティングによって発生するフルオールトゥフル通信など)、および大規模クラスタの安定性に対して非常に厳格な要件を課す。共同開発チームは、1,000枚を超えるチップ規模の華為昇騰910C算力クラスタを基盤とし、分散処理負荷と負荷分散戦略を最適化することで、通信ボトルネックを克服した。1,500ステップ以上にわたる学習プロセス中、システムは一度も中断することなく動作し、モデル算力利用率(MFU)は30%を超え、主要な算子効率は14%向上し、すべての指標が産業レベルの運用基準を満たした。業界分析によると、華為昇騰910Cクラスタが兆パラメータ規模モデルのトレーニングで成功を収めたことは、中国製AIチップが超大規模モデルの深度トレーニングタスクを実行する技術的実現可能性を証明した。これまで大規模モデルの開発における核心的な前学習は主にNVIDIA GPUクラスタに依存しており、中国製算力は主に推論(Inference)や小パラメータ微調整タスクを担ってきた。今回の共同開発の成功は、中国製算力エコシステムが「推論のみ対応」から「超大パラメータモデルの全パラメータトレーニング対応」への技術的閉ループへ加速的に移行していることを示している。(出典:MLion)
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。