深センチームが国内チップを用いて1.6TパラメータのAIモデルを訓練

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
深センを拠点とするチームは、華為のAscend 910C AI計算クラスターを用いて、1.6兆パラメータのDeepSeek-V4-Proモデルを訓練しました。このプロジェクトには、深セン和 Tao 学院、哈爾濱工業大学(深セン)、深セン大規模データ研究所が関与しました。この成功は、超大規模モデル訓練における国内AIチップへの高い支援レベルを示しています。この成果は、最近のインフレデータの傾向と一致し、AI開発における地元技術の役割が拡大していることを強調しています。

Odaily星球日報によると、最近、深圳河套学院のAI訓練プラットフォームプロジェクトチームは、哈爾濱工業大学(深圳)、深圳市ビッグデータ研究院、華為関連チームと協力し、深智城AI計算力プラットフォームと連携して、国内産計算力の大規模モデル訓練に向けた共同研究を実施しました。昇騰910Cの国内産AI計算力クラスタを活用し、1.6兆パラメータの大型モデルDeepSeek-V4-Proの全パラメータ後学習を完了しました。

今回の実践は、国産計算能力プラットフォーム上でグローバルな第三者機関がこのレベルのモデル訓練を完了するための関連する探求において重要な経験を積み、国産AIチップが世界級の超大規模パラメータモデルの訓練を支えることができることを実証しました。技術応用の観点から見ると、既存のモデルを用いて業務推論を行うことと、ゼロからモデルの全パラメータ訓練を完了することは異なる技術段階に属し、技術的難易度やハードウェア要件に明確な差異があります。今回の実験結果は、国産AI計算能力がトップレベルの大規模モデル訓練タスクを担うことができることを示しており、関連する技術的アプローチは実現可能性を有しています。(深圳発表)

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。