中国のAIモデルが、トレーニングおよび推論効率で米国競合を上回り、コストを大幅に削減

DeepSeekはV3モデルの訓練に約558万ドルを費やしました。参照として、米国の競合他社は先端モデルに通常数千万から数億ドルを支出しています。

2026年5月、DeepSeekはV4-Proモデルの価格を75%永久的に引き下げました。キャッシュされた入力コストは、100万トークンあたり人民元0.025円まで低下しました。

この下落競争において、DeepSeekだけが例外ではない。中国の企業01.aiは、100万トークンあたり約14セントで推論を提供していると報告されており、中国のAPI料金が世界で最も低くなっている。

OpenRouter上の中国AIモデルは、米国製代替品に比べてコスト面での優位性により、取引量が5倍に成長しました。

彼らがどのように行っているか

中国の開発者たちは、パラメータの活性化を6710億からわずか370億に削減するスパースMoEアーキテクチャを構築しました。これは、推論レイヤーでの計算コストを90〜97％削減することを意味します。

アーキテクチャを超えて、中国のチームはFP8などの低精度トレーニング手法を採用し、各計算の計算負荷を削減しています。

DeepSeekのR1推論モデルは、512個のH800チップを80時間使用して、わずか29万4,000ドルでトレーニングされました。

2023年以降、米国の輸出規制により、中国企業は高級なNvidiaハードウェアへのアクセスが制限されています。H100およびその後継機種は事実上利用できません。中国の開発者は、輸出規制に準拠するために設計された性能が低下したH800チップを使用してきました。

この効率のフロンティアを広くカバーする中国の主要プレイヤーには、AlibabaのQwen、Moonshot AIのKimi、Zhipu AIのGLM、ByteDanceのDoubao、およびDeepSeekが含まれます。

フロンティアレベルのAIパフォーマンスが1億ドル以上ではなく600万ドル未満のトレーニングコストで実現可能であれば、米国のAIリーダーたちを取り囲む資本支出のモアトが薄れ始めている。

暗号通貨およびWeb3エコシステムにおいて、より安価な推論は、AI駆動型分散型アプリケーション、オラクルネットワーク、オンチェーン分析ツールの運用コストを直接削減します。

中国の開発者がスパースMoEアーキテクチャによって達成している97%の計算リソース削減は、単なる技術的なマイルストーンではない。これらは価格シグナルであり、市場は最終的に価格シグナルに従う。