中國 AI 模型大幅降低成本，在訓練和推論效率上超越美國競爭對手

DeepSeek 花費約 558 萬美元訓練其 V3 模型。作為對比，美國競爭對手通常在前沿模型上花費數千萬至數億美元。

在 2026 年 5 月，DeepSeek 永久將其 V4-Pro 模型的價格削減了 75%。快取輸入成本降至每百萬個標記低至人民幣 0.025 元。

DeepSeek 並非在這場價格競賽中孤軍奮戰。據報導，中國公司 01.ai 提供的推理服務價格約為每百萬個詞元 14 美分，使中國 API 定價成為全球最低。

在 OpenRouter 上，中國 AI 模型的交易量實現了 5 倍增長，幾乎完全源於其相對於美國替代方案的成本優勢。

他們是如何做到的

中國開發者已建構出稀疏的 MoE 架構，將參數激活量從 6710 億降低至僅 370 億。這意味著在推理層面，計算成本降低了 90-97%。

除了架構之外，中國團隊已採用低精度訓練方法，例如 FP8，以降低每次計算的運算需求。

DeepSeek 的 R1 推理模型僅以 294,000 美元的成本，使用 512 個 H800 芯片訓練了 80 小時。

自2023年以來，美國出口管制限制了中國公司獲取高端Nvidia硬體的途徑。H100及其後續型號已實際被禁用。中國開發者一直使用H800這款為符合出口規則而設計的降級晶片。

在這條效率前沿上的主要中國企業包括阿里巴巴的 Qwen、月之暗面的 Kimi、智譜 AI 的 GLM、字節跳動的 Doubao，以及 DeepSeek。

如果前沿級 AI 表現能在低於 600 萬美元的訓練成本下實現，而非 1 億美元以上，那麼美國 AI 領導者周圍的資本支出護城河開始顯得較為薄弱。

對於加密貨幣和 Web3 生態，更便宜的推理直接降低了運行 AI 驅動的去中心化應用、預言機網絡和鏈上分析工具的成本。

中國開發者透過稀疏 MoE 架構實現的 97% 計算量降低，不僅是技術里程碑，更是價格信號，而市場最終會跟隨價格信號。