中國 AI 模型大幅降低成本,在訓練和推論效率上超越美國競爭對手

iconCryptoBriefing
分享
AI summary icon精華摘要

DeepSeek 花費約 558 萬美元訓練其 V3 模型。作為對比,美國競爭對手通常在前沿模型上花費數千萬至數億美元。

在 2026 年 5 月,DeepSeek 永久將其 V4-Pro 模型的價格削減了 75%。快取輸入成本降至每百萬個標記低至人民幣 0.025 元。

DeepSeek 並非在這場價格競賽中孤軍奮戰。據報導,中國公司 01.ai 提供的推理服務價格約為每百萬個詞元 14 美分,使中國 API 定價成為全球最低。

在 OpenRouter 上,中國 AI 模型的交易量實現了 5 倍增長,幾乎完全源於其相對於美國替代方案的成本優勢。

廣告

他們是如何做到的

中國開發者已建構出稀疏的 MoE 架構,將參數激活量從 6710 億降低至僅 370 億。這意味著在推理層面,計算成本降低了 90-97%。

除了架構之外,中國團隊已採用低精度訓練方法,例如 FP8,以降低每次計算的運算需求。

DeepSeek 的 R1 推理模型僅以 294,000 美元的成本,使用 512 個 H800 芯片訓練了 80 小時。

源自限制

自2023年以來,美國出口管制限制了中國公司獲取高端Nvidia硬體的途徑。H100及其後續型號已實際被禁用。中國開發者一直使用H800這款為符合出口規則而設計的降級晶片。

在這條效率前沿上的主要中國企業包括阿里巴巴的 Qwen、月之暗面的 Kimi、智譜 AI 的 GLM、字節跳動的 Doubao,以及 DeepSeek。

這對投資者意味著什麼

如果前沿級 AI 表現能在低於 600 萬美元的訓練成本下實現,而非 1 億美元以上,那麼美國 AI 領導者周圍的資本支出護城河開始顯得較為薄弱。

對於加密貨幣和 Web3 生態,更便宜的推理直接降低了運行 AI 驅動的去中心化應用、預言機網絡和鏈上分析工具的成本。

中國開發者透過稀疏 MoE 架構實現的 97% 計算量降低,不僅是技術里程碑,更是價格信號,而市場最終會跟隨價格信號。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露