AIMPACT 消息,4 月 30 日(UTC+8),據動察 Beating 監測,英偉達發佈部落格拆解推理硬體選型,核心論點一句話:評估推理基礎設施應看「每 token 成本」而非「每 GPU 每小時成本」。以 GPU 單價比較,Blackwell 更貴;以 token 成本比較,Blackwell 壓倒性優於上一代。 部落格以 DeepSeek-R1(MoE 推理模型)為測試對象,對比 Blackwell(GB300 NVL72)與上一代 Hopper(HGX H200)。按雲市場租賃參考價,Blackwell 每 GPU 每小時 2.65 美元,比 Hopper 的 1.41 美元貴近一倍,但單 GPU 每秒 token 產出從 90 跳至 6000,65 倍的吞吐量提升分攤下來,每百萬 token 成本從 4.20 美元降至 0.12 美元。每兆瓦 token 產出提升 50 倍。 需注意的前提:0.12 美元這個數字建立在 FP4 低精度推理加 MTP(多 token 預測,讓模型一次生成多個 token 來提速)等多項軟體優化全部開啟的基礎上。SemiAnalysis InferenceX v2 原始數據顯示,同樣的 GB300 NVL72 跑 DeepSeek-R1,不開 MTP 時每百萬 token 成本約 2.35 美元,開啟後降至約 0.11 美元,單這一項優化就拉開 21 倍差距。以上均為 DeepSeek-R1 單一模型的測試結果,不同模型架構和規模下數字會不同。 (來源:BlockBeats)
NVIDIA 揭示 Blackwell 成本細節:GPU 價格翻倍,代幣成本下降 35 倍
KuCoinFlash分享






NVIDIA 的 Blackwell GPU 價格幾乎是 Hopper 型號的兩倍,但每代幣成本下降了 35 倍。在每小時 $2.65 的雲端速率下,Blackwell 每秒可提供 6,000 個代幣,而 Hopper 僅為 90 個。這將每百萬代幣的成本從 $4.20 降低至 $0.12。價格分析顯示,FP4 和 MTP 等軟體改進推動了效率提升。加密貨幣價格趨勢可能反映此類硬體變動。
來源:顯示原文
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。