DeepSeek 將 API 成本降低 100 倍,引發關於 AI 基礎設施集中化的討論

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
2026 年 4 月 26 日的鏈上新聞顯示,DeepSeek 推出 V4 版本,將 API 成本降低 100 倍。輸入快取命中費用降至十分之一,加上折扣後,一百萬個代幣僅需 0.025 人民幣。AI + 加密貨幣新聞強調其影響,中國 A 股計算領域隨之飆升。然而,人們對 AI 基礎設施集中化的擔憂日益增加,大型雲端企業正加大資本支出。去中心化的替代方案,如 Gonka 協議,正在測試 GPU 網絡以對抗這一趨勢。

——從 Gonka 在 LA Hacks 2026 的演講談起

4月26日,DeepSeek 發布 V4 系列 API 新定價:全系輸入快取命中價格降至發售價的十分之一,Pro 版本叠加限時優惠後,百萬 Token 的處理成本低至 0.025 元——比一年前便宜了近百倍。A 股算力板塊當日集體漲停,市場情緒沸騰。

但在歡呼聲背後,有一個問題沒有人正面討論:當模型變得越來越便宜,運行模型所需的算力正在變得越來越集中。

數據不會說謊。2025 年第四季度,微軟、亞馬遜、Meta、谷歌四家雲廠商合計資本開支同比提升 64% 至 1186 億美元;預計 2026 年全年合計資本開支將進一步同比增長 53%,達到 5708 億美元。谷歌同期將 2026 年 TPU 芯片出貨量目標上調 50% 至 600 萬顆。英偉達 H100 系列的交貨週期,在部分市場已長達數月。

模型層的定價權正在向開發者傾斜,但算力層的控制權正在以更快的速度向少數巨頭收攏。這是 AI 時代一個隱蔽但深刻的矛盾。

Gonka

就在這個背景下,2026年4月24日,Gonka 協議聯合創始人 Daniil 和 David Liberman 走上了 LA Hacks 2026 的主旨演講台。這場 UCLA 年度最大高校駭客松,今年由 Liberman 兄弟擔任主旨演講嘉賓,面對的是數百名即將走入這個行業的頂尖工程師。他拋出的問題,在此刻格外清晰:去中心化算力,是否還來得及?

一、降價潮的另一面

DeepSeek V4 的降價邏輯,表面上是技術進步帶來的效率紅利——新的注意力機制壓縮了 Token 維度,結合 DSA 稀疏注意力,大幅降低了對計算和顯存的需求。但降價能夠持續發生,依賴的前提是某個地方的算力足夠充足、足夠便宜。

現實是,這個「足夠充足」的算力來源,正在全球範圍內快速向少數節點集中。光通信龍頭 Lumentum 的 CEO Michael Hurlston 不久前表示,按當前趨勢,公司到 2028 年的產能幾乎已全部售罄。這不是個別公司的困境,而是整個 AI 基礎設施供應鏈在高速擴張需求面前的集體緊張。

Daniil 在 LA Hacks 的演講中使用了一個簡單卻有力的對比:比特幣網絡的算力已超過谷歌、微軟、亞馬遜三家雲數據中心的總和——但這些算力在做什麼?在解一道無人需要答案的哈希謎題。全球閒置的 GPU 算力亦是如此:遊戲玩家機器中的顯卡、大學機房中的伺服器、中小型雲服務商手中的餘量,加總起來規模龐大,卻因缺乏協調機制而無法被 AI 推理所用。

Gonka 試圖解決的,正是這個協調問題——用工作量證明的激勵機制,把散落在全球的閒置 GPU 組織成一張可以承接真實 AI 推理任務的網絡。

二、推理是新的戰場

DeepSeek 的降價在中文互聯網中引發了對「AI 平權」的廣泛討論。但有一個被忽略的細節:降價降低的是「調用價格」,而非「算力成本」。隨著 AI 應用規模化,推理調用量的增長呈指數級——根據行業預測,到 2026 年,推理將佔全球 AI 算力消耗的三分之二左右。

這意味著什麼?每降低一個數量級的調用價格,實際需要的算力總量只會更多,不會更少。大模型的「民主化」,在某種程度上反而加速了算力層的集中化——因為只有擁有大規模算力的玩家,才能在超低毛利下撐住推理服務的運營。

這是一個正在形成的結構性鎖定:誰掌控推理端的物理算力,誰就掌控了 AI 時代真正的基礎設施入口。從這個角度看,去中心化算力網絡的意義,已經不僅僅是「便宜 50%」的成本優化,而是在集中化鎖定完成之前提供一條結構性的替代路徑。

三、對年輕建設者的真實拷問

LA Hacks 的參與者——來自加州頂尖高校的工程師和產品人員——很快將面臨一個並不浪漫的工程選擇:將自己的產品建在哪一層算力之上。

你的 AI 產品,推理調用的是誰的伺服器?

當該平台調整定價策略或存取政策時,你有遷移的能力嗎?

你幫助建立的用戶規模,是在給自己創造價值,還是在給平台輸送籌碼?

在 Web2 時代,開發者們已經體驗過這些問題:當應用的命運與平台算法或分發規則深度綁定,「獨立」就成為了一個需要隨時重新定義的詞。AI 時代的算力依賴,會將相同的邏輯複製到基礎設施層,而且由於切換成本更高,鎖定效應只會更強。

Gonka

黑客松,作為一種形式,有其內在的諷刺:在36小時內,以最少的資源、最快的速度構建出可運行的東西——這正是去中心化網絡激勵機制所追求的狀態。Daniil 在 LA Hacks 的講台上發言,不只是為了講述 Gonka,更像是在問這群人:你們未來要做的事情,是幫助加速這種集中化的趨勢,還是創造新的可能?

四、PoW 2.0:一個工程命題

Gonka 將工作量證明的激勵結構從哈希計算重新對準至 AI 推理,使網絡中近 100% 的算力貢獻直接對應真實任務。這套機制有一個工程上的關鍵要求:AI 推理任務必須是可驗證、可重現的——給定相同的模型權重、相同的隨機種子和輸入,任何節點都可以複現計算結果並校驗其有效性。這是 Gonka 從學術原型走向可運行網絡的核心工程難點。

從經濟學角度看,這套機制的意義在於:代幣價值天然錨定於物理算力成本,而非流動性情緒。貢獻算力的礦工獲得回報,調用算力的開發者支付費用,整個體系的激勵閉環不依賴於任何中間商的善意維持。

當然,技術可行性只是一部分。更難的問題是:在算力需求飛速增長、大玩家資本開支以百億美元為單位的時代,一個依靠社區自發貢獻組織起來的分佈式算力網絡,能不能在規模上構成真正意義上的競爭?

Gonka 的早期數據提供了一個參考坐標:主網上線不到一年,網絡聚合算力從 60 塊 H100 當量擴展至超過 10,000 塊,這個速度來自全球數百個獨立節點的自發接入,而非中心化調配。這不能證明規模問題已經解決,但它說明激勵機制有效地驅動了早期增長。

五、窗口期的問題

歷史上,基礎設施的主導權往往在早期快速收斂——鐵路時代如此,互聯網時代如此,移動互聯網時代亦然。每一次,都有人在標準尚未固化之前找到了插入的位置,也有人在集中化完成之後才意識到參與權已經大幅收窄。

AI 算力基礎設施目前處於哪個階段?從四大雲廠商 2026 年 5708 億美元的預期資本開支來看,集中化已經在加速;但從開發者的實際使用模式來看,供給側仍然存在大量未被有效整合的資源。這個間隙,是去中心化網絡在結構上能夠存在的空間。

Daniil 在演講中引用了一個對照:2000 年互聯網泡沫破滅後,留下的不是廢墟,而是鋪遍全球的光纖網絡,支撐了此後二十年數字經濟的運行。AI 基礎設施投資熱潮退去之後,沉澱下來的算力協議和激勵機制,將成為下一個週期的基礎設施——問題只是,哪些協議的底層邏輯足夠堅實,能在壓力下依然保持運轉。

這不是一個關於某個具體項目的問題,而是整個去中心化 AI 賽道需要直面的問題:治理設計是否能夠真正抵抗單點控制的侵蝕?激勵機制是否在規模擴大之後依然有效?算力網絡的去中心化,是否在技術執行層、代幣發行層、升級決策層三個維度上同時成立?

結語

DeepSeek 的降價讓「AI 民主化」的敘事再次升温。但民主化的推理調用,和民主化的算力基礎設施,是兩件不同的事。前者正在發生;後者能否發生,取決於接下來幾年裡,有多少人真的把這當成一個值得解決的工程問題,而不只是一個好聽的敘事。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露