DeepSeek 將 API 成本降低 100 倍，引發關於 AI 基礎設施集中化的討論

——從 Gonka 在 LA Hacks 2026 的演講談起

4月26日，DeepSeek 發布 V4 系列 API 新定價：全系輸入快取命中價格降至發售價的十分之一，Pro 版本叠加限時優惠後，百萬 Token 的處理成本低至 0.025 元——比一年前便宜了近百倍。A 股算力板塊當日集體漲停，市場情緒沸騰。

但在歡呼聲背後，有一個問題沒有人正面討論：當模型變得越來越便宜，運行模型所需的算力正在變得越來越集中。

數據不會說謊。2025 年第四季度，微軟、亞馬遜、Meta、谷歌四家雲廠商合計資本開支同比提升 64% 至 1186 億美元；預計 2026 年全年合計資本開支將進一步同比增長 53%，達到 5708 億美元。谷歌同期將 2026 年 TPU 芯片出貨量目標上調 50% 至 600 萬顆。英偉達 H100 系列的交貨週期，在部分市場已長達數月。

模型層的定價權正在向開發者傾斜，但算力層的控制權正在以更快的速度向少數巨頭收攏。這是 AI 時代一個隱蔽但深刻的矛盾。

Gonka

就在這個背景下，2026年4月24日，Gonka 協議聯合創始人 Daniil 和 David Liberman 走上了 LA Hacks 2026 的主旨演講台。這場 UCLA 年度最大高校駭客松，今年由 Liberman 兄弟擔任主旨演講嘉賓，面對的是數百名即將走入這個行業的頂尖工程師。他拋出的問題，在此刻格外清晰：去中心化算力，是否還來得及？

一、降價潮的另一面

DeepSeek V4 的降價邏輯，表面上是技術進步帶來的效率紅利——新的注意力機制壓縮了 Token 維度，結合 DSA 稀疏注意力，大幅降低了對計算和顯存的需求。但降價能夠持續發生，依賴的前提是某個地方的算力足夠充足、足夠便宜。

現實是，這個「足夠充足」的算力來源，正在全球範圍內快速向少數節點集中。光通信龍頭 Lumentum 的 CEO Michael Hurlston 不久前表示，按當前趨勢，公司到 2028 年的產能幾乎已全部售罄。這不是個別公司的困境，而是整個 AI 基礎設施供應鏈在高速擴張需求面前的集體緊張。

Daniil 在 LA Hacks 的演講中使用了一個簡單卻有力的對比：比特幣網絡的算力已超過谷歌、微軟、亞馬遜三家雲數據中心的總和——但這些算力在做什麼？在解一道無人需要答案的哈希謎題。全球閒置的 GPU 算力亦是如此：遊戲玩家機器中的顯卡、大學機房中的伺服器、中小型雲服務商手中的餘量，加總起來規模龐大，卻因缺乏協調機制而無法被 AI 推理所用。

Gonka 試圖解決的，正是這個協調問題——用工作量證明的激勵機制，把散落在全球的閒置 GPU 組織成一張可以承接真實 AI 推理任務的網絡。

二、推理是新的戰場

DeepSeek 的降價在中文互聯網中引發了對「AI 平權」的廣泛討論。但有一個被忽略的細節：降價降低的是「調用價格」，而非「算力成本」。隨著 AI 應用規模化，推理調用量的增長呈指數級——根據行業預測，到 2026 年，推理將佔全球 AI 算力消耗的三分之二左右。

這意味著什麼？每降低一個數量級的調用價格，實際需要的算力總量只會更多，不會更少。大模型的「民主化」，在某種程度上反而加速了算力層的集中化——因為只有擁有大規模算力的玩家，才能在超低毛利下撐住推理服務的運營。

這是一個正在形成的結構性鎖定：誰掌控推理端的物理算力，誰就掌控了 AI 時代真正的基礎設施入口。從這個角度看，去中心化算力網絡的意義，已經不僅僅是「便宜 50%」的成本優化，而是在集中化鎖定完成之前提供一條結構性的替代路徑。

三、對年輕建設者的真實拷問

LA Hacks 的參與者——來自加州頂尖高校的工程師和產品人員——很快將面臨一個並不浪漫的工程選擇：將自己的產品建在哪一層算力之上。

你的 AI 產品，推理調用的是誰的伺服器？

當該平台調整定價策略或存取政策時，你有遷移的能力嗎？

你幫助建立的用戶規模，是在給自己創造價值，還是在給平台輸送籌碼？

在 Web2 時代，開發者們已經體驗過這些問題：當應用的命運與平台算法或分發規則深度綁定，「獨立」就成為了一個需要隨時重新定義的詞。AI 時代的算力依賴，會將相同的邏輯複製到基礎設施層，而且由於切換成本更高，鎖定效應只會更強。

Gonka

黑客松，作為一種形式，有其內在的諷刺：在36小時內，以最少的資源、最快的速度構建出可運行的東西——這正是去中心化網絡激勵機制所追求的狀態。Daniil 在 LA Hacks 的講台上發言，不只是為了講述 Gonka，更像是在問這群人：你們未來要做的事情，是幫助加速這種集中化的趨勢，還是創造新的可能？

四、PoW 2.0：一個工程命題

Gonka 將工作量證明的激勵結構從哈希計算重新對準至 AI 推理，使網絡中近 100% 的算力貢獻直接對應真實任務。這套機制有一個工程上的關鍵要求：AI 推理任務必須是可驗證、可重現的——給定相同的模型權重、相同的隨機種子和輸入，任何節點都可以複現計算結果並校驗其有效性。這是 Gonka 從學術原型走向可運行網絡的核心工程難點。

從經濟學角度看，這套機制的意義在於：代幣價值天然錨定於物理算力成本，而非流動性情緒。貢獻算力的礦工獲得回報，調用算力的開發者支付費用，整個體系的激勵閉環不依賴於任何中間商的善意維持。

當然，技術可行性只是一部分。更難的問題是：在算力需求飛速增長、大玩家資本開支以百億美元為單位的時代，一個依靠社區自發貢獻組織起來的分佈式算力網絡，能不能在規模上構成真正意義上的競爭？

Gonka 的早期數據提供了一個參考坐標：主網上線不到一年，網絡聚合算力從 60 塊 H100 當量擴展至超過 10,000 塊，這個速度來自全球數百個獨立節點的自發接入，而非中心化調配。這不能證明規模問題已經解決，但它說明激勵機制有效地驅動了早期增長。

五、窗口期的問題

歷史上，基礎設施的主導權往往在早期快速收斂——鐵路時代如此，互聯網時代如此，移動互聯網時代亦然。每一次，都有人在標準尚未固化之前找到了插入的位置，也有人在集中化完成之後才意識到參與權已經大幅收窄。

AI 算力基礎設施目前處於哪個階段？從四大雲廠商 2026 年 5708 億美元的預期資本開支來看，集中化已經在加速；但從開發者的實際使用模式來看，供給側仍然存在大量未被有效整合的資源。這個間隙，是去中心化網絡在結構上能夠存在的空間。

Daniil 在演講中引用了一個對照：2000 年互聯網泡沫破滅後，留下的不是廢墟，而是鋪遍全球的光纖網絡，支撐了此後二十年數字經濟的運行。AI 基礎設施投資熱潮退去之後，沉澱下來的算力協議和激勵機制，將成為下一個週期的基礎設施——問題只是，哪些協議的底層邏輯足夠堅實，能在壓力下依然保持運轉。

這不是一個關於某個具體項目的問題，而是整個去中心化 AI 賽道需要直面的問題：治理設計是否能夠真正抵抗單點控制的侵蝕？激勵機制是否在規模擴大之後依然有效？算力網絡的去中心化，是否在技術執行層、代幣發行層、升級決策層三個維度上同時成立？

結語

DeepSeek 的降價讓「AI 民主化」的敘事再次升温。但民主化的推理調用，和民主化的算力基礎設施，是兩件不同的事。前者正在發生；後者能否發生，取決於接下來幾年裡，有多少人真的把這當成一個值得解決的工程問題，而不只是一個好聽的敘事。