當所有人都盯著模型層廝殺時,一支掌握開源推理事實標準的團隊,攜著硅谷最豪華的種子輪投資人陣容,正式將矛頭對準新時代的 AI 基礎設施。
文章作者、來源:機器之心
5 月 5 日,AI 基礎設施初創公司 RadixArk 宣布完成 1 億美元種子輪融資,投後估值 4 億美元。無論金額、估值還是投資人陣容,這都是 2026 年 AI Infra 賽道中目前最重的一筆早期下注。

本輪由 Accel 領投,Spark Capital 聯合領投。機構投資人涵蓋了 NVIDIA 旗下 NVentures、AMD、聯發科、Databricks,以及 Salience Capital、HOF Capital、Walden Catalyst、A&E Investment、LDVP、WTT Fubon Family 等一線機構。從 GPU 到 CPU,從邊緣晶片到數據平台,核心硬體與系統層的關鍵玩家幾乎全部到齊。

在頂級機構陣營之外,多位擁有 Intel、Broadcom、OpenAI、xAI、PyTorch 等背景的全球技術領袖也以天使投資人身份參與了本輪投資。
「硬體三巨頭 CEO + 頂級模型實驗室創始人 + PyTorch 創造者」,要在一輪種子輪中同時湊齊這個組合,在 AI Infra 的歷史上都極其罕見。熟悉這一領域的投資人直言:這是在押注「下一代基礎設施事實標準」。
全世界最好的推理引擎,掌握在他們手中
RadixArk 的故事,必須從一個叫做 SGLang 的開源項目說起。

自 2023 年誕生以來,SGLang 在兩年內以驚人的迭代速度,成為開源大模型推理的事實標準之一,在 GitHub 累積了 27K+ stars,被部署在 400K+ GPU 上。每天有數萬億 token 的生產流量運行在 SGLang 上,其用戶包括 Google、Microsoft、NVIDIA、Oracle、AMD、LinkedIn、xAI、Thinking Machines Lab。
過去兩年,模型架構經歷了 MoE、長上下文、推理模型、多模態融合等一系列重大變革。每一次架構重塑,SGLang 都實現了 Day-0 兼容——首創開源模型發布即支援機制,效能直逼硬體物理極限。投資人反覆提及的一個評價是,SGLang 的迭代速度與工程紀律相結合的風格,在開源項目中絕對名列前茅。
Behind the underlying discipline is a founding team with deep expertise in systems and algorithms.

CEO 盛穎(Ying Sheng)本科畢業於上海交通大學 ACM 班,博士畢業於史丹福大學,是 LMSYS Org 的發起者及 SGLang 的主要創始人之一。她在博士期間曾作為訪問學者在 UC Berkeley Sky Lab 進行研究,先後就職於 Databricks 和 xAI,曾擔任 xAI 推理團隊負責人。盛穎在注意力稀疏化、KV 緩存重用等方向的工作備受業界關注,SGLang 早期的 RadixAttention 機制即是其代表作之一。
CTO 朱邦華(Banghua Zhu)本科畢業於清華大學電子工程系,博士畢業於 UC Berkeley,師從機器學習泰斗 Michael I. Jordan 與 Jiantao Jiao。博士期間曾聯合創立 Nexusflow,後被英偉達收購,並出任英偉達 Principal Research Scientist。在他經手過的項目中,既有面向工業級訓練系統的全套搭建,也有 NVIDIA 內部底層系統優化與大規模訓練的長期積累。
某核心硬件廠商的技術負責人評價,這是 2026 年 AI Infra 創業中最具價值的一組創始人組合:一邊是掌握開源推理事實標準的研究型創業者,一邊是來自 GPU 廠商最核心研究層的大模型算法專家。
掌握每日處理萬億級 token 的推理引擎 SGLang——這本身已是 AI Infra 創業的夢幻起點。而這支團隊的底牌,還不止這一張。
Day-0 徵服 DeepSeek V4 強化學習
除了推理引擎,RadixArk 在訓練端同樣有所突破。
在 2025 年 11 月,團隊開源了強化學習框架 Miles,專注於大規模 RL 訓練的穩定性與效率,目前已被超過 20 支團隊用於 MoE 模型的強化學習訓練。
在 2025–2026 年,Reasoning、Tool Use、Agentic 能力的競爭全面升級,而每一步進步背後,都需要一套能承受超大規模分佈式 RL 的系統。業內觀察人士指出了一個被反覆提及卻長期無法解決的痛點:今天大模型團隊最痛苦的,遠超任何一段單點優化。從訓練到 RL 再到上線推理這條完整鏈路上的邊界摩擦,每一段單獨看都接近最優,拼在一起卻處處掉效率。
Miles 與 SGLang 的組合,正試圖填平當前大模型團隊在「訓練-RL-推理」完整鏈路上面臨的效率斷層。
新模型 Day-0 的支援能力是 Infra 團隊工程實力的直觀體現。
於 4 月 25 日,架構複雜的 DeepSeek-V4 正式發布。當天,SGLang 與 Miles 即實現了對 DeepSeek-V4 推理與 RL 訓練的同時支援。這得益於團隊在底層系統級優化上的突破,包括為混合注意力設計的 ShadowRadix 前綴快取、可在單一晶片內完成壓縮的 Flash Compressor,以及將 Top-K 延遲壓縮至 15 微秒的 Lightning TopK,並打通了從 FP8 推理至 BF16 訓練的完整 RL 管線。
全棧共識背書:
巨頭們集體入局,到底在焦慮什麼?
NVIDIA、AMD、聯發科、Broadcom、Intel——這些在硬體層最關鍵的公司,同時出現在種子輪,這在業內幾乎是不可想像的。事實上,硬體廠商比任何人都清楚,當前算力仍然昂貴且稀缺,僅靠堆疊硬體已無法持續。一個真正實現硬體解耦、並能在異構平台上將晶片效能壓榨到極限的開源推理系統,是他們最迫切需要的最大訴求。
Databricks、PyTorch 創始人、OpenAI / Thinking Machines / xAI 的一線人物同時入局,則代表了模型與系統層對「訓練-推理一體化基礎設施」的強烈預期。天使陣容中的每一個名字,都意味著一個極度精準的下注視角:
- Chen Liwu, CEO of Intel, a towering figure in the semiconductor industry with decades of deep experience.
- John Schulman 是 OpenAI 前聯合創始人、Thinking Machines Lab 聯合創始人,以及強化學習的奠基人之一。
- Soumith Chintala——PyTorch 聯合創始人,全球深度學習框架的守門人。
- Igor Babuschkin,xAI 前聯合創始人,親手搭建了業界最複雜的訓練系統與硬體平台。
- Lilian Weng,Thinking Machines Lab 聯合創始人,對 AI 系統的工業級落地有最一線的洞察。
當這些在任何場合都能獨自撐起一輪融資的人,選擇集體出現在同一張 cap table 上,便是對未來的熱切押注。
面向所有人的基礎設施:讓 AI 的建設權,不再被少數人壟斷
RadixArk 的願景,用一句話可以概括:讓 AI 基礎設施,成為像電力一樣普及、可靠、不被任何人壟斷的公共品。這聽起來像個理想主義宣言,但從實際落地來看,他們正在將這句話變為現實:
- 學術界
三年前,一位專注於 LLM 推理優化的博士生面前通常只有兩個選擇:一個是 OpenAI 的 API,按 token 計費,無法查看任何內部結構;另一個是古老的開源代碼,README 裡寫著「works on a single GPU」,與論文中實現的真實分佈式場景之間隔著數年的工程量。
SGLang 打破了這一二選一——工業級日吞吐量、代碼完全開源,史丹佛、柏克萊、CMU、華盛頓大學的系統研究團隊均將其設為基線。對於從事 agent 研究的學者而言,RadixAttention 的 prefix cache 將共享前綴組織成樹狀結構,相同的 KV 僅計算一次,原本需要兩天才能完成的實驗,現在半天就能完成,本地推理時引用 SGLang 幾乎已成為默認做法。
- 初創公司
一群離開大廠的工程師,帶著對某個垂直場景的深刻理解出來創業。他們沒有百萬美元的算力預算,沒有專門的 Infra 團隊,只有對產品的一腔直覺。
過去,搭建生產級推理管線、維護跨硬體相容性的工程負擔,往往超出種子輪公司的承載上限,大量時間耗費在重複造輪子上。現在,他們可以直接基於 SGLang 建立接近前沿性能的推理服務,並用 Miles 訓練領域專屬模型——基礎設施不再是瓶頸,省下的時間與資金可以全部投入他們真正想打造的東西。
- 科技巨頭
為什麼 Google、Microsoft、NVIDIA 這些擁有全世界最強內部 Infra 的巨頭,也會出現在 SGLang 的用戶列表裡?答案藏在本輪投資人結構中——NVIDIA、AMD、聯發科、Broadcom、Intel 五家核心硬體廠商同時入局。它們比任何人都清楚,一個硬體無關、不被任何競爭對手鎖定的開源推理系統對整個生態意味著什麼。使用一個被社區共同維護、多家硬體廠商共同支持的開源系統,本身就是更高維度的基礎設施戰略。
RadixArk 的官方表述沒有煽情,但足夠銳利:
「下一代 AI 不應受到對私有基礎設施訪問權的限制。更多團隊應能擁有自己的模型、自己的系統、自己的未來。」
這 1 億美元的種子輪融資,就是要讓這句話變成工程現實:讓 SGLang 成為任何新模型的 Day-0 生產標準;把 Miles 做成大規模訓練與 RL 的基礎設施級框架;然後,在開源核心之上,建一套不鎖定模型、不綁架客戶、卻提供頂級基礎設施能力的託管平台。
RadixArk 的願景,從來不是取代誰。而是讓一個學術實驗室、一個三人工作坊、一家剛獲得種子輪融資的初創公司,與市值萬億的巨頭——站在同一條基礎設施起跑線上。
如果說 2023 年的 Anthropic、2024 年的 Mistral、2025 年的 Thinking Machines Lab 各自代表了 AI 模型層一次方向性的下注,那麼 2026 年的 RadixArk 下注的東西更底層、也更漫長:讓前沿 AI 的建設權,真正回到足夠多的人手裡。
融資落定後,團隊發起了一項面向開源社區的回饋:參與註冊平台並轉發推特,即可在 RadixArk 托管平台正式上線後獲得免費使用積分。對於這支從開源社區成長起來的團隊而言,這是用真金白銀的算力,感謝那些一路支持 SGLang 走到今天的人。

- 連結:platform.radixark.com
