編者按:中國 AI 實驗室正成為全球大模型競爭中越來越難以忽視的力量。它們的優勢不僅在於人才眾多、工程能力強、迭代速度快,更來自一種非常現實的組織方式:少談概念,多做模型;少強調個人明星,多強調團隊執行;少依賴外部服務,更傾向於自行掌握核心技術棧。
本文作者 Nathan Lambert 在走訪多家中國頂尖 AI 實驗室後發現,中國的 AI 生態與美國並不完全相同。美國更重視原創範式、資本投入和頂尖科學家的個人影響力;中國則更擅長在既有方向上快速追趕,透過開源、工程優化和大量年輕研究者的投入,迅速將模型能力推至前沿。
最值得關注的,不是中國 AI 是否已超過美國,而是兩種不同的發展路徑正在形成:美國更像是由資本和明星實驗室驅動的前沿競賽,中國則更像是由工程能力、開源生態和技術自控意識共同推動的產業競賽。
This means that future AI competition will not only be about model rankings, but also about organizational capabilities, developer ecosystems, and industrial execution. The real transformation of China's AI lies in its shift from merely copying Silicon Valley to participating in global frontiers in its own way.
以下為原文:
坐在從杭州開往上海的新式高鐵上,我望向窗外,看到起伏分明的山脊,山上點綴著風力渦輪機,在落日映照下形成剪影。群山構成了背景,眼前則是大片田野與成片高樓交錯的景象。
我懷著極大的謙遜從中國返回。前往一個如此陌生的地方,卻受到如此熱情的歡迎,這是一種非常溫暖且極具人情味的體驗。我有幸見到了許多 AI 生態中的人,他們是我此前只在遠處知道的人;而他們以燦爛的笑容和熱情迎接我,讓我再次意識到,我的工作以及整個 AI 生態本身,都是全球性的。
中國研究者的態度
正在構建語言模型的中國公司,可謂非常適合作為這項技術的「快速跟隨者」。它們建立在中國長期以來的教育與工作文化傳統之上,同時也擁有與西方略有不同的科技公司建設方式。
如果僅從產出來看,也就是最新、最大的模型,以及這些模型所支援的代理式工作流程;再看投入要素,例如優秀的科學家、大規模數據和加速計算資源,中國實驗室和美國實驗室看起來大致相似。真正長期存在的差異,出現在這些要素如何被組織、如何被塑造之中。
我一直認為,中國實驗室之所以非常擅長追趕並保持在前沿附近,一個原因在於它們在文化上與這項任務非常匹配。但在沒有直接和人交流之前,我覺得自己不適合將這種直覺歸因於某種重要影響。與中國頂尖實驗室中許多優秀、謙遜且開放的科學家交談之後,我的很多想法變得更加清晰了。
今天要構建最好的大語言模型,在很大程度上取決於貫穿整個技術棧的細緻工作:從數據,到架構細節,再到強化學習算法的實現。模型的每一個環節都有可能帶來一些提升,而如何將這些提升組合在一起,是一個複雜的過程。在這個過程中,一些非常聰明的個人所做的工作,可能必須被擱置,以便讓整體模型在多目標優化中達到最大化。
美國研究者顯然也非常擅長解決單個組件的問題,但美國更有一種「為自己發聲」的文化。作為科學家,當你主動為自己的工作爭取關注時,你往往會更成功;而當代文化也正在推動一種新的成名路徑,也就是成為「頭部 AI 科學家」。這會帶來直接衝突。
外界廣泛傳聞,Llama 組織在這些利益訴求被嵌入層級化組織後,因政治壓力而崩潰。我也聽其他實驗室提到,有時可能需要「安撫」一位頂尖研究者,讓他們停止抱怨自己的想法未被納入最終模型。無論這是否完全真實,含義都很明確:自我意識和職業晉升的慾望,確實會阻礙人們構建最佳模型。即使美國和中國之間僅存在這種文化上的微小方向性差異,也可能對最終產出產生有意義的影響。
其中一部分差異,與中國究竟是誰在構建這些模型有關。在所有實驗室裡,一個很直接的現實是:核心貢獻者中很大比例仍是正在讀書的學生。這些實驗室都相當年輕,這讓我想起我們在 Ai2 的組織方式:學生被視為同伴,並直接整合進大語言模型團隊。
這與美國頂尖實驗室非常不同。在美國,OpenAI、Anthropic、Cursor 等公司根本不會提供實習機會。其他公司如 Google 名義上會提供與 Gemini 相關的實習,但許多人擔心自己的實習是否會被隔離在真正核心工作之外。
總的來說,這種輕微的文化差異可能通過以下方式提升模型構建能力:為了提升最終模型,人們更願意從事那些不那麼光鮮的工作;剛開始參與 AI 構建的人,可能不受此前幾輪 AI 炒作週期的影響,因此能更快適應新的現代技術方法。事實上,我與一位中國科學家的對話中,他明確將這一點視為優勢;較低的自我意識使組織架構在一定程度上更容易擴展,因為人們較少試圖「操縱系統」;大量人才非常適合解決那些在其他地方已有概念驗證的問題,等等。
這種趨勢更有利於提升當下語言模型的能力,與一種已知的刻板印象形成對照:人們常認為,中國研究者較少產出那種更具創造性、能開闢新領域的「從 0 到 1」學術研究。
在此次行程中幾次較偏學術的實驗室訪問裡,許多負責人都談到,他們正在培養這種更具雄心的研究文化。與此同時,我們談話過的一些技術負責人則懷疑,這種科學研究方式的重塑在短期內是否可能實現,因為它需要重新設計教育體系和激勵體系,而這個改造太大,很難在當前經濟均衡下發生。
這種文化似乎正在培養出一批非常擅長「大語言模型構建遊戲」的學生和工程師。當然,他們的人數也極其充足。
這些學生告訴我,中國也正在發生與美國類似的人才外流:許多原本考慮走學術道路的人,如今打算留在產業界。其中最有趣的一句話來自一位原本想當教授的研究者,他說自己想當教授,是因為希望接近教育系統;但他隨後又評論說,教育已經被大語言模型解決了——「學生為什麼還要來找我聊天!」
學生帶著新鮮的視角進入大語言模型領域,這是一大優勢。過去幾年裡,我們見證了大語言模型的核心範式不斷變化:從擴展 MoE,到擴展強化學習,再到支援智能體。要做好其中任何一項,都需要極快地吸收大量背景資訊,既包括更廣泛的文獻,也包括公司內部的技術棧。
學生習慣於做這類事情,也願意以謙遜的心態放下對「什麼應該有效」的所有預設。他們全身心投入,將人生奉獻其中,只為獲得改進模型的機會。
這些學生也非常直接,而且沒有那些會讓科學家分心的哲學閒談。當我問他們如何看待模型的經濟影響或長期社會風險時,擁有複雜觀點並希望在這些議題上施加影響的中國研究者明顯少得多。他們認為自己的角色就是構建最好的模型。
這種差異很微妙,也容易被否認。但當你與一位優雅、聰明、能用英語清晰表達的研究者長時間交談時,這種差異最易被感受到:當你問及一些關於 AI 更哲學層面的問題時,這些基本問題會懸浮在空氣中,而對方則流露出一種簡單的困惑。對他們而言,這是一種範疇錯誤。
甚至有一位研究者引用了 Dan Wang 的著名判斷:與美國由律師主導相比,中國是由工程師治理的。在談到這些問題時,他用這個類比強調他們想要建設的願望。在中國,並沒有像 Dwarkesh 或 Lex 這類超主流播客那樣,系統性地培養中國科學家明星影響力的路徑。
我試圖讓中國科學家評論由 AI 引發的未來經濟不確定性、超越簡單 AGI 能力的問題,或模型應如何表現的道德爭議;這些問題最終都讓我看到了這些科學家的成長背景和教育背景(已編輯 1)。他們極其專注於自己的工作,但他們成長於一個並不鼓勵討論和表達社會應如何組織、如何改變的體系。
從更遠的視角來看,尤其是北京,給我的感覺很像灣區:一個具有競爭力的實驗室,可能就在步行或搭車幾分鐘之內。我下飛機後,在前往酒店的路上順道去了阿里巴巴北京園區。接下來的 36 小時裡,我們去了智譜 AI、月之暗面、清華大學、美團、小米和 01.ai。
在中國乘坐滴滴出行非常方便。如果你選擇 XL 車型,經常會被分配到配有按摩椅的電動小型麵包車。我們向研究者詢問人才爭奪戰,他們說這與我們在美國經歷的非常相似。研究者跳槽很正常,而人們選擇去哪裡,很大程度上取決於當下哪裡的氛圍最好。
在中國,大語言模型社區給人的感覺更像一個生態系統,而不是彼此交戰的部落。在許多非公開對話中,我聽到的幾乎全是對同行的尊重。所有中國實驗室都對字節跳動及其流行的豆包模型心存忌憚,因為它是中國唯一一家前沿閉源實驗室。與此同時,所有實驗室都非常尊重 DeepSeek,認為它是執行層面最具研究品味的實驗室。在美國,當你與實驗室成員進行非公開交流時,火花往往很快就會四濺。
中國研究者的謙遜中,最讓我印象深刻的一點是,他們在商業層面也經常聳聳肩,說那不是他們的問題。而在美國,似乎每個人都沉迷於各種生態層面的產業趨勢,從數據賣方,到算力,再到融資。
中國 AI 產業與西方實驗室的不同與相似之處
今天構建一個 AI 模型之所以如此有趣,是因為這已不再只是把一群優秀研究者聚集在同一棟大樓裡,共同打造一項工程奇蹟。過去確實更像這樣,但為了維持 AI 業務,大語言模型正逐漸變成一種混合體:它涉及構建、部署、融資,以及推動這一創造物的採用。
Top AI companies exist within complex ecosystems. These ecosystems provide funding, computing power, data, and more resources to continuously push the frontiers forward.
在西方生態系統中,圍繞創造和維持大語言模型所需各類投入要素的整合方式,已相對充分地被概念化和繪製出來。Anthropic 和 OpenAI 就是典型代表。因此,如果我們能發現中國實驗室在這些問題上的思考方式有明顯不同,就能看出不同公司未來可能押注於哪些有意義的差異。當然,這些未來也會受到融資和/或算力限制的強烈影響。
我將與這些實驗室交流後獲得的幾個最大「AI 產業層面」的收穫整理如下:
第一,國內 AI 需求已經出現早期跡象。
有一種被廣泛討論的假設認為,中國 AI 市場會更小,因為中國公司通常不願意為軟體付費,因此永遠無法釋放出一個足以支撐實驗室的巨大推理市場。
但此判斷僅適用於與 SaaS 生態相對應的軟體支出,而 SaaS 生態在中國歷史上一直很小。另一方面,中國顯然仍有一個龐大的雲市場。
一個關鍵且尚未回答的問題是:中國企業在 AI 上的支出,到底會更像 SaaS 市場,也就是規模較小;還是更像雲市場,也就是基礎性支出。這個問題連中國實驗室內部也在討論。總體來看,我感覺 AI 正在更接近雲市場,而沒有人真正擔心圍繞新工具形成的市場無法增長。
第二,大多數開發者都深受 Claude 影響。
儘管 Claude 名義上在中國被禁用,但中國大多數 AI 開發者都非常迷戀 Claude,以及它如何改變了他們構建軟體的方式。僅僅因為中國過去不太願意購買軟體,並不意味著我不會認為中國將出現一輪巨大的推理需求增長。
中國技術人員非常務實、謙遜且有動力。這一點給我的感受,比任何「不花錢買軟體」的歷史習慣都更強。
一些中國研究者會提到他們使用自己的工具進行構建,例如 Kimi 或 GLM 的命令行工具,但所有人都會提到他們使用 Claude。令人意外的是,很少有人提到 Codex,而 Codex 在灣區明顯正在迅速流行。
第三,中國公司有一種技術所有權心態。
中國文化正與一個轟鳴運轉的經濟引擎結合,產生一些難以預測的結果。我留下的一個深刻感受是,眾多 AI 模型反映的是這裡許多技術企業在現實中的一種務實均衡。並不存在一個總規劃。
這個產業由對字節跳動和阿里巴巴的尊重所定義。它們被視為憑藉強大資源贏得眾多市場的大型在位者。DeepSeek 是受尊敬的技術領導者,但遠非市場領導者。它們設定方向,但缺乏經濟上贏得市場的結構。
這就留下了像美團或螞蟻集團這樣的公司。西方人可能會驚訝於它們為何也在構建這些模型。但實際上,它們顯然將大語言模型視為未來技術產品的核心,因此需要一個強大的基礎。
當它們對一個強大的通用模型進行微調時,開源社區對模型的反饋會讓它們的技術棧更堅固,同時它們也可以為自己的產品保留內部微調版本。這個行業中的「開放優先」心態,很大程度上由實用主義定義:它能幫助模型獲得強力反饋,能回饋開源社區,也能賦能它們自身的使命。
Fourth, government support is real, but the scale is unclear.
人們經常聲稱,中國政府正在積極推動大語言模型競賽的開放。但這是一個由多個層級組成、相對去中心化的政府體系,而每一層都沒有明確的操作手冊,規定自己究竟應該做什麼。
北京不同街區之間會競爭,爭取讓科技公司將辦公室設在那裡。提供給這些公司的「幫助」,幾乎可以肯定包括消除許可證等官僚流程中的繁文縟節。但這種幫助能走多遠?政府的不同層級能否幫助吸引人才?它們能否幫助走私晶片?
在整個訪問過程中,確實有許多關於政府興趣或協助的提及,但相關資訊遠遠不足,使我無法以斷言的方式報告細節,也無法讓我對政府究竟如何改變中國 AI 發展軌跡形成一個自信的世界觀。
當然,也完全沒有跡象表明中國政府最高層在影響模型的任何技術決策。
第五,數據產業遠不如西方發達。
我們此前聽說,Anthropic 或 OpenAI 為單個環境的花費超過 1000 萬美元,每年為推動強化學習前沿的累計支出達到數億美元量級。因此,我們很想知道,中國實驗室是否也在從美國公司購買同樣的環境,或者是否有一個鏡像式的國內生態在支持它們。
答案並非完全意義上的「沒有數據產業」,而是根據它們的經驗,數據產業的質量相對較差,因此在很多情況下,更好的做法是內部自建環境或數據。研究者本身會花費大量時間製作強化學習訓練環境,而字節跳動、阿里巴巴等較大的公司,則可以擁有內部數據標註團隊來支持這項工作。這一切都呼應了前面提到的「自建而非購買」的心態。
第六,對更多英偉達晶片的需求非常強烈。
NVIDIA 的算力是訓練的黃金標準,而每個人的進展都受限於缺乏更多算力。如果供應充足,顯然它們會購買。包括華為在內的其他加速器在推理方面獲得了正面評價。無數實驗室都可以使用華為晶片。
這些要點描繪出一個非常不同的 AI 生態系統。如果將西方實驗室的運作方式直接套用於中國同行,往往會造成範疇錯誤。關鍵問題在於,這些不同的生態系統是否會產出本質上有差異的模型類型;還是說,中國模型始終會被解讀為類似於 3 到 9 個月前的美國前沿模型。
結論:全球均衡
在這次旅行之前,我對中國了解得太少;而離開時,我感覺自己才剛剛開始學習。中國不是一個可以用規則或配方來表達的地方,而是一個擁有非常不同動力機制和化學反應的地方。它的文化如此古老、如此深厚,並仍與國內技術建設的方式完全交織在一起。我還有許多東西需要學習。
美國當前權力結構中的許多部分,都將它們現有的中國觀視為決策中的關鍵心理工具。在我與中國幾乎每一家頂尖 AI 實驗室進行過正式或非正式的面對面交流之後,我發現中國有許多品質和本能,是西方決策方式很難建模的。
即使我直接詢問這些實驗室為何要開放發布它們最強的模型,我仍然很難將「所有權心態」與「真誠支持生態」之間的交集完全串聯起來。
這裡的實驗室非常務實,並不一定對開源持絕對立場,它們並非會開放發布每一個建構的模型。但它們在支持開發者、支持生態系統,以及將開放作為進一步了解自身模型的方式上,具有深遠的意圖。
幾乎每一家中國大型科技公司都在構建自己的通用大語言模型。我們已經看到,像美團這樣的平台型服務公司、像小米這樣的大型消費科技公司,都發布了開放權重模型。美國的同類公司通常只會購買服務。
這些公司構建大語言模型,並非為了在熱門新事物中刷存在感,而是出於一種深層且根本的願望:掌控自己的技術棧,並發展當下最重要的技術。當我從筆記本電腦上抬頭,總能在地平線上看到一簇簇起重機時,這顯然與中國更廣泛的建設文化和建設能量相契合。
中國研究者身上的人情味、魅力和真誠溫暖,令人感到非常親近。在個人層面上,我們在美國習慣的那種殘酷的地緣政治討論,完全沒有滲透到他們身上。這個世界需要更多這種簡單的積極性。作為 AI 社區的一員,我現在更擔心的是,圍繞國籍標籤,成員和群體之間正出現裂縫。
如果我說自己不希望美國實驗室在 AI 技術棧的每一個部分都成為明確的領導者,那是在撒謊。尤其是在我投入大量時間的開放模型領域,我是美國人,這是一個誠實的偏好。
與此同時,我希望開放生態本身能在全球範圍內繁榮發展,因為這可以為世界創造更安全、更易取得、也更有用的 AI。而當下的問題是,美國實驗室是否會採取行動,佔據這種領導地位。
當我寫完這篇文章時,關於行政命令對開放模型影響的更多傳聞正在流傳。這可能會進一步複雜化美國領導力與全球生態之間的協同關係——這並沒有讓我更有信心。
感謝我在月之暗面、智譜、美團、小米、通義千問、螞蟻靈光、01.ai 以及其他機構中有幸交流的所有優秀人士。每個人都是如此熱情,並慷慨地付出自己的時間。隨著我的想法逐漸成形,我會繼續分享關於中國的觀察,涵蓋更廣泛的文化層面,也包括 AI 領域本身。
顯然,這些知識將與 AI 前沿發展正在展開的故事直接相關。
