過去兩年,AI 交易幾乎統治了全球股票市場。
英偉達、半導體設備、HBM、先進封裝、數據中心、電力設備、變壓器、製冷、燃氣輪機,凡是能被納入AI基礎設施鏈條的資產,都被市場反覆重估。這場交易並未失效,反而上漲到讓投資者不得不重新面對一個更困難的問題:AI產業鏈第一階段的贏家已獲市場獎勵至極致,下一步還能繼續上漲嗎?
高盛和SemiAnalysis的兩份報告,正好站在這個分岔口上。
高盛的 James Covello 評估較為保守:AI 基礎設施的第一階段已充分定價,晶片與「賣鏟子」的鏈條攫取了過多確定性利潤,但企業端的 ROI 仍未普遍實現,雲供應商的現金流壓力亦在上升。根據此邏輯,接下來更佳的相對交易策略,並非繼續追漲半導體,而是看多超大規模雲廠商、低配半導體。
SemiAnalysis 的答案幾乎相反:如果 Agentic AI 真的讓 token 變成生產資料,模型實驗室的毛利開始改善,前沿模型仍保有定價權,那麼 AI 基礎設施並非「漲夠了」,而是尚未完全根據新一輪 token 價值重新定價。英偉達、台積電、記憶體、Neocloud、模型實驗室,都有繼續分潤增量價值的理由。
這不是一場關於 AI 有沒有前途的爭論。
AI 的資本支出仍在上升,AI 基礎設施股也未見降溫。真正的问题已轉變為:晶片層已將第一輪利潤留在賬上,市場現在爭論的是這筆利潤是否已被充分定價;如果具代理能力的 AI 繼續放大代幣價值,下一輪增量利潤會繼續留在硬體層,還是開始重新分配至模型實驗室、雲廠商和企業軟體層。
高盛關注的,是一條尚未閉環的產業鏈
高盛報告最尖銳的地方,不是質疑 AI 用戶增長,也不是否認技術進步。
Covello 承認了兩件事:消費者採用 AI 的速度比他們原先預期更快;雲廠商即使股價承壓,也沒有像他們預想的那樣削減 AI 資本開支,反而繼續提高投入。AI 沒有降溫,資本開支也沒有退潮。
但高盛看得更遠。
消費者使用 AI,許多仍停留在免費層級。用戶增長可以證明產品的吸引力,卻無法直接支付 GPU、資料中心、電力、網路和模型推論的帳單。企業端才是 AI 經濟能否閉環的關鍵:企業是否願意持續付費,能否透過 AI 節省成本、增加收入、提升產出,決定整條鏈條能否長期承受今天的資本支出。
高盛的回應較為謹慎。
報告提到,企業在生成式AI上的投入已經很大,但大量組織還沒有獲得可驗證的回報;同時,全球IT支出仍在上升,AI並未在總量層面降低企業的技術預算。對投資者來說,這意味著一個很現實的問題:企業正在購買AI、測試AI、談論AI,但AI尚未普遍進入利潤表。
這與AI基礎設施鏈條的利潤形成了鮮明對比。
晶片公司已實現盈利,存儲、電力和數據中心相關公司則被市場反覆重新評估。雲服務商則在另一端承擔資本支出。數據中心建設、GPU採購、電力接入、網絡設備和伺服器機架等開支,首先都計入雲服務商的賬目。高盛報告指出,超大規模雲服務商已耗盡部分經營性現金流盈餘,並開始透過債務融資支持數據中心建設,2025年數據中心債務發行額將翻倍至1820億美元。
這就是高盛眼中的不平衡。
在正常的半導體週期中,晶片公司賺大錢,通常說明客戶也在擴張。客戶賺錢,繼續購買晶片,晶片公司持續繁榮。但這輪 AI 更為複雜:晶片鏈條的利潤最明確,但客戶層和應用層的回報尚未同樣清晰。
因此,高盛的判斷並非「AI沒用」,而是「現在的分賬方式難以長期線性外推」。
半導體公司已將第一階段最確定的利潤收入囊中。問題是,下游客戶是否有足夠利潤,繼續支撐上游如此高的資本開支和利潤集中度。
高盛的交易建議,其實押的是「均值回歸」
高盛提供的交易建議看似反直覺:相對看多超大規模雲廠商,低配半導體。
這背後有兩條路徑。
第一條路徑,企業 AI 的 ROI 開始實現。當企業證明 AI 能帶來收入、效率和成本優勢時,市場將重新理解雲廠商的資本支出。過去被視為拖累自由現金流的投入,將重新轉化為未來的收入和平台控制力。雲廠商的估值將得到修復,半導體也會受惠,但由於半導體此前已獲得市場大量獎勵,相對彈性未必更大。
第二條路徑,企業的 ROI 仍面臨困難。雲廠商在現金流壓力和投資者壓力下削減資本支出,市場將獎勵更好的現金流紀律。半導體鏈條則需面對訂單預期下修。
高盛認為,這兩條路徑都支持「雲廠商相對於半導體更佳」。真正會導致這筆交易失敗的情況是第三條路徑:企業 ROI 仍然模糊,但雲廠商繼續不計成本加碼,而半導體繼續佔據產業鏈絕大部分利潤。
這正是過去兩年市場最熟悉的状态。
正因如此,高盛報告的焦點並非AI技術,而是市場定價。AI基礎設施的優勢已被充分交易,雲供應商的劣勢也已被充分反映。下一步,市場將關注這兩個方向是否出現反轉。
SemiAnalysis 所看到的,是 token 的價值突變
SemiAnalysis 從完全不同的入口切入。
它並不否認在 2023 年至 2025 年間,AI 的價值主要流向基礎設施。英偉達、電力、數據中心、存儲,確實是第一階段的大贏家。模型公司和推理服務商在早期並不舒適,許多 AI 產品看起來只是一個更好的搜尋框,毛利也遠稱不上漂亮。
但 SemiAnalysis 認為,2025 年底以後,事情發生了變化。
變化來自 Agentic AI。
過去的 token 更像「問答成本」。用戶問一句,模型答一句。它能節省時間,但價值邊界有限。現在的 token 開始進入複雜工作流:寫代碼、做財務模型、生成儀表板、分析財報、整理數據、製作圖表。
SemiAnalysis 以自己的公司為例,其分析師已每天使用 agent 處理研究和建模工作,過去這些任務要么需要初級分析師花費大量小時,要么根本無法排進工作流程。文章披露,SemiAnalysis 在 Anthropic Claude 上的年化 token 支出曾高達 1095 萬美元,token 支出約相當於員工薪酬的 30%。
這組數字未必能代表所有企業,但它代表了一類邊際用戶的變化。
對普通消費者來說,AI 訂閱可能只是每月幾十美元的工具。對高強度知識工作者來說,token 開始變成生產資料。
幾美元、幾十美元的 token,換來的不只是幾段文字,而是模型、圖表、代碼、數據清洗、財報分析,甚至是過去根本不會被執行的工作。用戶看待 AI 成本的方式也會隨之變化:他們不再只問「每百萬 token 多少錢」,而會問「這些 token 替代了多少人工,增加了多少產出」。
這就是 SemiAnalysis 與高盛分歧的起點。
高盛看到的是平均企業的 ROI 還不清晰。SemiAnalysis 看到的是最強用戶已開始大量消耗 token,且願意為更強模型付費。
為什麼模型實驗室突然變得重要
SemiAnalysis 的第二個關鍵判斷是,模型實驗室的單位經濟性正在改善。
這與過去市場的擔憂相反。
此前,模型公司被認為夾在晶片和雲廠商之間。收入增長很快,但訓練和推理成本增長更快。用戶越多,成本越高。模型越強,資本支出越重。這個模式看起來像高增長、低毛利、高燒錢。
Agentic AI 改變了這張表。
- 在價格端,前沿模型能執行更高價值的任務,用戶願意為更強模型支付溢價。
- 在成本端,硬體迭代、推理優化、快取機制和軟體工程持續降低單位 token 成本。
- 在產品端,模型公司可透過更高階的 SKU、更快的響應速度和更強的推理能力,實現分層定價。
SemiAnalysis 提到,在 B300 上運行 DeepSeek 的案例中,不同的軟體優化組合可將同一硬體的吞吐量從約 1000、8000 提升至約 14000 tokens/秒/GPU。結合硬體升級,最優化的 GB300 NVL72 配置相較於 H100 在 FP8 下的吞吐量約高 17 倍;若切換至 Hopper 原生不支援的 FP4,差距可達 32 倍,而每 GPU 的總擁有成本僅高出約 70%。
這意味著,模型實驗室一邊可以提升 token 創造的經濟價值,一邊可以降低 token 生產成本。
SemiAnalysis 表示,Anthropic 的 ARR 從 90 億美元上升至 440 億美元以上,推理基礎設施的毛利潤率從 38% 提升至 70% 以上。即使模型定價下降,高端模型使用比例上升、快取命中率提高以及硬體效率改善,也可能推動毛利潤率繼續擴張。
如果這一判斷成立,AI 產業鏈的第二階段就不再只是「晶片繼續贏」或「雲廠商反彈」。
模型實驗室將從燒錢層,轉變為新的價值捕獲層。
真正的分歧:平均企業,還是邊際用戶
高盛和SemiAnalysis表面上在爭AI的投資回報率,實際上爭的是哪個樣本更能代表未來。
高盛看的是平均企業。
這些企業擁有複雜的數據系統、歷史IT負擔、權限管理、合規要求和審批流程。許多公司為了向市場和董事會交代AI戰略,先推出聊天機器人、內部助手和試點項目。錢確實花了,但業務流程未必改變。流程不改,投資回報率就難以體現在財報中。
這就是高盛強調數據結構和編排層的原因。
如果一家零售企業沒有打通庫存、客戶畫像和推薦系統,AI 客服可能會推薦一款缺貨的商品。如果一家企業沒有模型路由層,即使是簡單查詢也會交給最昂貴的前沿模型,成本自然會失控。AI 落地受阻的關鍵,已不再是模型不夠強大,而是企業還未做好讓模型進入業務系統的準備。
SemiAnalysis 看的是邊際用戶。
研究、代碼、建模、圖表、財報分析,這些任務天然適合 agent。它們高度文本化、數位化、結構化,結果容易評估,用戶也有能力將 AI 嵌入工作流程。這樣的組織,會比普通企業更早看到 ROI,也更願意增加 token 消費。
資本市場要判斷的,是這種領先樣本會不會擴散。
如果 SemiAnalysis 所見到的僅是少數超級用戶的異常值,高盛框架將佔上風。AI 的資本支出將越來越受到現金流約束,半導體鏈條需消化高預期,雲廠商可能因支出紀律和估值壓縮而獲得相對回報。
如果 SemiAnalysis 看到的是擴散前夜的領先指標,市場就不能以今日企業的低 ROI 否定 AI 鏈條。一旦 Agentic AI 進入更多白領工作流程,token 需求、模型收入、雲收入和硬體需求將同步上升。
這個判斷,比「看多 AI 還是看空 AI」更重要。市場交易的從來不是靜態平均數,而是邊際變化能不能變成主流。
NVIDIA:已賺夠,還是仍未充分漲價
高盛與SemiAnalysis最大的資本市場分歧,最終落在英偉達和半導體鏈條上。
高盛的觀點很直接:半導體已經攫取了第一階段最大且最確定的利潤。市場將「賣鏟子」的邏輯反映在價格後,風險報酬比開始變差。只要雲廠商的資本支出放緩,半導體鏈條就會面臨估值與訂單的雙重壓力。
SemiAnalysis 認為,英偉達和台積電控制了 AI 時代最稀缺的資源,卻尚未完全按價值定價。
文章提到,記憶體價格過去一年上漲約6倍,Neocloud一年期H100租賃合約價格較2025年10月低點上漲約40%。與此同時,英偉達和台積電並沒有像下游token價值那樣快速重新定價。
SemiAnalysis 將英偉達稱為 AI 生態的「央行」。
這個比喻很貼切。英偉達控制的是算力流動性。它有能力漲價,但不能把整個系統抽乾。價格提得太狠,會刺激客戶加速轉向自研 ASIC、TPU、Trainium,也會帶來監管壓力。台積電也類似。先進節點極度稀缺,但它長期重視客戶關係和生態穩定,不會在景氣上行期把所有稀缺性一次性變現。
克制不代表沒有空間。
Rubin VR NVL72 是 SemiAnalysis 判斷英偉達仍擁有定價權的重要依據。根據其模型,Neocloud 要讓 VR NVL72 項目達到類似 GB300 項目的 15.6% IRR,租金約需 4.92 美元/小時/GPU;如果按照 GB300 的每 PFLOP 租賃價格平價推算,VR NVL72 理論天花板約為 12.25 美元/小時/GPU;即便採用更保守的 0.55 美元/PFLOP,也對應約 9.63 美元/小時/GPU,接近成本定價門檻的兩倍。
這裡的含義很清楚:只要下游 token 價值繼續上升,英偉達的新系統仍有提價空間,Neocloud 仍可能賺錢,終端用戶仍可能接受。
高盛與SemiAnalysis的分歧因此變得尖銳。
高盛認為,半導體的獨賺局面不可持續,因為下游尚未有足夠利潤。
SemiAnalysis 認為,下游利潤池正在擴大,因此硬體層並非賺得太多,而是尚未完全按價值收費。
決定勝負的變數只有一個:AI 創造的新利潤池,能否大到同時養活模型實驗室、雲廠商、Neocloud、英偉達、台積電、存儲和電力鏈。
The cake isn't big enough, Goldman Sachs wins.
蛋糕繼續變大,SemiAnalysis 贏。
雲端供應商處於最微妙的位置
雲端服務商是這場爭論中最尷尬的一層。
它們既是資本支出最大的買家,也是 AI 需求最有可能實現商業化的平台。它們受到英偉達、存儲、電力鏈的擠壓,同時擁有企業客戶、雲服務、模型 API、自研晶片和軟體生態。
高盛看多雲廠商,是因為市場已將許多負面因素計入價格。資本支出壓制自由現金流,投資者質疑AI的投資回報率,估值承受壓力。只要出現以下兩種情況之一,雲廠商便有修復路徑:企業AI收入實現,或資本支出收縮。
SemiAnalysis 從需求端觀察雲廠商。只要代幣需求持續擴張,模型實驗室和企業客戶就需要更多算力。算力受限於先進製程、記憶體、電力和機架級系統。買方最擔心的不是價格昂貴,而是無法取得。
因此,雲端廠商並非單純的受害者,也不是自動的贏家。
它們必須以財報證明,AI 資本支出能轉化為收入、利潤和客戶黏性。雲業務增長是否重新加速、AI 收入披露是否更清晰、推理利用率能否提升、自研晶片能否降低對英偉達的依賴、企業客戶是否從試點轉向長期部署、自由現金流是否穩定,這些指標都將比過去更重要。
這些指標改善,高盛的相對看多雲廠商邏輯會增強。
這些指標長期未見改善,雲廠商仍如處於英偉達與企業客戶之間、承受資本支出壓力的層級。
軟體層決定 ROI 能否從樣本變成平均數
高盛報告中對「數據結構」和「編排層」的強調,可能是最接近企業現實的一部分。
企業AI不會永遠停留在員工打開聊天框提問。真正具有財務影響的AI,需進入客服、銷售、財務、採購、研發、風控、供應鏈、IT運維。每個流程都有數據、權限、合規、審批、歷史系統和責任邊界。
Regardless of how powerful the model is, it cannot bypass these things.
這就是企業軟體層重新變得重要的地方。低風險、高頻任務可以交給輕量模型或開源模型;高風險、高價值任務才需要前沿模型。中間需要一層系統判斷任務類型、調用數據、控制權限、選擇模型、監控成本、回寫結果。
- 傳統 SaaS 公司的優勢是行業經驗、客戶關係、數據入口和工作流沉澱。劣勢是技術債和迭代速度。
- AI 原生公司的優勢在於產品速度、模型調用能力和成本結構,劣勢是缺乏企業入口和行業上下文。
- 前沿模型公司的優勢是最強智能,劣勢是缺乏企業流程控制權。
軟體層不會輕易被 AI 吃掉。沒有數據和流程控制權的軟體公司,可能被模型抽象掉。掌握數據結構、工作流程和模型路由的軟體公司,反而有機會將 AI 變成更大的市場,從賣座席變成賣生產力。
企業的 ROI 能否從 SemiAnalysis 這樣的強用戶樣本擴散到普通企業,很大程度上取決於這一層。
資本市場下一步關注六件事
AI 交易過去問的是:誰最靠近算力?
這個問題現在太粗略了。
下一階段,市場會追問更細的變數。
第一,token 價值是否繼續上升。如果 Agentic AI 從代碼、研究、分析擴散到更多白領工作流程,模型實驗室和推理鏈將繼續被重新評估。
第二,模型實驗室的毛利是否持續改善。收入增長已不夠,市場會關注推理成本、快取效率、SKU升級和前沿模型的定價權。
第三,雲廠商能否將資本支出轉化為收入。AI 資本支出本身不再自動被視為利好,只有能進入雲收入、推理毛利和企業合約的資本支出,才會獲得市場獎勵。
第四,英偉達能否繼續從系統級瓶頸漲價。GPU 只是第一層,Rubin、SOCAMM、網路、機架級系統、軟體棧和供應鏈採購能力,決定英偉達能不能繼續抽成。
第五,台積電和存儲能否重新定價稀缺。先進節點、HBM、DRAM、SOCAMM 和先進封裝,如果繼續成為供給瓶頸,價值不會輕易離開上游。
第六,企業軟體能否拿到 AI 落地入口。沒有流程入口的軟體公司會被壓縮,有入口、有數據、有編排能力的軟體公司可能變得更貴。
在 AI「鏟子」統治市場之後,爭論才剛剛開始
AI 基礎設施交易未失效。
它漲得太猛,才逼出了高盛和 SemiAnalysis 這場分歧。
高盛提醒市場,晶片鏈的好處已被充分消化。如果企業投資回報率長期不來,雲廠商的現金流將反噬資本支出,半導體獨賺的格局將被修正。
SemiAnalysis 提醒市場,不能以 2024 年的 AI 體驗來判斷 2026 年的 Agentic AI。token 正在成為生產資料,模型實驗室開始提升毛利,算力供應仍然緊張,英偉達和台積電可能尚未完全按價值定價。
將這兩種判斷放在一起,AI 交易的重心已經發生變化。
過去兩年,市場獎勵的是稀缺資產。接下來,市場要看誰能把 AI 創造的經濟價值持續留在利潤表裡。
如果 SemiAnalysis 看到的是邊際拐點,AI 鏈條的蛋糕會繼續變大,模型實驗室、雲廠商、英偉達、台積電、存儲和電力鏈都有繼續分賬的理由。
如果高盛看到的是更接近平均企業的現實,資本開支會先撞上現金流,半導體鏈條需要消化過高預期,雲廠商反而因為估值壓縮和潛在支出紀律獲得更好的相對回報。
目前最可能的狀態,介於兩者之間。
最強用戶已開始大舉買入 token,普通企業還未算清賬目。資本市場會先交易最強用戶帶來的邊際變化,再等待平均企業以財報驗證。驗證越快,SemiAnalysis 的世界就越近;驗證越慢,高盛的交易勝率就越高。
AI「鏟子」仍統治市場,但問題已從「誰賣鏟子」轉變為另一張賬本:誰已經賺夠了,誰還能繼續漲價,誰會成為下一層真正的收租人。
