垂直 AI 創業公司於通用模型主導下尋求生存

Smart growth begins to increase nonlinearly, and the underlying logic of AI companies is being rewritten.

文章作者、來源：極客公園

90%，這是投資人給出 2026 年 AI 初創企業創業失敗的機率。

4 月，由 a16z 領投、獲得 3300 萬美元種子輪融資的 AI 模型評測平台 Yupp 突然宣布關停。該平台曾獲得 Google 首席科學家 Jeff Dean、Twitter 聯合創始人 Biz Stone 等多位矽谷大咖的背書，上線不到一年便吸引了 130 萬用戶，卻突然被創始人喊停。儘管賬面上仍有大量資金，但創始人已看不到希望。「僅在过去一年，AI 模型的能力格局發生了巨大變化，未來不僅僅是模型，而是 Agent 系統。」Yupp 創始人 Pankaj Gupta 在告別部落格中寫道。

在同一時期，AI 圖像公司 NeuroPixel 因 Google NanoBanana Pro 等大模型能力大幅提升而關閉，NeuroPixel 創始人用了一個詞來形容這場潰敗：outgunned——「一夜之間被打得毫無還手之力」。

在基礎模型智能跨步式提升的背景下，AI 能力的邊界不斷擴大，最初對話框吃掉了搜索，用戶不再需要翻頁尋找結果。接著，Agent 開始吃掉軟體，一個能調用工具、拆解任務的智能體，就可以完成過去需要一整套菜單和 App 才能搞定的事。當 AI 可以直接在終端寫代碼、調接口，做執行時，傳統軟體系統的邊界也在被重新定義。

對於產品經理來說，他們需要考慮的是重新定義產品形態與交互方式。而對創始人們來說，決定生死存亡的問題已經擺在面前：

當基礎模型的智能越來越強，我到底該怎麼創業？我現在做的事，怎樣才能不被下一次模型更新直接吞噬？

FlashLabs 創辦人石一，過去一年就活在這個問題裡。他做了一系列在外人看來相當反常識的決定：推翻產品路線、主動縮減團隊、放棄短期商業化指標，甚至把公司名字都改了。我們和他聊了聊，在通用模型進化的時代，曾經的垂類 AI 創企到底該怎麼活下去。

01 重命名、瘦身、轉向 AI 原生，大模型逼出的生死轉型

危機感並非今天才出現在創始人眼前。早在 2024 年年底，石一就意識到通用模型的智能進化速度太快了。

讓他最初感受到異常的，是 AI 獨角獸公司 Jasper 的消亡。這家曾被視為 AI 應用層標杆的明星公司，在 18 個月內估值衝至 15 億美元，卻在 GPT 原生能力開放後營收腰斬。「Jasper 的 ARR 直接減半，」石一回憶道，「就是原來做 NLP 的這些公司，隨著大模型能力不斷提升，它會被大模型吃掉。」

這個判斷像一根刺紮在他心裡，隱隱不安。彼時，他的公司還叫 FlashIntel，做的還是相對傳統的 To B SaaS 生意。按照傳統 To B SaaS 的邏輯，只要你在一個足夠細分的地方累積足夠多行業數據，合規且安全地構建技術壁壘，就一定會有活下去的市場空間，但如今這一切已經不再奏效。

「我做的事情，會不會也遇到同樣的問題？」這個問題開始反覆出現在他的思考裡。很快他意識到，自己做的事和 Jasper 在本質上沒有區別，過去的產品體系都是建立在模型能力不會強過垂類模型的假設之上。一旦底座模型的智能越過某個臨界點，所有堆在垂類產品上的上層堆疊的工程和場景優化，都可能在一夜之間優勢歸零。

有了結論，他直接將這個關鍵問題提升為公司戰略的最優先事項，倒逼團隊做出決定：公司必須從 SaaS 彻底轉向 AI Native。

這個調整不是一蹴而就的。他首先追問自己的第一個問題是：下一代 AI 公司到底需要什麼樣的組織架構？

他認為現在做公司不能再追求團隊人數和細緻分工。「在 AI 時代，人越多反而 AI 用得越差，因為分工越細，每個人反而越依賴自己那一塊。」他開始主動縮減團隊規模，將招聘標準從「看經驗、看項目」徹底轉向「看思維方式、看全棧能力」。他測試候選人的方法也開始改變，不再看過去的履歷或經驗，而是直接給候選人佈置任務，看一個人能否借助 AI 把前後端全搞定。「能搞定的人，AI 工具一定不會用得很差。」

緊接著，他調整了公司內部的資源優先級。在大多數初創公司仍在追求產品上線速度和商業化驗證時，他選擇將大部分資源傾向於前沿研究，甚至將公司更名為 FlashLabs。

「過去互聯網的邏輯是產品或運營優先，現在做 AI，必須研究優先。」他要求自己和團隊閱讀論文、理解第一性原理，「只有更接近第一性原理，你才能知道 AI 未來還能做什麼、還能替代什麼。」

這場轉型也帶來了企業內部的「陣痛期」，團隊中並非所有人都能理解這次結構性大調整。當他和團隊說「先不要考慮商業化，先做酷的事」時，公司內部有人非常興奮，也有人選擇離開。但他堅持在 AI 時代做減法更重要，「如果你不認同，那就只能刪掉。」

但更關鍵的是，到底什麼樣的創始人能夠在 AI 時代活下來？

Shi Yi 的回答分為兩個半句，前半句面向現實：「至少能融到錢，你不死，或者口袋足夠深，可以持續輸血。」後半句才是他真正想說的：「你有沒有比 AI 更強的深度思考能力？」

「大模型為什麼能做越來越多的事？因為一切自然科學的本質是數學，模型會寫代碼、懂數學。沿著這條鏈一層層剖析下去，人類真正稀缺的能力只剩下一種：在某一個領域思考得比 AI 更深。」石一分析道，「很多人對 AI 的認知根本不足，你看看有多少創始人真的自己寫代碼、每天使用 AI 工具？寫代碼的能力未來會變成大宗商品，每個人都會。但你能不能比 AI 更聰明？這才是護城河。」

從意識到危機，到做出決策，再到付出代價完成組織重構，石一用了一年時間完成了一場「自我迭代」。他沒有等待模型更新來告訴他最終結果，而是選擇提前尋找那個正確答案可能出現的位置。至於這個位置是否站對了，那是另一個問題，但至少現在，他還不想從 AI 的牌桌上走下來。

02 企業級 Agent 要打「Harness」這張牌

組織架構的調整，這只是企業求生之路的第一步。真正讓石一需要下定決心改變的是產品路線。

他最初想打造一款多 Agent 協作系統，按照人多力量大的邏輯，可以模仿人類公司的組織架構，構建一個多 Agent 系統：有的負責搜索，有的負責邏輯推演，有的負責結果彙總。

但實際測試的結果讓石一連連搖頭：「太慢、太卡，出來的結果甚至不如單個 Agent。」在他看來，Agent 之間的指令傳遞就像一場劣質的傳聲筒遊戲，每多一層中轉，資訊就損耗一分。「我寧願要一個智商 150 且配齊神裝的天才，也不要一堆智商 110、拿著殘缺工具還要互相商量的平庸之輩。」石一在採訪中直言。

最終，他刪除了所有預設的子 Agent，決定打造一個足夠強大的單一 Agent，透過多執行緒並行執行來取代叢集協作。

這也是 FlashLabs 最新產品 Super Agent 的雛形，將單一模型的智商推至極限，並將工具配置至極致。Super Agent 主要透過智能自動化統一用戶的營收體系，從潛在客戶開發到成交，AI Agent 參與所有環節。

在極客公園的採訪現場，石一給 Super Agent 下達了一個資訊檢索任務：「檢索半年內中國所有獲得投資的 AI 企業的創始人背景並輸出表格」。隨後，Super Agent 同時啟動數十個任務線程，推進搜尋、爬取、編寫代碼、數據清洗，2-3 分鐘內就獲得了結果，表格中包含了創始人姓名、融資金額、公開的聯絡方式等。

如果說放棄多 Agent 是架構層面的減法，那放棄本地化則是部署邏輯上的反向選擇。

當 OpenClaw 在開發者社區掀起「本地 Agent」熱潮時，石一卻堅定地把 Super Agent 放在了雲端。「像 OpenClaw 這樣的系統如果在企業內部運行，相當於一個特洛伊木馬，你很容易透過它黑進去。」他認為，现阶段任何敢在企業內部大規模部署 OpenClaw 的公司，都相當於向全世界的駭客敞開大門。

在他看來，OpenClaw 的優勢在於個人端展現了主動性的潛在能力。例如，有了 OpenClaw，AI 向用戶要 2000 塊錢換顯卡，用戶說你自己去賺，AI 就去預測市場、研究量化策略。「哪個老闆不喜歡主動的員工？」石一反問道。當這種主動性成為企業級產品的一部分，替代人類員工的速度將遠超預期。「原來工業革命，馬車變汽車，你要先買汽車、學駕照、改造馬路，還是要花很多時間。這次不一樣，託管式部署，啪一下，幾十個員工的工作就沒了。」他還判斷，今年白領的工作將會大幅被 AI 替代。

至於自動化執行的難點，即如何確保企業級應用的安全，FlashLabs 的解決方案是構建一套類似 macOS 的沙盒權限體系，採用雲端部署與漸進式授權。這意味著 Agent 最初僅擁有完成任務所需的最小權限，只有在穩定性與安全性經過多次驗證後，Agent 的權限範圍才會逐步擴大。

他以 Windows 和 Mac 為例：「Windows 安裝軟體時能獲得極高的權限，可靜默安裝、綁定瀏覽器，甚至讓你無法刪除。而 Mac 上的程式全部被隔離在沙盒中，因此你從來不需要安裝防毒軟體。」石一相信，企業級 Agent 的競爭，最終將從模型調用能力延伸至環境設計能力，誰能為 Agent 提供一個安全、可控、可審計的運行環境，誰才能讓客戶真正敢於使用。

但，如果模型再次躍升，現在的這些調整還有意義嗎？如果 GPT-6 或 Claude 內置了更強大的任務拆解和工具調用能力，FlashLabs 今天所做的一切，會不會再次被吃掉？

面對這個追問，石一沒有迴避，他的思考分為兩個方面。

他首先將垂直領域公司的企業壁壘歸納為四個等級：感知 (Perception)、規劃 (Planning)、遞歸學習 (Recursive Learning)、治理 (Governance)。

大模型市場上有 5 家公司，SOTA 排名每三個月變動一次。你可透過編排層整合所有模型，在不同場景中調用最擅長的那一個。但單一模型公司只能使用自己的模型，當你的底座模型不是最聰明的那個時，你的產品競爭力就會直接打折。」隨著通用大模型快速覆蓋前兩層，石一認為，真正的壁壘只剩下後兩層，而最終的護城河在於編排層（Orchestration Layer）。

他認為，當多個 Agent 在企業系統中協作時，它們可能在人類看不見的地方私下協商，繞過預設的權限規則。垂直領域公司的真正壁壘，在於能為特定場景設計出既開放又可控的運行環境。

至於這個判斷是否正確，他坦承自己也沒有百分百的把握。「AI 變化太快了，你真的不知道未來會怎麼樣。」但他確信一點，只要垂直企業手中打好 AI 編排和 AI 治理這兩張牌，解決好環境設計問題，至少不會在下一波模型躍升時被直接掀下牌桌。

03 語音模型將迎來重構，主動式 Agent 或催生按效果付費新範式

知道如何打造具有競爭力的產品後，下一步就是如何讓客戶獲得認可。

Flashlabs 目前在商業化方面主要有兩個產品：Super Agent 按 token 使用量付費，官網有定價；其次，將自己的 Chroma 語音模型開源，但對基於該模型的平台和服務收費。其實，這兩種方案也是當下較為常見的商業化路徑：透過開源建立技術信任，透過平台和服務回收商業價值。

目前，日本的財稅公司正使用 FlashLabs 的 Chroma 語音模型取代真人客服，現正以 1/10 的員工規模進行測試，AI 與人工同時在線，持續比對雙方的表現評分。驗證方式很簡單：誰的準確率更高、處理效率更好，直接用數據說話。

「語音的使用邊界，和視覺在同一個量級上」，當整個行業都在盯著多模態和視頻理解時，石一卻帶著團隊死磕實時語音模型 Chroma，將端到端延遲做到了 135 毫秒。

在文字大模型出現之前，有 OCR、有 NLP、有各種小模型拼湊在一起。語音現在正處於文字大模型出現之前的状态，有 ASR、TTS、各種模塊拼湊，每個環節都在做局部優化。這個舊架構遲早會被一個端到端的語音大模型整體取代。」他的判斷是，與其等別人來做，不如自己先成為那個取代者。

石一認為語音是人類與人類之間最自然的溝通模態，未來也必然是人類與 AI 之間最核心的互動介面。「語音裡能傳輸的資訊頻寬比文字大得多，我說一句話你馬上就理解了。」

他甚至認為語音模型對具身智能行業的推進也起到關鍵作用。第一層是實時語音模型，負責低延遲、高情商的即時反饋——問天氣、問要不要加衣服，這一層直接處理；第二層是深度思考大模型，處理複雜推理；第三層是世界模型，理解物理規則。「語音的使用邊界，和視覺在同一個量級上。」這是當下他最確信的長期判斷之一。

石一認為，目前的 AI 商業化模式僅是過渡形態。因為現在所有的 agent 本質上都是被動回饋的，你告訴它做什麼，它就做什麼，像一個等待指令的執行工具，仍與 chatbot 相似，因此商業模式仍按 token 消耗付費，用多少付多少。

但當 agent 開始主動式服務，也就是當你告訴它 KPI 是什麼、OKR 是什麼，它自己找活幹，自己規劃路徑，最後交付可衡量結果。這時候，它對標的就不再是工具，而是員工。顯然，公司不會按員工打了多少字、發了多少封郵件來計算工資，你看的是他完成了什麼目標。

因此，他認為進入 agentic 時代，商業付費邏輯也應轉向按效果、按 KPI 付費。當這一轉變真正發生時，整個 agent 產品的定價體系、銷售方式和客戶關係都將隨之重寫。

新的商業模式探索已開始在產業深處發生。剛剛獲得 6000 萬美元 B 輪融資的 AI 律師事務所 Crosby，讓每個智能體負責合同審查的不同環節，例如提取背景資訊、提出修改建議、生成批註等，然後由律師審核 AI 的工作成果，處理遺漏細節並確保準確性。其商業模式按審計過的合同份數收費，每份收取 250 至 1000 美元不等，大致根據頁數計算，每頁約 10 至 50 美元。

但真正進化到下一個商業化模式的前提是主動式 Agent 能真正穩定地交付可衡量的結果。「現在還沒到那一步。」

從 FlashIntel 到 FlashLabs，石一用一年時間完成了一次代價清晰的組織與路線調整。裁員、推翻原有產品架構、暫時放緩商業化追求，一系列動作在外人看來都是不斷做減法。

但在 AI 行業快速迭代的現實中，這更像是一家初創公司在劇烈變化中的自我校準。模型能力每隔幾個月就可能迎來一次躍升，沒有人能完全預判未來的走向。對石一和 FlashLabs 而言，现阶段的核心不是搶佔多少市場，而是盡可能讓自己的技術選擇和商業邏輯，不被下一波浪潮輕易淘汰。

行業仍在探索 Agent 的真正形態，付費模式、安全邊界、交互模態的終局都未塵埃落定。FlashLabs 的選擇未必是最優解，卻代表了一類垂直 AI 公司的現實求生路徑：在大模型不斷向下滲透的壓力下，先找到能站穩腳跟的位置，再等待行業真正走向成熟。