Smart growth begins to increase nonlinearly, and the underlying logic of AI companies is being rewritten.
文章作者、來源:極客公園
90%,這是投資人給出 2026 年 AI 初創企業創業失敗的機率。
4 月,由 a16z 領投、獲得 3300 萬美元種子輪融資的 AI 模型評測平台 Yupp 突然宣布關停。該平台曾獲得 Google 首席科學家 Jeff Dean、Twitter 聯合創始人 Biz Stone 等多位矽谷大咖的背書,上線不到一年便吸引了 130 萬用戶,卻突然被創始人喊停。儘管賬面上仍有大量資金,但創始人已看不到希望。「僅在过去一年,AI 模型的能力格局發生了巨大變化,未來不僅僅是模型,而是 Agent 系統。」Yupp 創始人 Pankaj Gupta 在告別部落格中寫道。
在同一時期,AI 圖像公司 NeuroPixel 因 Google NanoBanana Pro 等大模型能力大幅提升而關閉,NeuroPixel 創始人用了一個詞來形容這場潰敗:outgunned——「一夜之間被打得毫無還手之力」。
在基礎模型智能跨步式提升的背景下,AI 能力的邊界不斷擴大,最初對話框吃掉了搜索,用戶不再需要翻頁尋找結果。接著,Agent 開始吃掉軟體,一個能調用工具、拆解任務的智能體,就可以完成過去需要一整套菜單和 App 才能搞定的事。當 AI 可以直接在終端寫代碼、調接口,做執行時,傳統軟體系統的邊界也在被重新定義。
對於產品經理來說,他們需要考慮的是重新定義產品形態與交互方式。而對創始人們來說,決定生死存亡的問題已經擺在面前:
當基礎模型的智能越來越強,我到底該怎麼創業?我現在做的事,怎樣才能不被下一次模型更新直接吞噬?
FlashLabs 創辦人石一,過去一年就活在這個問題裡。他做了一系列在外人看來相當反常識的決定:推翻產品路線、主動縮減團隊、放棄短期商業化指標,甚至把公司名字都改了。我們和他聊了聊,在通用模型進化的時代,曾經的垂類 AI 創企到底該怎麼活下去。
01 重命名、瘦身、轉向 AI 原生,大模型逼出的生死轉型
危機感並非今天才出現在創始人眼前。早在 2024 年年底,石一就意識到通用模型的智能進化速度太快了。
讓他最初感受到異常的,是 AI 獨角獸公司 Jasper 的消亡。這家曾被視為 AI 應用層標杆的明星公司,在 18 個月內估值衝至 15 億美元,卻在 GPT 原生能力開放後營收腰斬。「Jasper 的 ARR 直接減半,」石一回憶道,「就是原來做 NLP 的這些公司,隨著大模型能力不斷提升,它會被大模型吃掉。」
這個判斷像一根刺紮在他心裡,隱隱不安。彼時,他的公司還叫 FlashIntel,做的還是相對傳統的 To B SaaS 生意。按照傳統 To B SaaS 的邏輯,只要你在一個足夠細分的地方累積足夠多行業數據,合規且安全地構建技術壁壘,就一定會有活下去的市場空間,但如今這一切已經不再奏效。
「我做的事情,會不會也遇到同樣的問題?」這個問題開始反覆出現在他的思考裡。很快他意識到,自己做的事和 Jasper 在本質上沒有區別,過去的產品體系都是建立在模型能力不會強過垂類模型的假設之上。一旦底座模型的智能越過某個臨界點,所有堆在垂類產品上的上層堆疊的工程和場景優化,都可能在一夜之間優勢歸零。
有了結論,他直接將這個關鍵問題提升為公司戰略的最優先事項,倒逼團隊做出決定:公司必須從 SaaS 彻底轉向 AI Native。
這個調整不是一蹴而就的。他首先追問自己的第一個問題是:下一代 AI 公司到底需要什麼樣的組織架構?
他認為現在做公司不能再追求團隊人數和細緻分工。「在 AI 時代,人越多反而 AI 用得越差,因為分工越細,每個人反而越依賴自己那一塊。」他開始主動縮減團隊規模,將招聘標準從「看經驗、看項目」徹底轉向「看思維方式、看全棧能力」。他測試候選人的方法也開始改變,不再看過去的履歷或經驗,而是直接給候選人佈置任務,看一個人能否借助 AI 把前後端全搞定。「能搞定的人,AI 工具一定不會用得很差。」
緊接著,他調整了公司內部的資源優先級。在大多數初創公司仍在追求產品上線速度和商業化驗證時,他選擇將大部分資源傾向於前沿研究,甚至將公司更名為 FlashLabs。
「過去互聯網的邏輯是產品或運營優先,現在做 AI,必須研究優先。」他要求自己和團隊閱讀論文、理解第一性原理,「只有更接近第一性原理,你才能知道 AI 未來還能做什麼、還能替代什麼。」
這場轉型也帶來了企業內部的「陣痛期」,團隊中並非所有人都能理解這次結構性大調整。當他和團隊說「先不要考慮商業化,先做酷的事」時,公司內部有人非常興奮,也有人選擇離開。但他堅持在 AI 時代做減法更重要,「如果你不認同,那就只能刪掉。」
但更關鍵的是,到底什麼樣的創始人能夠在 AI 時代活下來?
Shi Yi 的回答分為兩個半句,前半句面向現實:「至少能融到錢,你不死,或者口袋足夠深,可以持續輸血。」後半句才是他真正想說的:「你有沒有比 AI 更強的深度思考能力?」
「大模型為什麼能做越來越多的事?因為一切自然科學的本質是數學,模型會寫代碼、懂數學。沿著這條鏈一層層剖析下去,人類真正稀缺的能力只剩下一種:在某一個領域思考得比 AI 更深。」石一分析道,「很多人對 AI 的認知根本不足,你看看有多少創始人真的自己寫代碼、每天使用 AI 工具?寫代碼的能力未來會變成大宗商品,每個人都會。但你能不能比 AI 更聰明?這才是護城河。」
從意識到危機,到做出決策,再到付出代價完成組織重構,石一用了一年時間完成了一場「自我迭代」。他沒有等待模型更新來告訴他最終結果,而是選擇提前尋找那個正確答案可能出現的位置。至於這個位置是否站對了,那是另一個問題,但至少現在,他還不想從 AI 的牌桌上走下來。
02 企業級 Agent 要打「Harness」這張牌
組織架構的調整,這只是企業求生之路的第一步。真正讓石一需要下定決心改變的是產品路線。
他最初想打造一款多 Agent 協作系統,按照人多力量大的邏輯,可以模仿人類公司的組織架構,構建一個多 Agent 系統:有的負責搜索,有的負責邏輯推演,有的負責結果彙總。
但實際測試的結果讓石一連連搖頭:「太慢、太卡,出來的結果甚至不如單個 Agent。」在他看來,Agent 之間的指令傳遞就像一場劣質的傳聲筒遊戲,每多一層中轉,資訊就損耗一分。「我寧願要一個智商 150 且配齊神裝的天才,也不要一堆智商 110、拿著殘缺工具還要互相商量的平庸之輩。」石一在採訪中直言。
最終,他刪除了所有預設的子 Agent,決定打造一個足夠強大的單一 Agent,透過多執行緒並行執行來取代叢集協作。
這也是 FlashLabs 最新產品 Super Agent 的雛形,將單一模型的智商推至極限,並將工具配置至極致。Super Agent 主要透過智能自動化統一用戶的營收體系,從潛在客戶開發到成交,AI Agent 參與所有環節。
在極客公園的採訪現場,石一給 Super Agent 下達了一個資訊檢索任務:「檢索半年內中國所有獲得投資的 AI 企業的創始人背景並輸出表格」。隨後,Super Agent 同時啟動數十個任務線程,推進搜尋、爬取、編寫代碼、數據清洗,2-3 分鐘內就獲得了結果,表格中包含了創始人姓名、融資金額、公開的聯絡方式等。
如果說放棄多 Agent 是架構層面的減法,那放棄本地化則是部署邏輯上的反向選擇。
當 OpenClaw 在開發者社區掀起「本地 Agent」熱潮時,石一卻堅定地把 Super Agent 放在了雲端。「像 OpenClaw 這樣的系統如果在企業內部運行,相當於一個特洛伊木馬,你很容易透過它黑進去。」他認為,现阶段任何敢在企業內部大規模部署 OpenClaw 的公司,都相當於向全世界的駭客敞開大門。
在他看來,OpenClaw 的優勢在於個人端展現了主動性的潛在能力。例如,有了 OpenClaw,AI 向用戶要 2000 塊錢換顯卡,用戶說你自己去賺,AI 就去預測市場、研究量化策略。「哪個老闆不喜歡主動的員工?」石一反問道。當這種主動性成為企業級產品的一部分,替代人類員工的速度將遠超預期。「原來工業革命,馬車變汽車,你要先買汽車、學駕照、改造馬路,還是要花很多時間。這次不一樣,託管式部署,啪一下,幾十個員工的工作就沒了。」他還判斷,今年白領的工作將會大幅被 AI 替代。
至於自動化執行的難點,即如何確保企業級應用的安全,FlashLabs 的解決方案是構建一套類似 macOS 的沙盒權限體系,採用雲端部署與漸進式授權。這意味著 Agent 最初僅擁有完成任務所需的最小權限,只有在穩定性與安全性經過多次驗證後,Agent 的權限範圍才會逐步擴大。
他以 Windows 和 Mac 為例:「Windows 安裝軟體時能獲得極高的權限,可靜默安裝、綁定瀏覽器,甚至讓你無法刪除。而 Mac 上的程式全部被隔離在沙盒中,因此你從來不需要安裝防毒軟體。」石一相信,企業級 Agent 的競爭,最終將從模型調用能力延伸至環境設計能力,誰能為 Agent 提供一個安全、可控、可審計的運行環境,誰才能讓客戶真正敢於使用。
但,如果模型再次躍升,現在的這些調整還有意義嗎?如果 GPT-6 或 Claude 內置了更強大的任務拆解和工具調用能力,FlashLabs 今天所做的一切,會不會再次被吃掉?
面對這個追問,石一沒有迴避,他的思考分為兩個方面。
他首先將垂直領域公司的企業壁壘歸納為四個等級:感知 (Perception)、規劃 (Planning)、遞歸學習 (Recursive Learning)、治理 (Governance)。
大模型市場上有 5 家公司,SOTA 排名每三個月變動一次。你可透過編排層整合所有模型,在不同場景中調用最擅長的那一個。但單一模型公司只能使用自己的模型,當你的底座模型不是最聰明的那個時,你的產品競爭力就會直接打折。」隨著通用大模型快速覆蓋前兩層,石一認為,真正的壁壘只剩下後兩層,而最終的護城河在於編排層(Orchestration Layer)。
他認為,當多個 Agent 在企業系統中協作時,它們可能在人類看不見的地方私下協商,繞過預設的權限規則。垂直領域公司的真正壁壘,在於能為特定場景設計出既開放又可控的運行環境。
至於這個判斷是否正確,他坦承自己也沒有百分百的把握。「AI 變化太快了,你真的不知道未來會怎麼樣。」但他確信一點,只要垂直企業手中打好 AI 編排和 AI 治理這兩張牌,解決好環境設計問題,至少不會在下一波模型躍升時被直接掀下牌桌。
03 語音模型將迎來重構,主動式 Agent 或催生按效果付費新範式
知道如何打造具有競爭力的產品後,下一步就是如何讓客戶獲得認可。
Flashlabs 目前在商業化方面主要有兩個產品:Super Agent 按 token 使用量付費,官網有定價;其次,將自己的 Chroma 語音模型開源,但對基於該模型的平台和服務收費。其實,這兩種方案也是當下較為常見的商業化路徑:透過開源建立技術信任,透過平台和服務回收商業價值。
目前,日本的財稅公司正使用 FlashLabs 的 Chroma 語音模型取代真人客服,現正以 1/10 的員工規模進行測試,AI 與人工同時在線,持續比對雙方的表現評分。驗證方式很簡單:誰的準確率更高、處理效率更好,直接用數據說話。
「語音的使用邊界,和視覺在同一個量級上」,當整個行業都在盯著多模態和視頻理解時,石一卻帶著團隊死磕實時語音模型 Chroma,將端到端延遲做到了 135 毫秒。
在文字大模型出現之前,有 OCR、有 NLP、有各種小模型拼湊在一起。語音現在正處於文字大模型出現之前的状态,有 ASR、TTS、各種模塊拼湊,每個環節都在做局部優化。這個舊架構遲早會被一個端到端的語音大模型整體取代。」他的判斷是,與其等別人來做,不如自己先成為那個取代者。
石一認為語音是人類與人類之間最自然的溝通模態,未來也必然是人類與 AI 之間最核心的互動介面。「語音裡能傳輸的資訊頻寬比文字大得多,我說一句話你馬上就理解了。」
他甚至認為語音模型對具身智能行業的推進也起到關鍵作用。第一層是實時語音模型,負責低延遲、高情商的即時反饋——問天氣、問要不要加衣服,這一層直接處理;第二層是深度思考大模型,處理複雜推理;第三層是世界模型,理解物理規則。「語音的使用邊界,和視覺在同一個量級上。」這是當下他最確信的長期判斷之一。
石一認為,目前的 AI 商業化模式僅是過渡形態。因為現在所有的 agent 本質上都是被動回饋的,你告訴它做什麼,它就做什麼,像一個等待指令的執行工具,仍與 chatbot 相似,因此商業模式仍按 token 消耗付費,用多少付多少。
但當 agent 開始主動式服務,也就是當你告訴它 KPI 是什麼、OKR 是什麼,它自己找活幹,自己規劃路徑,最後交付可衡量結果。這時候,它對標的就不再是工具,而是員工。顯然,公司不會按員工打了多少字、發了多少封郵件來計算工資,你看的是他完成了什麼目標。
因此,他認為進入 agentic 時代,商業付費邏輯也應轉向按效果、按 KPI 付費。當這一轉變真正發生時,整個 agent 產品的定價體系、銷售方式和客戶關係都將隨之重寫。
新的商業模式探索已開始在產業深處發生。剛剛獲得 6000 萬美元 B 輪融資的 AI 律師事務所 Crosby,讓每個智能體負責合同審查的不同環節,例如提取背景資訊、提出修改建議、生成批註等,然後由律師審核 AI 的工作成果,處理遺漏細節並確保準確性。其商業模式按審計過的合同份數收費,每份收取 250 至 1000 美元不等,大致根據頁數計算,每頁約 10 至 50 美元。
但真正進化到下一個商業化模式的前提是主動式 Agent 能真正穩定地交付可衡量的結果。「現在還沒到那一步。」
從 FlashIntel 到 FlashLabs,石一用一年時間完成了一次代價清晰的組織與路線調整。裁員、推翻原有產品架構、暫時放緩商業化追求,一系列動作在外人看來都是不斷做減法。
但在 AI 行業快速迭代的現實中,這更像是一家初創公司在劇烈變化中的自我校準。模型能力每隔幾個月就可能迎來一次躍升,沒有人能完全預判未來的走向。對石一和 FlashLabs 而言,现阶段的核心不是搶佔多少市場,而是盡可能讓自己的技術選擇和商業邏輯,不被下一波浪潮輕易淘汰。
行業仍在探索 Agent 的真正形態,付費模式、安全邊界、交互模態的終局都未塵埃落定。FlashLabs 的選擇未必是最優解,卻代表了一類垂直 AI 公司的現實求生路徑:在大模型不斷向下滲透的壓力下,先找到能站穩腳跟的位置,再等待行業真正走向成熟。
