為何更多的 AI 代理並不總是意味著更高的生產力

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
值得關注的山寨幣正引起注意,因為開發者正面對管理 AI 代理的隱藏成本。部署難度降低已使焦點轉向人類如何最佳地管理輸出結果。「協調稅」包括驗證結果和解決衝突——這些任務無法並行處理。隨著更多代理運行,審核隊列不斷增長,導致疲勞與債務累積。恐懼與貪婪指數的變化可能反映這些瓶頸。生產力的提升並非來自更多代理,而是來自與人類注意力限制相匹配的工作流程。

編者按:當 AI Agent 越來越便宜、越來越容易調用,軟體開發正進入一個新階段:問題不再是能否啟動更多 Agent,而是人類是否還有足夠的注意力去管理、判斷和合併它們的產出。

這篇文章提出了一個極具啟發性的概念——「編排稅」。啟動 Agent 的成本很低,只需一句 Prompt 或一次點擊;但真正昂貴的是後續環節:檢查結果是否正確、理解它對系統架構的影響、處理不同 Agent 之間的衝突,並最終決定哪些代碼可以進入主分支。這些工作無法簡單地並行化,仍需回歸到同一個串行資源:人的判斷力。

作者將開發者比作 AI Agent 系統中的「GIL」,即限制並發系統最終吞吐量的單線程鎖。多個 Agent 可同時運行,但只要進入架構判斷、代碼審查和衝突合併階段,就必須重新經過開發者的大腦。於是,Agent 越多,不一定意味著產出越高,也可能只是讓待審查的任務隊列更長,讓開發者陷入更頻繁的上下文切換和認知疲勞。

這也是當前 AI 編程工具熱潮中容易被忽略的一點:效率感與真實生產力並不總是一回事。一個滿屏運行的 Agent 儀表板,會製造出「高產」的錯覺;但如果開發者沒有真正理解、審查和整合這些變更,系統最終累積的可能不是生產力,而是技術債和認知債。

因此,本文真正討論的不是「如何使用更多 Agent」,而是「如何圍繞人的注意力重新設計工作流」。在 Agent 時代,關鍵能力不只是會提問、會分派任務,而是知道哪些任務可以交給機器並行處理,哪些任務必須保留給人類判斷;什麼時候應該批量 review,什麼時候應該停止編排,重新專注於一個核心問題。

AI 正在擴大軟體生產的併發能力,但人的注意力仍然是系統中最稀缺、最不可複製的資源。真正成熟的 Agent 工作流程,不是把所有任務都丟給機器,而是像設計生產系統一樣,認真設計自己的注意力架構。

以下為原文:

現在,啟動更多 AI Agent 已經變得很容易。但更多 Agent 同時運行,並不意味著「你」也變多了。你的認知頻寬無法平行化。所有真正用於引導它們、判斷結果、合併修改的判斷力,最終仍然必須經過同一個序列處理器——也就是你自己。

所謂「編排稅」,本質上就是你忘記這一點後所付出的代價。而唯一真正的解法,是像設計任何併發系統一樣,開始設計你自己的注意力。

我之前在 Google I/O 上參加了一場圓桌討論,與 Richard Seroter、Aja Hammerly、Ciera Jaspan 一起談論軟體工程現在的樣子,以及它未來可能如何演變。接近尾聲時,Richard 問我們:開發者聽完之後,最應該帶走並改變的一件事是什麼?

Attention Architecture

我說出了這幾個月一直反覆思考的一點:感覺自己很忙,絕不等於真的有產出。你可以同時運行 20 個 Agent,並且感覺自己忙得不可開交。但這並不等於你交付了 20 個 Agent 對應的工作量。

在那場對話早些時候,Richard 給這個問題起了一個名字。他說:「你剛才講到的,其實就是編排稅。你不可能在自己的腦子裡成功管理 20 個 Agent。」

他說得完全正確。我想把這個概念更完整地拆開講,因為這不是一個自律問題,而是一個架構問題。

那場圓桌裡有一句我幾乎是隨口說出的話,後來一直縈繞在我腦海裡:運行多個 Agent,並不意味著世界上多了一個你。

人們未計入的非對稱性

在代理工作流中存在一種隱藏的非對稱性。

啟動一個 Agent 非常便宜。你只需要敲一下鍵盤,或者寫一句 Prompt。但完成 Agent 的閉環一點也不便宜。總得有人檢查它返回的結果是否正確,並把它和其他 Agent 改動過的內容重新協調起來。

這個人就是你。而你只有一個。

上個月,我在《你的並行 Agent 上限》中寫過這個問題的一部分,主要討論的是那種環境式焦慮:你不知道哪條並行線程正在悄悄失敗。這篇文章想談的是這種成本背後的結構。

當你開始將 Agent 開發視為一個併發系統時,你就會意識到,人類本身只是這個系統中的一個組件。一個很慢的串行組件。

你就是那個單線程資源

如果你寫過並發代碼,你其實已經具備理解這個問題的直覺。只是你過去把這種直覺用錯了地方。

Python 有全局解釋器鎖,也就是 GIL。你可以建立任意多線程,但同一時間只有一個線程能執行 Python 位元碼,因為它們都必須先取得這把鎖。

你就是你的 AI Agent 的 GIL。

它們都可以同時運行。但只要它們的工作需要真正理解系統架構,或需要解決合併衝突,就必須先拿到這把鎖。而這把鎖只有一把,由你持有。

阿姆達爾定律精確地說明了這一點:並行化帶來的加速上限,取決於工作中仍必須以串行方式完成的部分。如果你的流程中有一大塊無法並行化,那麼無論你投入多少核心,最終都會遇到一個硬性上限。

在 Agent 開發中,這個串行部分就是判斷力。

啟動 8 個 Agent 不會加速你的判斷時間。它只會讓等待你處理的佇列變得更長。

這是性能工程中一個很古老的事實,但很多人依然會為此感到驚訝:優化非瓶頸部分並不會提升整體吞吐量。你只是在瓶頸前面堆積了更多尚未完成的工作。

Agent 的優化針對的是原本並非瓶頸的部分。真正的瓶頸是審核環節,而整個系統的吞吐量,恰好等於該環節的吞吐量。

排稅,就是代理的生產能力與你實際能夠合併的內容之間的結構性缺口。當你讓一個單執行緒資源去管理一個併發系統時,就會發生這種情況。

硬扛解決不了結構性上限

在那場圓桌上,我說過一句話:我從未像現在這樣覺得自己的工具如此高效,但我也從未像現在這樣疲憊。

這兩種感受都完全真實,而且它們來自同一個原因。

這種疲憊有一個非常具體的來源:它就是將一個串行處理器持續壓至 100% 且不留下任何餘量時的感覺。

每次你回頭查看一個已經離開你注意力範圍的 Agent,你都要支付一次上下文切換成本。你必須清空大腦,然後從零開始重新載入另一個語境。

CPU 可以在微秒內完成這件事,即便如此,架構師仍會盡量避免頻繁切換。而你要花幾分鐘才能完成,而且永遠無法完美恢復上下文。

5 個 Agent 並不是將 1 倍工作量重複 5 次。它是 5 次冷啟動式的上下文重載,再加上一個在後台持續運行的大腦進程,不停擔心你現在到底該去檢查哪個 Agent。

你不能靠「更努力」來解決一個結構性限制。這筆稅總是要付的。

如果你試圖硬撐,它最終會以另一種形式出現:要麼是代碼審查變得越來越淺,要麼是你進入一種「認知投降」狀態——因為形成自己的判斷太消耗注意力,你乾脆直接接受 Agent 寫出來的代碼。

你 either 主動支付這筆稅,either 任由它在暗處慢慢摧毀你對自己系統的理解。

像設計系統一樣設計你的注意力

因此,你必須將自己的注意力視為一種稀缺的串行資源。

你在設計一個分散式系統時,不會完全忽略瓶頸;請同樣尊重你的大腦。

以下是一些對我來說真正有效的方法:

根據 review 能力擴展 Agent 隊伍,而非根據 UI 能力擴展。

一個良好的併發系統會使用反壓機制,避免佇列無限增長。生產者需減慢速度,以匹配消費者處理能力。

你的 Agent 數量就是生產者,你的 review 能力就是消費者。正確的並行 Agent 數量,應該是你能夠認真完成程式碼 review 的數量。對大多數人來說,這通常只是一個很低的個位數。

AI 工具當然會很樂意讓你啟動 20 個 Agent,但那只是一個 UI 功能,不代表你真的有能力管理它們。

Classify the tasks.

當 Richard 問我如何處理這件事時,我提到過這個方法。我會把任務分成兩堆。

第一堆工作是相對獨立的,我願意交給在雲端後台運行的 Agent。這些任務可以異步執行,通常只需我在最後關頭做一次把關。

第二堆是複雜任務,真正的工作本身就是判斷。例如一個很奇怪的 bug,或一次架構設計。

最大的錯誤,就是試圖將第二類任務也並行化。並行處理多個複雜任務,並不會擴大你的產出,只會讓那把鎖被反覆爭搶,最終所有結果都會變差。

批量審核。

每次上下文切換都會讓你付出很高的成本。一次性坐下來 review 4 個 Agent 的結果,要比先看一個、去做別的事、再冷啟動回來繼續看另一個便宜得多。

給 Agent 更長的牽引繩。讓工作稍微累積一點,然後把它們作為一個批次來處理。

Only use this lock for judgment.

不要把你的大腦浪費在機器可以自行驗證的事情上。讓 Agent 寫出能通過的測試,或者生成截圖。

讓它們自己證明那 80% 聊無趣但可驗證的部分。這樣,你稀缺的注意力只需花在真正需要人類判斷的 20% 上。

保護你的串行時間。

瓶頸需要你最專注的時間,而不是你在幾次 Agent 檢查之間剩餘的碎片時間。

有時候,最高槓桿的動作反而是完全停止編排:關掉那台塞滿 Agent 的電腦,只專注思考一個問題,並在整個過程中牢牢持有那把鎖。

排程並非真正的工作,它只是圍繞工作產生的開銷。

Aja 指出,架構能力現在已經成為最緊迫的技能:你需要知道什麼任務適合交給一個 Agent,什麼任務對它來說太大了。

我還想補充一點:你自己也是這個系統中的一個組件。你的注意力有一個已知的、很低的串行吞吐量。系統要麼尊重這個數字,要麼就會透過悄悄降低你的標準來繞過它。

忙碌不等於高產

這一點非常重要,因為這種失敗模式對你本人來說幾乎是不可見的。

20 個正在運行的 Agent 會讓你產生一種「生產力爆棚」的感覺。儀表板塞得滿滿的,所有東西都在運轉。但這種感覺與真正將高質量代碼合併到主分支之間,已經脫鉤了。

你可以忙到極限,卻幾乎沒有真正產出。從內部體驗上看,這兩者幾乎一模一樣。

Ciera 提到了 Margaret-Anne Storey 關於債務的研究。我們聊到了技術債,也聊到了認知債。

未支付的編排稅,會讓你同時累積這兩種債務。

你合併了自己沒有認真讀過的東西。你對代碼庫的心智模型徹底過時。這些問題今天不會出現在儀表板上。它們會在生產環境出現故障時顯現出來——那時你看著系統,突然意識到自己已經不知道它到底是怎麼運行的了。

因此,真正的結論是:啟動 Agent 不是能力。任何人都可以運行 20 個。

真正的能力,是圍繞那個無法被複製、無法被平行化的序列資源來設計系統。

這個資源,就是你的注意力。

像設計任何生產環境中依賴的關鍵組件一樣,去設計它。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露