撰文:Zack Pokorny
編譯:Chopper,Foresight News
AI 智能體在區塊鏈上的落地並不順利,區塊鏈雖然具有可程式設計、無許可特性,卻缺乏適配智能體的語義抽象與協同層。加密研究機構 Galaxy 發布研究報告指出,智能體在鏈上面臨機會發現、可信驗證、數據讀取與執行流程四大結構性摩擦,現有基礎設施仍圍繞人類交互設計,難以支撐 AI 自主管理資產、執行策略,這些成為智能體在區塊鏈上規模化落地的核心瓶頸。以下為報告全文編譯:
The application scenarios and capabilities of AI agents have begun to evolve. They are now autonomously executing tasks and are being developed to hold and allocate capital, as well as to discover trading and yield strategies. Although this experimental shift is still in its very early stages, it differs significantly from the previous development pattern where agents were primarily used as social and analytical tools.
區塊鏈正成為這一進化過程天然的試驗場。區塊鏈無需許可、可組合、擁有開源應用生態、向所有參與者平等開放數據,並且鏈上所有資產預設可程式化。
這便引出了一個結構性問題:如果區塊鏈是可程式設計且無需許可的,那麼自主代理為何仍會面臨摩擦?答案不在於執行是否可行,而在於執行之上究竟有多少語義和協調負擔。區塊鏈保證狀態轉換的正確性,但通常不提供協議原生的抽象,例如用於經濟解釋、規範身份或目標層面的協調。
部分摩擦源於無需許可系統的架構缺陷,部分則反映了當前工具、內容管理和市場基礎設施的現狀。實際上,許多上層功能仍然依賴於需要人工操作參與的軟體和工作流程。
區塊鏈架構與 AI 智能體
區塊鏈的設計圍繞共識與確定性執行展開,而非語義解釋。它對外暴露的是儲存槽、事件日誌、調用軌跡等底層原語,而非標準化的經濟物件。因此,倉位、收益率、健康係數、流動性深度等抽象概念,通常需要由索引器、資料分析層、前端介面與應用程式介面在鏈下重構,將各協議特有的狀態轉化為更易用的形式。
許多主流的去中心化金融操作流程,尤其是面向散戶與主觀決策類的流程,仍然圍繞用戶通過前端介面交互並對單筆交易進行簽名的模式展開。這種以用戶介面為中心的模式隨著散戶的普及實現了擴張,即便鏈上相當一部分活動已由機器驅動。當前主流的散戶交互模式依然是:意圖 → 用戶介面 → 交易 → 確認。程式化操作遵循另一種路徑,但同樣存在自身限制:開發者在構建階段選定合約與資產集合,隨後在這一固定範圍內運行算法。這兩種模型都無法適應那些必須在運行時根據不斷變化的目标動態發現、評估並組合操作的系統。
當一套專為交易驗證優化的基礎設施,被需要用於同時解讀經濟狀態、評估信用、並圍繞明確目標優化行為的系統使用時,摩擦便開始出現。此類差距部分源於區塊鏈無需許可、異構化的設計特點,另一部分則源於互動工具仍圍繞人工審核與前端中介構建。
智能體行為流程與傳統算法策略的對比
在探討區塊鏈基礎設施與智能體系統之間的差距之前,有必要先明確:更具智能自主性的行為流程,與傳統的鏈上算法系統究竟有何區別。
兩者的差異並不在於自動化程度、複雜程度、參數化設定,甚至也不在於動態自適應能力。傳統算法系統可以實現高度參數化,能夠自動發現新合約與新代幣,在多種策略類型間分配資金,並根據表現進行再平衡。真正的區別在於,系統能否處理構建階段未曾預見的場景。
無論傳統演算法系統多麼複雜,都只會針對預設模式執行預設邏輯。它們需要為每一類協議配備預定義的介面解析器、將合約狀態映射為經濟含義的預定義評估邏輯、明確的信用與標準性判斷規則,以及為每一個決策分支設定硬編碼規則。當出現不符合預設模式的情況時,系統要麼跳過,要麼直接失效。它無法對陌生場景進行推理,只能判斷當前場景是否匹配已知模板。

就像這隻「消化鴨」機械自動裝置,能夠模仿生物行為,但所有動作都是預先編寫好的
一台掃描 DeFi 借貸市場的傳統算法,可以識別出發出熟悉事件或匹配已知工廠模式的新部署合約。但如果出現一款介面陌生的新型借貸基礎組件,系統便無法對其進行評估。必須由人類檢查合約、理解其運行機制、判斷其是否屬於可挖掘機會,並編寫集成邏輯。在此之後,算法才能與之交互。人類負責解讀,算法負責執行。基於基礎模型的智能體系統改變了這一邊界。它們可以通過習得的推理能力實現:
- 解讀模糊或表述不完整的目标。例如「最大化收益但規避過高風險」這樣的指令,需要進行語義解讀。什麼才算過高風險?收益與風險應如何權衡?傳統算法需要提前對這些條件做出精確定義,而智能體則能解讀意圖、做出判斷,並根據反饋優化自身的理解。
- 能夠泛化適應陌生接口。智能體可以閱讀陌生的合約代碼、解析文檔,或查看從未接觸過的應用程序二進制接口,並推斷該系統的經濟功能。它無需為每一類協議預先搭建解析器。儘管目前這一能力尚不完善,智能體可能會誤判所見內容,但它能夠嘗試與構建階段未曾預見的系統進行交互。
- 在信任與規範性存在不確定性的情況下進行推理。當信用信號模糊或不完整時,基礎模型可以概率性地權衡信號,而非簡單套用二元規則。這款智能合約是否具備標準性?根據現有證據判斷,該代幣是否合法?傳統算法要麼有規則可循,要麼無計可施;而智能體可以對置信度進行推理。
- 解釋錯誤並進行調整。當意外情況發生時,智能體可以推理問題根源,並決定應對方式。相比之下,傳統算法只會執行異常捕獲模組,僅轉發異常資訊,不做解讀。
這些能力目前真實存在,但並不完美。基礎模型會產生幻覺、誤判內容,並做出看似確信的錯誤決策。在對抗性且涉及資本的環境中(即程式碼可控制或接收資產),“嘗試與未預見的系統交互” 可能意味著資金損失。本文的核心觀點並非智能體如今已能可靠執行這些功能,而是它們能夠以傳統系統無法實現的方式進行嘗試,且未來的基礎設施將使這些嘗試更安全、更可靠。
這種差異更應被視為一種連續狀態,而非絕對的分類界限。部分傳統系統會融入習得推理的形式,部分智能體也可能在關鍵路徑上依賴硬編碼規則。這種區別是方向性的,而非絕對二元的。智能體系統將更多的解讀、評估與自適應工作轉移到運行時推理中,而非構建階段的預設規則。這一點對於摩擦問題的論述至關重要,因為智能體系統試圖實現的,是傳統算法完全避開的事情。傳統算法透過讓人類在構建階段篩選合約集合,避開了發現摩擦;依靠運營者維護的白名單,避開了控制層摩擦;使用為已知協議預先搭建的解析器,避開了數據摩擦;在預設的安全邊界內運行,避開了執行摩擦。人類提前完成語義、信用與策略層面的工作,算法則在劃定範圍內執行。早期的鏈上智能體行為流程或許會沿用這一模式,但智能體的核心價值在於將發現、信用與策略評估轉移到運行時推理,而非構建階段的預設。
它們會嘗試發現並評估陌生機會,在無硬編碼規則的情況下推理標準性,在無預設解析器的情況下解讀異構狀態,並針對可能模糊的目標執行策略約束。摩擦的存在,並非因為智能體在做與算法相同的事情卻難度更高,而是因為它們在嘗試截然不同的事情:在開放、動態解讀的行为空間中運行,而非封閉、預先集成的體系內運作。
摩擦
從結構層面來看,這種矛盾並非源於區塊鏈共識的缺陷,而是圍繞其發展起來的整體交互棧的運行方式所致。
區塊鏈確保確定性的狀態轉換、對最終狀態的共識,以及最終確定性。它不會嘗試在協議層編碼經濟含義解讀、意圖驗證或目標追蹤。這些職責歷來由前端介面、錢包、索引器及其他鏈下協同層承擔,其中始終需要人為干預。
即使是資深參與者,當前主流的互動模式也體現了這一設計。散戶透過儀表板解讀狀態,透過使用者介面選擇操作,透過錢包簽署交易,並非正式地驗證結果。演算法交易機構實現了執行自動化,但仍依賴人類操作者篩選協議集合、核查異常情況,並在介面變更時更新整合邏輯。兩種情境下,協議僅負責保證執行正確性,而意圖解讀、異常處理與新機會適配均由人類完成。
智能體系統壓縮甚至消除了這種分工。它們必須程式化地重構具有經濟意義的狀態,評估目標推進情況,並驗證執行結果,而非僅確認交易上鍊。在區塊鏈上,這些負擔尤為突出,因為智能體運行在開放、對抗性且快速變化的環境中,新合約、資產與執行路徑可在無中心化審核的情況下出現。協議僅保證交易正確執行,不保證經濟狀態易於解讀、合約具備標準性、執行路徑符合用戶意圖,或相關機會可被程式化發現。
以下將沿著智能體運行循環的各個階段,逐一梳理此類摩擦:發現現有合約與機會、驗證其合法性、獲取具備經濟意義的狀態,以及圍繞目標執行操作。
發現摩擦
摩擦的產生,是因為去中心化金融的行为空間在無需許可的環境中開放擴張,而相關性與合法性則由人類透過鏈上的社交、市場與工具層進行篩選。新協議透過公告湧現,同時也會經過前端整合、代幣列表、數據分析平台與流動性形成等篩選層過濾。久而久之,這些信號往往會形成一個可行的判斷標準,用以區分行为空間中哪些部分具備經濟價值、足夠可信,儘管這種共識可能是非正式、不均衡的,且部分依賴第三方與人工篩選。
可以為智能體提供經過篩選的數據與信用信號,但它們本身並不具備人類在解讀這些信號時所使用的直覺捷徑。從鏈上視角來看,所有已部署的合約都具有同等的可發現性。合法協議、惡意分叉、測試部署與棄用項目,均以可調用位元碼的形式存在。區塊鏈本身不會編碼哪些合約重要、哪些安全。
因此,智能體必須建構自身的發現機制:掃描部署事件、識別接口模式、追蹤工廠合約(即可程式化部署其他合約的合約),並監控流動性形成情況,以確定哪些合約應納入決策範圍。這一過程不僅是尋找合約,更是判斷其是否應進入智能體的行为空間。
識別出候選對象只是第一步。合約在經過初步發現篩選後,還需經過下一節所述的標準性與真實性驗證流程。智能體必須先確認所發現的合約名副其實,才能將其納入決策空間。
發現摩擦並非指檢測新部署行為。成熟的算法系統已能在自身策略範圍內實現這一點。監控 Uniswap 工廠事件並自動納入新資金池的搜索者,就是在執行動態發現。摩擦出現在兩個更高層面:判斷所發現合約是否合法,以及判斷其是否與開放式目標相關,而非僅匹配預設策略類型。
搜尋者的發現邏輯與其策略緊密綁定。它知道要尋找何種介面模式,因為策略已做出定義。而執行「配置風險調整後最優機會」這類更寬泛指令的智能體,無法僅依賴源自策略的篩選器。它必須對照目標本身評估新遇到的機會,這就需要解析陌生介面、推斷經濟功能,並判斷該機會是否應納入決策空間。這在一定程度上是通用自主性問題,但區塊鏈加劇了這一問題。
控制層摩擦
控制層摩擦的產生,是因為身份與合法性的判定通常在協議之外完成,綜合依賴篩選、治理、文件、介面與操作者判斷。在當前許多工作流程中,人類仍是判定環節的重要部分。區塊鏈保證確定性執行與最終確定性,但不保證呼叫者正在與目標合約互動。這種意圖判定被外化到社交語境、網站與人工篩選中。
在當前流程中,人類將網頁的信用層作為非正式驗證手段。他們訪問官方域名(通常透過 DeFiLlama 等聚合平台或項目認證社交賬號找到),並將該網站視為人類概念與合約地址之間的標準映射載體。隨後,前端介面會形成一套可行的可信基準,明確哪些地址為官方地址、應使用哪種代幣標識,以及哪些入口是安全的。

1789 年的機械土耳其人是一款下棋機器,表面上看來自主運行,但實際上依賴一名隱藏的人工操作員。
智能體預設無法透過社交語境解讀品牌標識、認證社交信號或「官方性」。可為其輸入源自這些信號的篩選後數據,但要將其轉化為持久可用的機器信用假設,需明確的註冊表、策略或驗證邏輯。可為智能體配置運營者提供的篩選白名單、認證地址與信用策略。問題並非完全無法獲取社交語境,而是在動態擴張的行為空間中維護這些防護措施的操作成本極高,且當這些措施缺失或不完善時,智能體缺乏人類預設使用的備用驗證機制。
鏈上智能體驅動系統已出現因信用判定薄弱而帶來的實際後果。在網紅加密貨幣博主 Orangie 的案例中,有智能體據稱將資金存入了蜜罐合約。另一案例中,名為 Lobstar Wilde 的智能體因狀態或上下文故障誤判地址狀態,將大額代幣餘額轉給了線上「乞討者」。這些案例並非核心論據,但足以說明信用判定、狀態解讀與執行策略失誤會如何直接導致資金損失。
問題不在於合約難以發現,而在於區塊鏈通常沒有原生的「這是某應用的官方合約」概念。這種缺失在一定程度上是無需許可系統的特性,而非設計疏漏,但仍為自主系統帶來協同難題。這一問題部分源於標準身份標識薄弱的開放系統架構,部分則源於註冊表、標準與信用分發機制尚不成熟。嘗試與 Aave v3 交互的智能體,必須判定哪些地址是標準地址,以及這些地址是否不可更改、可通過代理升級,或當前處於治理變更待定狀態。
人類透過文件、前端介面與社群媒體解決此問題。智能體則必須透過核查以下內容來判定:
- 代理模式與實現要點
- 管理權限與時間鎖
- 治理控制的參數更新模組
- 已知部署間的位元組碼 / 應用二進制介面匹配
在缺乏標準註冊表的情況下,「官方性」成為一個推理問題。這意味著智能合約不能將合約地址視為靜態配置。它們要么維護持續驗證的篩選白名單,要么在運行時通過代理檢查與治理監控重新推導標準性,要么承擔與廢棄、受損或仿冒合約交互的風險。在傳統軟件與市場基礎設施中,服務身份通常由機構維護的命名空間、憑證與訪問控制錨定。相比之下,在鏈上,一款合約可被調用、可正常運行,但從調用者角度看,其在經濟或業務層面不具備標準性。
代幣的真實性與元數據是同一個問題。代幣看似能自我描述,但代幣元數據並不具备權威性,僅是代碼返回的位元組資料。典型案例為封裝以太坊(WETH)。廣泛使用的 WETH 合約代碼中明確定義了名稱、符號和精度。

這看似是身份標識,實則不然。任何合約都可以設定:
- symbol() = WETH
- decimals() = 18
- name() = Wrapped Ether
並實現相同的 ERC-20 代幣標準介面。name()、symbol() 與 decimals() 僅為公開的唯讀函數,返回部署者設定的任意內容。事實上,以太坊上有近 200 種代幣名稱為 「Wrapped Ether」、符號為 「WETH」、精度為 18 位。不查閱 CoinGecko 或 Etherscan,你能分辨哪個 「WETH」 是標準版本嗎?
智能體面臨的就是這樣的處境。區塊鏈不核查唯一性,不對照任何註冊表驗證,也不做任何限制。你今天可以部署 500 個合約,全部返回完全相同的元數據。鏈上存在一些試探性判定方法(例如核查以太坊餘額與總供應量是否匹配、查詢主流去中心化交易所的流動性深度、驗證其是否作為借貸協議抵押品),但均無法提供絕對證明。每種方法要么依賴閾值假設,要么遞歸依賴其他合約的標準性驗證。

就像在迷宮中尋找「真正」的路徑需要外部指引,鏈上沒有原生的標準信號
這就是代幣列表與註冊表作為鏈下篩選層存在的原因。它們為 「WETH」 這一概念映射到具體地址提供了一種方式,這也是錢包與前端介面維護白名單或依賴可信聚合平台的原因。對智能體而言,核心問題不僅在於元資料可信度低,更在於標準身份通常由社交或機構層面確立,而非協議原生。可靠的鏈上標識符是合約地址,然而將 「兌換為 USDC」 這類人類意圖映射到正確地址,仍高度依賴非協議原生的篩選、註冊表、白名單或其他信用層。
數據摩擦
在去中心化金融各協議間優化配置的智能體,需要將每一個機會標準化為經濟對象:收益率、流動性深度、風險參數、費率結構、預言機來源等。從某種角度來看,這是常見的系統集成問題。然而在區塊鏈上,協議異構性、直接資本敞口、多調用狀態拼接,以及底層缺乏統一的經濟模式,進一步加重了這一負擔。而這些正是比較機會、模擬分配和監控風險所必需的基本要素。
區塊鏈通常不會在協議層暴露標準化的經濟物件。它暴露儲存槽、事件日誌與函數輸出,經濟物件需從中推斷或重構。協議僅保證合約呼叫返回正確的狀態數值,不保證該數值能清晰映射為可讀的經濟概念,也不保證可以透過跨協議的一致介面檢索到相同的經濟概念。
因此,市場、倉位、健康係數等抽象概念並非協議原語。它們由索引器、數據分析平台、前端介面與應用程式介面在鏈下重構,將異構的協議狀態轉化為可用抽象。人類用戶通常只看到這一標準化後的層級。智能體也可以使用這一層級,但會隨之繼承第三方模式、延遲與信用假設;否則,就必須自行重構這些抽象。
這一問題在各類協議中日趨突出。金庫的份額價格、借貸市場的抵押率、去中心化交易所資金池的流動性深度、質押合約的獎勵率,均為具備經濟意義的基礎組件,但均無標準化接口暴露。每一類協議都有各自的獲取方式、結構佈局與單位慣例。即便在同一類別中,實現方式也存在差異。
借貸市場:檢索碎片化的典型範例
借貸市場清晰體現了這一問題。其經濟概念通用且大致統一,例如供給與借貸流動性、利率、抵押率、額度上限與清算閾值,但獲取路徑卻各不相同。
在 Aave v3 中,市場枚舉與儲備狀態獲取是兩個獨立步驟。典型流程如下:
列出儲備資產,返回代幣地址陣列。

針對每種資產,透過另一代碼片段獲取流動性與利率基礎數據,

此方法透過一次呼叫返回一個包含流動性總量、利率指數和配置標誌的結構體,例如:

相比之下,Compound v3 中每個部署對應單一市場(USDC、USDT、ETH 等),且無統一的儲備結構體。相反,需通過多次函數調用拼接市場快照:
- 基礎利用率
- 總量
- Interest Rate
- 抵押資產配置
- 全局配置參數
每次呼叫僅返回經濟狀態的不同子集。「市場」並非一級物件,而是由呼叫者拼接而成的推斷結構。
從智能體的角度來看,兩款協議均為借貸市場;但從集成的角度來看,兩者是結構完全不同的獲取系統。不存在統一的共享模式。相反,智能體必須針對不同協議採用不同的資產枚舉方式,通過多次調用拼接狀態。
碎片化會帶來延遲與一致性風險
除了結構不一致外,這種碎片化還會引入延遲與一致性風險。由於經濟狀態並非以單一原子化市場對象暴露,智能體必須透過多次遠端程序呼叫跨多個合約重構快照。每多一次呼叫,延遲、限流風險與區塊不一致機率都會增加。在波動環境中,當供給利率計算完成時,利率可能已發生變化;若不明確鎖定區塊,配置參數可能與流動性總量對應不同區塊高度。用戶依賴 UI 緩存層和聚合後端來間接緩解這些問題。直接操作原始 RPC 接口的代理必須顯式地管理同步、批處理和時間一致性。因此,非標準化的檢索不僅會造成集成上的不便,還會限制效能、同步和正確性。
由於缺乏規範的經濟數據檢索方案,即使協議實現了幾乎相同的金融原語,其狀態暴露仍取決於合約的具體情況和組成方式。這種結構性差異是數據摩擦的核心組成部分。
潛在資料流不匹配
區塊鏈上的經濟狀態存取本質上是拉取模式,即使執行信號可進行串流傳輸。外部系統向節點查詢所需狀態,而非接收持續且結構化的更新。此模式反映了區塊鏈的核心功能:按需驗證,而非維持應用層級的持續狀態視圖。
推送式原語是存在的。WebSocket 訂閱可實時流式傳輸新區塊與事件日誌,但這些不包含承載大部分經濟意義的存儲狀態,除非協議明確選擇冗餘發布。智能體無法直接通過鏈上訂閱借貸市場利用率、資金池儲備或頭寸健康係數。這些數值存儲在合約存儲中,且大多數協議未提供原生機制向下游使用者推送這些資訊。當前最優的模式是訂閱新區塊頭,並在每個區塊重新查詢。日誌僅能提示狀態可能發生變化,但不編碼最終經濟狀態;重構該狀態仍需顯式讀取與歷史狀態訪問。
智能體系統或許能從反向流程中受益。智能體無需輪詢數百個合約的狀態變化,而是可接收結構化、預計算的狀態更新,直接推送至運行環境。推送式架構可減少冗餘查詢,降低狀態變化與智能體感知間的延遲,並允許中間層將狀態打包為語義明確的更新,而非讓智能體從原始存儲中解讀含義。
這種反向轉變並非易事。它需要訂閱基礎設施、篩選相關性的邏輯,以及將存儲變動轉化為智能體可執行經濟事件的模式。但隨著智能體成為持續性參與者,而非間歇性查詢者,拉取模式的低效性成本愈發高昂。將智能體視為持續消費者而非間歇性客戶端的基礎設施,或許更貼合自主系統的運行方式。
推送式基礎設施是否真的更優仍是一個懸而未決的問題。海量的狀態變更會造成過濾難題,代理仍需判斷哪些變更相關,這在另一個層面上重新引入了拉取式語義。關鍵不在於拉取式架構本身有什麼問題,而在於當前的架構設計並未考慮到持久化的機器消費者,隨著智能體使用規模的擴大,或許值得探索其他替代模型。
執行摩擦
執行摩擦的產生,是因為當前許多交互層將意圖轉換、交易審核與結果驗證,打包進圍繞前端介面、錢包與運營者監督設計的工作流程。在散戶與主觀決策場景中,這種監督通常由人類完成。對自主系統而言,這些功能必須被形式化並直接編碼。區塊鏈根據合約邏輯保證確定性執行,但不保證交易符合用戶意圖、遵守風險約束或實現預期經濟結果。在當前流程中,用戶介面與人類填補了這一缺口。
用戶界面組合操作序列(兌換、授權、存入、借貸),錢包提供最終「審核並發送」節點,用戶或運營者通常在最後一步非正式地做出策略判斷。他們往往在資訊不完整的情況下,判斷交易是否安全、報價結果是否可接受。若交易失敗或出現意外結果,用戶會重試、調整滑點、更改路徑或直接放棄操作。智能體系統將人類從這一執行迴圈中移除。這意味著系統必須以機器原生方式替代三項人類功能:
- 意圖整合。像「將我的穩定幣轉入風險調整後最優收益場所」這樣的人類目標,必須整合為具體的行動計劃:選擇哪款協議、哪個市場、哪條代幣路徑、多大規模、哪些授權,以及執行順序。對人類而言,這一過程透過使用者介面隱性完成;對智能體而言,則必須形式化實現。
- 策略執行。點擊「發送交易」不僅是簽名,更是隱性檢查交易是否符合約束條件:滑點容忍度、槓桿上限、最低健康係數、白名單合約,或「禁止可升級合約」。智能體需要將明確的策略約束編碼為機器可校驗規則:
- 執行系統必須驗證所提出的調用圖是否符合這些規則,方可進行廣播。
- 結果驗證。交易上鏈並不等於任務完成。即使交易執行成功,仍可能未達成目標:滑點可能超出容忍範圍、因額度限制未達到目標倉位規模,或利率在模擬與上鏈之間發生變動。人類透過事後查看使用者介面進行非正式驗證。智能體則必須程式化評估後置條件。
這就引出了對完成檢查的要求,而不僅僅是簡單的事務包含。以意圖為中心的架構可以透過將「如何」執行的更多負擔從智能體轉移到專門的求解器,部分解決這個問題。透過廣播已簽名的意圖而非原始呼叫資料,智能體可以指定基於結果的約束,求解器或協議層機制必須滿足這些約束,才能使執行被接受。
多步驟工作流程與故障模式
去中心化金融的大部分執行操作本質上是多步驟的。一筆收益配置可能需要完成授權 → 兌換 → 存入 → 借貸 → 質押。部分步驟可能為獨立交易,其他步驟則可透過多調用或路由合約打包。人類可容忍部分完成,返回使用者介面繼續流程。智能體則需要確定性流程編排:若任意步驟失敗,智能體必須決定重試、重路由、回退或暫停。
這催生了人類流程中大多被掩蓋的新型故障模式:
- 決策與上鍊之間的狀態漂移。在模擬與執行之間,利率、利用率或流動性可能發生變化。人類能接受這種變動性;智能體則必須設定可接受範圍並強制執行。
- 非原子執行與部分成交。部分操作可能跨多筆交易執行,或產生部分結果。智能體必須追蹤中間狀態,並確認最終狀態符合目標。
- 授權額度與審批風險。人類會透過使用者介面無意識地簽署授權;智能體則必須將授權範圍(額度、使用者、期限)作為安全策略的一部分進行推理,而非僅視為使用者介面步驟。
- 路徑選擇與隱性執行成本。人類依賴路由合約與使用者介面預設設定。智能體必須將滑點、最大可提取價值風險、gas 成本與價格影響納入目標函數。
執行:機器原生控制問題
執行摩擦的核心論點是,去中心化金融的交互層以人類錢包簽名作為最終控制平面。這一環節承載了當前的意圖驗證、風險容忍與非正式的「是否合理」判斷。移除人類後,執行成為一個控制問題:智能體必須將目標轉化為行為模式,自動執行策略約束,並在不確定性下驗證結果。這一挑戰存在於許多自主系統中,但區塊鏈環境尤為嚴苛:執行直接涉及資本、可組合陌生合約,且暴露於對抗性狀態變化。人類憑藉啟發式方法做出決策,並通過試錯糾正錯誤。智能體則必須以機器速度程序化完成相同工作,且通常在動態變化的行为空間中。因此,「智能體只需提交交易」的說法,低估了難度。提交交易是最簡單的部分。
結論
區塊鏈的設計初衷並非原生提供智能體所需的語義與協同層。它的設計目標,是在對抗性環境中保證確定性執行與狀態轉換共識。建立在這一基礎之上的交互層,圍繞人類用戶通過界面解讀狀態、通過前端界面選擇操作、通過人工審核驗證結果的模式演進。
智能體系統顛覆了這一架構。它們將人類解讀員、審批者與驗證者從迴圈中移除,要求這些功能轉為機器原生實現。這一轉變在四個維度暴露了結構性摩擦:發現、信用判定、數據獲取與執行流程。這些摩擦的產生,並非因為執行不可行,而是因為圍繞區塊鏈的基礎設施在多數情況下仍假設,在狀態解讀與交易提交之間存在人類參與。
填補這些缺口,大概率需要在多層技術棧中搭建新型基礎設施:將跨協議經濟狀態歸一化為機器可讀的中間件;提供頭寸、健康係數、機會集合等語義原語的索引服務或遠程調用擴展;建立提供標準合約映射與代幣真實性驗證的註冊表;以及編碼策略約束、處理多步驟工作流程、程式化驗證目標完成的執行框架。部分缺口源於無需許可系統的結構特性:開放部署、標準身份薄弱、接口異構。另一部分則取決於當前工具、標準與激勵設計,隨著代理使用規模擴大、協議競相優化對自主系統的集成友好度,這些缺口有望收窄。
隨著自主系統開始管理資本、執行策略並直接與鏈上應用互動,當前互動層的架構假設將愈發凸顯。本文所述的大部分摩擦,反映了區塊鏈工具與互動模式圍繞人類中介工作流演進的特點;部分摩擦則源於無需許可系統的開放性、異構性與對抗性環境;還有一部分是複雜環境下自主系統普遍面臨的問題。
核心挑戰並非讓智能體簽署交易,而是為其提供可靠途徑,完成目前由軟體與人類判斷共同承擔的語義解讀、信用判定與策略執行工作,這些工作涉及區塊鏈狀態與操作行為之間的關聯。
