簡而言之:
- Arbitrum 正在研究一種新的 AI 推理驗證方法,將證明生成時間從 15 分鐘縮短至毫秒級。
- Offchain Labs 的一篇論文提出,透過隨機抽樣內部路徑來驗證 AI 模型的推論,而無需重新執行每個操作。
- 該協議使用與 Arbitrum One 相同的爭議解決邏輯,以檢測 AI API 中的模型替換。
人工智慧代理 的經濟面臨一個問題,到目前為止,沒有人能以足夠快的速度解決這個問題,使其在生產環境中實用:驗證供應商聲稱正在運行的 AI 模型是否確實正在執行。
2026 年 3 月,Offchain Labs 發表了一篇題為 *Towards Verifiable AI with Lightweight Cryptographic Proofs of Inference* 的論文,提出了一種解決方案,將證明生成時間從約 15 分鐘縮短至毫秒級,而該系統背後的邏輯對於 Arbitrum 生態而言並不陌生。
市場已將信任差距正常化
每代幣定價模式為欺詐行為創造了明確的經濟誘因。運行 70 億參數模型的成本高於運行 7 億參數模型,而量化推理的成本低於全精度推理。如果供應商能將部分查詢導向較小的模型,同時收取較大模型的費用,其收益將隨體積成比例增加。史丹佛大學的研究人員記錄到,GPT-3.5 和 GPT-4 在 2023 年 3 月至 6 月期間,在相同的評估任務中表現出現可測量的變化。目前的 API 合約並未提供檢測此差異的機制。

現有的加密證明,與 zk-rollups 所使用的類型相同,可證明伺服器正確執行了 計算,而無需客戶端重複執行。問題在於速度。例如 zkLLM 方案為一個 130 億參數的模型生成推理證明約需 15 分鐘,這與必須在 1 秒內響應的 API 不相容。
保護 Arbitrum One 的相同機制
Offchain Labs 的提案放棄了全面證明,改採抽樣方式。伺服器提前承諾模型權重的數位指紋以及特定查詢期間產生的內部值。客戶隨機選擇一條通往網路輸出的路徑,並要求伺服器僅揭示該路徑上的值。若伺服器運行的是不同模型,這些值將不一致,導致驗證失敗。每次重複查詢時,檢測機率會累積,使該系統成為對理性對手的有效威懾。

論文中明確提及與 Arbitrum 的關聯。樂觀滾動基於相同的直覺:在每台機器上重新執行長時間計算的每一步成本高昂,而抽樣爭議步驟則成本低廉。所提出的協議將此邏輯延伸至神經網絡的值,採用二分法程序,在對數輪次內縮小兩台伺服器之間的分歧,其爭議解決結構與保護 Arbitrum One 的結構相同。
對於受監管的行業、模型治理團隊以及自主代理的新兴市場而言,宣稱透明度與可驗證聲明之間的差異,正開始產生直接後果。該協議並不要求開發者修改其現有堆棧;它僅要求系統中的某一方——無論是提供者、審計方還是平台——產生一個可驗證的聲明。

