史丹佛大學研究顯示，AI 在 75% 的情況下於合約法推理上優於法律教授

當法學教授被要求評估合約法答案，且不知作者身份時，他們約每四次中就有三次選擇了 AI 生成的回應。人類不僅輸了，而且輸得明顯。

由史丹佛法學院教授朱利安·尼亞爾科（Julian Nyarko）領導的研究，其擔任該校前沿技術法律創新實驗室主任，讓人工智慧模型與來自14所美國法學院的16位法學教授，在40個匿名的合約法問題上進行對決。結果顯示：在近3,000場盲測對決中，人工智慧的答覆贏得了約75%。研究人員原本預期會得到相反的結果。

這些數字呈現出一面倒的圖景

該研究於2026年6月初發表，測試了包括Gemini 2.5 Pro和NotebookLM在內的AI模型，並與資深法律學者所撰寫的答案進行比較。AI模型對人類對手的勝率介於75.33%至75.92%之間，這一極其狹窄的差距表明，這並非任何單一模型的偶然結果。

這部分應足以讓法律專業人士更為警覺：僅有 3.53% 的 AI 生成答案被標記為潛在有害或誤導性內容；而教授撰寫的答案中，這一比例為 12.06%。用英文來說，AI 不僅更具說服力，其產生的建議被其他教授視為危險的機率也低了約三倍。

這些問題也不是簡單的問題，它們圍繞著合約法的複雜領域設計，這類內容本應最依賴人類的判斷、情境理解與多年的課堂經驗。研究人員特別選擇這個領域，是因為他們認為這會有利於人類受試者，但結果並非如此。

評估方法值得關注。這些都是盲測比較，意味著進行評判的教授們並不知道他們閱讀的是同事的作品還是語言模型的輸出。這消除了最明顯的偏見，使結果更難被簡單地視為新穎性偏好。

這意味著的遠不止於課堂之上

研究的作者謹慎指出，人工智慧應作為輔助工具，而非完全取代人類教師。這是一個合理的持倉，但當表現差距如此之大時，此類警示往往會隨時間推移而顯得過時。

史丹佛大學本身曾檢視過人工智慧在法律環境中的限制，特別是廣為人知的幻覺問題，即模型虛構案例引用或創造不存在的法律先例。這項新研究顯示，人工智慧法律推理能力與其可靠性之間的差距，正以該領域許多人士預期更快的速度縮小。

對於更廣泛的法律行業而言，其影響深遠。如果 AI 能在結構化法律推理任務中超越資深教授，它幾乎肯定能處理目前由初級律師、律師助理和法律研究人員所執行的大量分析工作。這已不再是理論上的擔憂，而是一場關於人力配置的對話。

該研究還基於日益增多的證據，表明 AI 的優勢不僅限於速度或成本。人類專家能產生更根本優質推理的論點，隨著每個新數據點的出現，越來越難以維持。而這項研究涉及近 3,000 次比較，而非少數挑選出來的例子。

為何加密貨幣與智能合約開發者應予以關注

請看，這項研究並未提及加密貨幣、代幣或區塊鏈技術。但其對數位資產領域的影響卻不容忽視。

智能合約的核心是以代碼表達的法律協議。合同法推理與自動執行的交集，正是 AI 所展現的優勢變得商業相關之處。如果 AI 模型能比人類教授更可靠地推理合同義務，那麼 AI 協助智能合約審計、起草和爭議解決的論點將顯著增強。

鏈上爭議解決協議，目前在去中心化金融中已以各種形式存在，若能運用 AI 系統以本研究所示的準確度來推理合約條款，將會受益良多。在此情境下，AI 的有害回應率為 3.53%，遠低於人類的 12.06%，因為對智能合約條款的誤解可能直接導致財務損失。

監管合規是另一個這些發現產生共鳴的領域。在跨越多個司法管轄區、法規頻繁變動的日益複雜法律環境中運作的加密貨幣公司，可以使用能夠以教授級水準推理法律問題的AI工具。單是成本節省，就對目前將大量預算花費在法律顧問上的初創公司具有重要意義。

對於投資者而言，這項研究為「AI 驅動的法律科技正逼近臨界點」這一論點增添了動力。在 AI、法律推理與區塊鏈基礎設施交匯處開發的公司，其價值主張可能比六個月前更為強大。史丹佛大學的表現數據不僅驗證了 AI 在法律應用中的潛力，更以一種懷疑者難以輕易忽視的方式對其進行了量化。

為加密貨幣領域提供原生 AI 法律工具的競爭格局，例如自動合規平台、智能合約分析引擎和去中心化仲裁系統，很可能會吸引風險投資和戰略收購方的更多關注。當一項史丹福大學的研究指出，機器在 75% 的時間內在法律推理上優於人類，且出錯頻率不到人類的三分之一時，這並非僅僅是研究上的新奇現象，而是一個市場信號。