スタンフォード大学の研究：AIが契約法のQAで法律教授を上回る

法律教育の希少性は、「答えを提供する」から「答えを判断する」へと移行している。

法学院の講義室で、最も語り継がれるのは、ソクラテス式質問に関する伝説である。長年にわたり、法律教育の核心は、人間の経験に大きく依存する技術とされてきた。曖昧さの中で境界を見出し、対立する主張の間で利害を調整し、唯一の答えがないように見える問いに対して判断力を養うのである。

しかし、スタンフォード法科大学院による最新の実証研究が、そのような想像に一時停止をかけている。

この研究は、AIに法科大学院の試験を受けさせたり、完全な法律意見書を書かせることではありません。より具体的で、日常の授業に近いシナリオを検証しています：1年生の法科学生が契約法の授業後や質問タイムに質問した際に、AIが提供する短い回答が、法学教授が書いた回答よりも同僚教授たちに好まれるかどうかです。

答えは非常に目立つ。

一、75.33%の勝率：AIが匿名ブラインド評価で教授たちに好まれる

「Law Professors Prefer AI Over Peer Answers」と題されたこの研究は、スタンフォード法学院のジュリアン・ニャルコ教授とそのLegal Innovation through Frontier Technology Lab（liftlab）が推進し、耶鲁大学、ニューヨーク大学、シカゴ大学などの学者らが研究チームに参加しています。

研究チームは、1年生の契約法コースで学生がオフィスアワーでよく質問する疑問を踏まえて、米国の契約法教授16名を招き、40の代表的な質問を設計した。その後、人間の教授と大規模言語モデルがそれぞれ回答し、教授たちは回答の出所を知らずに匿名で比較した。

2,918回の匿名ブラインド比較において、大規模言語モデルの回答の平均勝率は75.33%であった。教育的に誤解を招くと評価された割合は、人間の教授の回答が12.06%であるのに対し、AIの回答は3.53%であった。

このデータの衝撃性は、AIが法律知識の質問でいくつかの概念問題を正解したからではない。これまで多くのAI評価は、白か黒かの明確な知識項目に焦点を当てていた：正しければ正解、間違っていれば不正解。しかし、法律教育で最も難しい部分は、規則を暗記することではなく、規則をどのように解釈し、適用し、二つのどちらも妥当に見える主張の間で分析を展開するかにある。この実験は、AIが法律家が議論の質を評価する際に用いる、隠蔽的で厳格な専門基準に到達できるかどうかを試している。

二、グレーゾーンでの対決：AIは明確さ、構造、教育的感覚で勝る

これらの質問は、回答者が具体的な事実を理解し、学生の混乱を識別し、抽象的な法律規則を新しい状況に適用し、教育に適した方法で説明できるように求めています。

これは、法律教育が長年にわたり最も重視してきた人間の優位性そのものです：標準的な答えを提示するのではなく、学生が分析の道筋を形成するよう導くことです。したがって、AIがこのようなシナリオで勝利することは、決して小さな意味しか持ちません。

研究チームは実験設計時に、回答の長さ、フォーマット、文章構造を意図的に制御し、評価者がAIの回答がより長く、整然としている、または「機械生成テキスト」に似たスタイルであるという理由だけでバイアスを生まないようにしました。ヒューマンブラインド評価段階では、主にGemini 2.5 Proと関連するcasebookに基づくGoogle NotebookLMを比較しました。論文はさらにLLM-as-judge手法を用いて、より多くのモデルについて拡張評価を行いました。

AIの利点は単に「資料が豊富」や「速く書ける」だけではない。この具体的な実験では、它は法学教授が短答指導で好む数つの要素、すなわち構成が明確で、推論が一貫しており、質問に直接応え、教育的な口調が安定していることに適っていた。

法学教授は日常の授業でより豊富な経験と判断力を有しているが、数百字に圧縮された質問応答の状況では、人間の即興的な回答が常に最適なバージョンとは限らない。AIは逆に、問題を複数のレベルに分解し、明確で再利用可能かつ感情の揺れが少ない方法で出力することに長けている。

三、教授の代替ではなく、教授の仕事の重点を変える

もちろん、この研究を「AIが法学教授を置き換えることができる」と解釈するのは過剰な解釈である。

論文の範囲は明確である：これは、契約法の授業における短答式、オフィスアワー形式の学生質問対応を評価したものであり、完全な授業、論文指導、事実調査、職業倫理の判断、または実際のクライアント代理能力ではない。

AIが匿名の盲評で優れた成績を収めたからといって、それが法律教育のすべての能力を備えたことを意味するわけではない。AIは依然として幻覚を生じる可能性があり、過剰な自信を示す可能性があり、文脈が不足しているときに学生を誤導する可能性もある。さらに重要なのは、法律教育の目的が学生に「見かけの良い答え」を導き出すことではなく、答えを疑い、分解し、再構築する方法を学ぶことであるということである。

これがまさに教授がまだ代替不可能な理由です。

しかし、この研究は法学院に、単に「法律が複雑でAIは判断できない」という安心地帯にとどまるわけにはいかないことを示している。少なくとも一部の日常的な教育場面では、AIは十分に明確で構造化されており、教授同士から好まれる説明を生成できるようになっている。

今後の重要な課題は、「AIは質問に答えられるか」ではなく、「法科大学院はAIを教育設計にどう取り入れるか」になるかもしれない。AIは学生の事前学習における最初の解釈ツールとなり、課後の質問対応を支援する補助ツールとなり、さらには異なる回答間の優劣を判別する能力を学生に育成するためにも活用できる。真に価値のある授業は、「教授が答えを教える」から、「教授が学生と共に答えを審判する」へと移行する可能性がある。

四、法教育の護城河は、答えから判断へと移行している

この研究の最も興味深い点は、法律教育においてかつて希少と見なされていた能力——法律の解釈、事例の類推、初步的な論証、授業での質問対応——が、AIによって特定の状況で安定して十分な品質のバージョンを生成できるようになり、その価値が再評価されている点である。

したがって、教授の価値は消えることはないが、上位に移行する必要がある：答えを提供するから問題を設計するへ；ルールを説明するから判断を訓練するへ；誤りを修正するから「見かけは正しいが疑わしい」論証を学生が識別するのを支援するへ。

これは法律教育にとって必ずしも悪いことではない。逆に、法科大学院に長く見過ごされてきた問題を再び直面させる可能性がある。つまり、AIが明確な初期解説を提供できるなら、教室で人間の教師が時間を費やすべきものは何なのか？その答えは、より複雑な事実、より現実的な対立、より標準化が難しい価値判断、そしてより厳格な批判的訓練かもしれない。

AIが契約法の質疑応答で教授を上回ったとしても、それは教授の意義が失われたことを意味しない。それは法律教育の希少性が、「誰が答えを言えるか」から「誰が答えが十分に良いと判断できるか」へと移行していることを意味する。

参考資料

Ashe, S. (2026年6月1日)。 AI、スタンフォード法学校の研究で法教授を上回る。スタンフォード法学校。

Salinas, A., Frieders, C., Guha, N., Ma, S., Sanga, S., Nyarko, J., 他。 法学者は同僚の回答よりもAIを好む。スタンフォード大学ロースクール / liftlab、2026年。