Nghiên cứu của Stanford: AI vượt trội hơn các giáo sư luật trong câu hỏi-trả lời về luật hợp đồng

Sự khan hiếm của giáo dục pháp lý đang chuyển từ “đưa ra câu trả lời” sang “đánh giá câu trả lời”.

Trong phòng học hình thang của trường luật, điều được nhiều người nhắc đến nhất thường là những truyền thuyết về phương pháp đặt câu hỏi theo phong cách Socrates. Trong lâu dài, cốt lõi của giáo dục pháp lý được xem là một kỹ năng phụ thuộc rất nhiều vào kinh nghiệm con người: tìm kiếm ranh giới trong sự mơ hồ, cân nhắc giữa các lập luận đối lập, và rèn luyện khả năng phán đoán trong những câu hỏi dường như không có câu trả lời duy nhất.

Tuy nhiên, một nghiên cứu thực chứng mới nhất từ Trường Luật Stanford đang tạm dừng hình dung này.

Nghiên cứu này không nhằm mục đích cho AI tham gia kỳ thi luật sư, cũng không yêu cầu nó viết một bản ý kiến pháp lý hoàn chỉnh. Nó kiểm tra một bối cảnh cụ thể hơn và gần gũi hơn với giảng dạy hàng ngày: khi sinh viên năm nhất đặt câu hỏi sau giờ học luật hợp đồng hoặc trong giờ giải đáp thắc mắc, liệu câu trả lời ngắn gọn do AI đưa ra có được các giáo sư luật đánh giá cao hơn so với câu trả lời do giáo sư luật viết ra không?

Câu trả lời khá chói mắt.

Một, tỷ lệ thắng 75,33%: AI được các giáo sư ưa thích hơn trong đánh giá ẩn danh

Nghiên cứu có tựa đề “Law Professors Prefer AI Over Peer Answers” được thúc đẩy bởi giáo sư Julian Nyarko từ Trường Luật Stanford và Legal Innovation through Frontier Technology Lab (liftlab), với sự tham gia của các học giả từ các trường đại học như Yale, New York University, University of Chicago, v.v.

Nhóm nghiên cứu đã mời 16 giáo sư luật hợp đồng Mỹ, thiết kế 40 câu hỏi đại diện dựa trên những thắc mắc thường được sinh viên đặt ra trong giờ tư vấn của khóa học luật hợp đồng năm nhất. Sau đó, các giáo sư con người và mô hình ngôn ngữ lớn lần lượt trả lời, sau đó các giáo sư so sánh một cách ẩn danh mà không biết nguồn gốc câu trả lời.

Kết quả cho thấy, trong 2.918 lần so sánh đánh giá ẩn danh, tỷ lệ chiến thắng trung bình của các câu trả lời từ mô hình ngôn ngữ lớn đạt 75,33%. Tỷ lệ bị đánh giá là có tính hướng dẫn sai lệch về mặt giảng dạy, câu trả lời của giáo viên con người là 12,06%, trong khi câu trả lời của AI là 3,53%.

Số liệu này gây ấn tượng mạnh không phải vì AI đã trả lời đúng một vài câu hỏi khái niệm trong lĩnh vực pháp lý. Trước đây, nhiều bài đánh giá AI tập trung vào các điểm kiến thức rõ ràng: đúng là đúng, sai là sai. Nhưng phần khó nhất trong giáo dục pháp lý lại không nằm ở việc ghi nhớ quy tắc, mà ở cách giải thích quy tắc, cách áp dụng quy tắc, và cách phân tích giữa hai lập luận đều có vẻ hợp lý. Thí nghiệm này kiểm tra xem AI có thể tiếp cận được những tiêu chuẩn chuyên môn ẩn sâu và khắt khe mà các chuyên gia pháp lý sử dụng để đánh giá chất lượng lập luận hay không.

Hai: Cuộc đối đầu ở vùng xám: AI chiến thắng nhờ sự rõ ràng, cấu trúc và tính chất giảng dạy

Các câu hỏi này yêu cầu người trả lời hiểu các sự kiện cụ thể, nhận diện sự bối rối của học sinh, áp dụng các quy định pháp lý trừu tượng vào các tình huống mới, và giải thích theo cách phù hợp với giảng dạy.

Đây chính là lợi thế con người mà giáo dục pháp lý đã nhấn mạnh trong thời gian dài: không phải đưa ra câu trả lời chuẩn, mà là hướng dẫn sinh viên xây dựng lộ trình phân tích. Do đó, việc AI vượt trội trong các tình huống như thế này không hề nhỏ.

Nhóm nghiên cứu đã chủ động kiểm soát độ dài, định dạng và cấu trúc văn bản của các câu trả lời trong quá trình thiết kế thí nghiệm, nhằm tránh sự thiên lệch từ người đánh giá do câu trả lời của AI dài hơn, trình bày gọn gàng hơn hoặc mang phong cách giống văn bản do máy tạo ra. Trong giai đoạn đánh giá mù bởi con người, nghiên cứu chủ yếu so sánh Gemini 2.5 Pro và Google NotebookLM dựa trên các casebook liên quan. Bài báo còn mở rộng đánh giá thêm nhiều mô hình khác thông qua phương pháp LLM-as-judge.

Lợi thế của AI không chỉ là “nhiều tài liệu” hay “viết nhanh”. Trong thí nghiệm cụ thể này, nó dường như đã chạm trúng một vài yếu tố mà các giáo sư luật ưa thích trong hướng dẫn trả lời ngắn: cấu trúc rõ ràng, lập luận mạch lạc, phản hồi trực tiếp với câu hỏi, và phong cách giảng dạy ổn định.

Các giáo sư luật đương nhiên có kinh nghiệm và khả năng phán đoán phong phú hơn trong giảng dạy hàng ngày, nhưng trong bối cảnh trả lời ngắn gọn bị giới hạn trong vài trăm từ, câu trả lời ngẫu hứng của con người không phải lúc nào cũng là phiên bản tối ưu. AI lại đặc biệt giỏi trong việc chia nhỏ câu hỏi thành nhiều cấp độ, sau đó đưa ra câu trả lời rõ ràng, có thể tái sử dụng và ít biến động cảm xúc.

Ba, không phải thay thế giáo sư, mà là thay đổi trọng tâm công việc của giáo sư

Of course, interpreting this study as "AI can replace law professors" is still an overinterpretation.

Phạm vi của bài luận rất rõ ràng: nó đánh giá các câu hỏi trả lời ngắn dạng office-hours trong khóa học luật hợp đồng, không phải là toàn bộ bài giảng, không phải hướng dẫn luận văn, không phải điều tra sự thật, không phải phán xét đạo đức nghề nghiệp, cũng không phải năng lực đại diện khách hàng thực tế.

AI trong đánh giá ẩn danh thể hiện xuất sắc không có nghĩa là nó đã sở hữu đầy đủ năng lực trong giáo dục pháp lý. Nó vẫn có thể tạo ra ảo giác, có thể quá tự tin, hoặc gây hiểu lầm cho sinh viên khi thiếu bối cảnh. Quan trọng hơn, mục tiêu của giáo dục pháp lý không chỉ là giúp sinh viên “đưa ra một câu trả lời trông có vẻ tốt”, mà là dạy sinh viên cách nghi ngờ câu trả lời, phân tích câu trả lời và tái xây dựng câu trả lời.

Đây chính là nơi mà giáo sư vẫn không thể thay thế.

Tuy nhiên, nghiên cứu này cũng cảnh báo các trường luật rằng không thể tiếp tục lấy lý do “pháp luật quá phức tạp, AI không thể đưa ra phán xét” làm vùng an toàn. Ít nhất trong một số bối cảnh giảng dạy hàng ngày, AI đã có thể tạo ra những lời giải thích đủ rõ ràng, đủ có cấu trúc, thậm chí còn được các đồng nghiệp giáo sư ưa chuộng hơn.

Vấn đề then chốt trong tương lai có lẽ không còn là “AI có thể trả lời câu hỏi không”, mà là “các trường luật sẽ tích hợp AI vào thiết kế giảng dạy như thế nào”. Nó có thể trở thành trình diễn giải đầu tiên giúp sinh viên chuẩn bị bài trước giờ học, công cụ hỗ trợ giải đáp thắc mắc sau giờ học, hoặc được sử dụng để rèn luyện khả năng phân biệt ưu nhược điểm giữa các câu trả lời khác nhau. Những lớp học thực sự có giá trị có thể chuyển từ “giảng viên truyền đạt câu trả lời” sang “giảng viên dẫn dắt sinh viên phán xét câu trả lời”.

Bốn, hàng rào pháp lý trong giáo dục đang chuyển từ câu trả lời sang phán đoán

Điều thú vị nhất của nghiên cứu này là nó phơi bày một số kỹ năng từng được coi là khan hiếm trong giáo dục pháp lý — như giải thích quy định, so sánh vụ án, lập luận ban đầu và trả lời câu hỏi trên lớp — những kỹ năng trước đây phụ thuộc rất nhiều vào kinh nghiệm cá nhân của giảng viên. Hiện nay, AI đã có thể tạo ra các phiên bản khá tốt một cách ổn định trong các bối cảnh cụ thể.

Giá trị của giáo sư vì vậy sẽ không biến mất, mà sẽ bị buộc phải dịch chuyển lên cao hơn: từ việc cung cấp câu trả lời sang thiết kế câu hỏi; từ việc giải thích quy tắc sang đào tạo khả năng phán đoán; từ việc sửa lỗi sang giúp sinh viên nhận diện các lập luận “dường như đúng nhưng vẫn đáng nghi ngờ”.

Điều này chưa chắc là điều xấu đối với giáo dục pháp lý. Ngược lại, nó có thể buộc các trường luật phải đối mặt lại với một vấn đề đã bị che giấu lâu dài: nếu AI có thể đưa ra những giải thích ban đầu rõ ràng, thì điều gì thực sự xứng đáng để giảng viên con người đầu tư thời gian trong lớp học? Câu trả lời có lẽ là những sự thật phức tạp hơn, những xung đột chân thực hơn, những phán xét giá trị khó chuẩn hóa hơn, cùng với những đào tạo phê phán khắt khe hơn.

Việc AI thắng giáo sư trong việc giải đáp câu hỏi về luật hợp đồng không có nghĩa là giáo sư trở nên vô nghĩa. Nó có nghĩa là sự khan hiếm trong giáo dục pháp lý đang chuyển dịch: từ “ai có thể đưa ra câu trả lời” sang “ai có thể đánh giá câu trả lời có đủ tốt không”.

Tài liệu tham khảo

Ashe, S. (2026, ngày 1 tháng 6). AI vượt trội hơn các giáo sư luật trong nghiên cứu luật của Stanford. Trường Luật Stanford.

Salinas, A., Frieders, C., Guha, N., Ma, S., Sanga, S., Nyarko, J., et al. Giảng viên luật ưa chuộng AI hơn câu trả lời của đồng nghiệp. Trường Luật Stanford / liftlab, 2026.