การศึกษาจากสแตนฟอร์ด: การให้เหตุผลทางกฎหมายด้วยปัญญาประดิษฐ์ทำได้ดีกว่าศาสตราจารย์กฎหมายในการทดสอบแบบไม่รู้ตัว

icon币界网
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
การศึกษาที่นำโดยสแตนฟอร์ดพบว่า การใช้ปัญญาประดิษฐ์ในการให้เหตุผลทางกฎหมายทำได้ดีกว่าศาสตราจารย์กฎหมายในการทดสอบแบบไม่รู้ตัว โดยคำตอบของปัญญาประดิษฐ์ได้รับความนิยมใน 75.92% ของกรณี ศาสตราจารย์ 16 ท่านได้ประเมินการเปรียบเทียบ 2,918 กรณี และให้ความนิยมแก่ปัญญาประดิษฐ์ในทุกด้านของกฎหมายคดี นโยบาย และสถานการณ์สมมติ คำตอบของปัญญาประดิษฐ์ยังถูกพิจารณาว่าเป็นอันตรายน้อยกว่าด้วย กรอบแนวคิด MiCA (กฎระเบียบตลาดสินทรัพย์คริปโตของสหภาพยุโรป) อาจมีอิทธิพลต่อวิธีการใช้เครื่องมือปัญญาประดิษฐ์ในตลาดสภาพคล่องและตลาดคริปโต บริษัทกฎหมายยังคงระมัดระวังเนื่องจากปัญหาการหลอกลวงของปัญญาประดิษฐ์ ซึ่งเห็นได้จากเหตุการณ์ล่าสุดในศาลล้มละลาย
CoinDesk รายงาน:

การวิจัยที่นำโดยมหาวิทยาลัยสแตนฟอร์ดแสดงให้เห็นว่าในภารกิจการให้เหตุผลด้านกฎหมายสัญญา ศาสตราจารย์ด้านกฎหมายมักเลือกคำตอบที่สร้างโดย AI มากกว่าเวอร์ชันที่เขียนโดยเพื่อนร่วมวิชาชีพ ทีมวิจัยเชื่อว่านี่บ่งชี้ว่าโมเดลภาษาขนาดใหญ่ในบางบริบทเฉพาะทาง ได้สามารถเข้าใกล้มาตรฐานการประเมินที่พบบ่อยในสาขากฎหมาย

การเปรียบเทียบแบบไม่รู้ข้อมูลประมาณ 3,000 ครั้ง

การวิจัยเชิญศาสตราจารย์ 16 ท่านจากสถาบันกฎหมาย 14 แห่งในสหรัฐอเมริกาเข้าร่วมออกข้อสอบ ได้แก่ สแตนฟอร์ด เยล มหาวิทยาลัยนิวยอร์ก มหาวิทยาลัยชิคาโก มหาวิทยาลัยจอร์จทาวน์ UCLA และมหาวิทยาลัยเวอร์จิเนีย เป็นต้น ข้อสอบมีทั้งหมด 40 ข้อ ครอบคลุมหลักการสัญญา คำพิพากษา คำถามสมมติ และการอภิปรายเชิงนโยบาย

ในการเปรียบเทียบแบบไม่รู้ตัวทั้งหมด 2,918 ครั้ง ศาสตราจารย์ผู้พิจารณาต้องเลือกคำตอบหนึ่งในสองคำตอบที่ไม่เปิดเผยตัวตนว่าต้องการให้นักเรียนใช้ ผลลัพธ์แสดงว่า Google Gemini 2.5 Pro ชนะคำตอบจากมนุษย์ร้อยละ 75.92 ในขณะที่ NotebookLM มีอัตราการชนะร้อยละ 74.75

มีข้อได้เปรียบในหลายรูปแบบของคำถาม

การวิจัยพบว่า AI ทำได้ดีกว่าคำตอบของมนุษย์ในหลายประเภทของคำถาม รวมถึงคำถามที่ต้องใช้ความจำเกี่ยวกับคดีตัวอย่าง กฎหมาย และหลักการทางกฎหมาย รวมถึงการวิเคราะห์สมมติฐานและการอภิปรายเชิงนโยบาย นอกจากนี้ นักวิจัยยังตรวจสอบว่าการตัดสินของอาจารย์เป็นเพียงความชอบส่วนตัวหรือไม่ ผลลัพธ์แสดงว่าความสอดคล้องสูงกว่าระดับสุ่ม

เพื่อแยกแยะความเป็นไปได้ที่ว่าความชอบของผู้สอนต่อคำตอบจาก AI เกิดจากสไตล์การเขียนที่เป็นระเบียบมากกว่า ทีมงานจึงวิเคราะห์เพิ่มเติมเกี่ยวกับคุณลักษณะอื่นๆ เช่น ความยาวของคำตอบ โครงสร้าง ระดับความละเอียดในการให้เหตุผล หลักฐานทางกฎหมาย น้ำเสียง ความชัดเจน และความสามารถในการสนับสนุนการเรียนรู้ การศึกษาชี้ว่าปัจจัยภายนอกเหล่านี้ไม่สามารถอธิบายความชอบของผู้สอนต่อคำตอบจาก AI ได้อย่างสมบูรณ์

มีการแจ้งเตือนเนื้อหาที่เป็นอันตรายน้อยลง

การศึกษานี้ยังเปรียบเทียบสัดส่วนของคำตอบที่ถูกทำเครื่องหมายว่าเป็นอันตราย โดย Gemini มีสัดส่วน 3.41% NotebookLM มี 3.64% ขณะที่คำตอบจากมนุษย์มี 12.06% ในกลุ่มเปรียบเทียบแบบจำลองเพิ่มเติมอีกชุดหนึ่ง Claude Opus 4.7 ของ Anthropic อยู่อันดับหนึ่ง ตามด้วย ChatGPT 5.4 ของ OpenAI

อย่างไรก็ตาม การศึกษานี้ยังชี้ให้เห็นว่าการทดสอบนี้ไม่ได้วัดว่าคำตอบสอดคล้องกับความชอบในการสอนของแต่ละศาสตราจารย์ ดังนั้น คำตอบจาก AI อาจได้รับการยอมรับในระดับทั่วไป แต่ไม่จำเป็นต้องตรงกับรูปแบบการสอนของครูแต่ละคนอย่างแม่นยำ

อุตสาหกรรมกฎหมายยังคงพิจารณาจังหวะการนำไปใช้

ในขณะที่ศาล สำนักงานทนายความ และวิทยาลัยกฎหมายยังคงอภิปรายเกี่ยวกับวิธีการที่ AI ควรเข้ามาในกระบวนการงานกฎหมาย การสนับสนุนเชื่อว่า AI สามารถเพิ่มประสิทธิภาพของบริการทางกฎหมาย และจะกลายเป็นเครื่องมือพื้นฐานหนึ่งสำหรับตำแหน่งงานกฎหมายในอนาคต

แต่ภาคกฎหมายยังคงระมัดระวังต่อปัญหาภาพหลอนของ AI รายงานระบุว่าเมื่อเดือนเมษายนที่ผ่านมา บริษัททนายความ Sullivan & Cromwell ได้ยอมรับต่อศาลล้มละลายของสหรัฐฯ ว่าเอกสารหนึ่งของพวกเขามีคำอ้างปลอมที่ถูกสร้างขึ้นโดย AI

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา