Cuando se pidió a profesores de derecho evaluar respuestas de derecho contractual sin saber quién las había escrito, eligieron las respuestas generadas por IA aproximadamente tres de cada cuatro veces. Los humanos no solo perdieron; lo hicieron de manera contundente.
Un estudio de la Escuela de Derecho de Stanford liderado por el profesor Julian Nyarko, director del Laboratorio de Innovación Legal a través de la Tecnología de Vanguardia de la universidad, enfrentó modelos de IA contra 16 profesores de derecho de 14 escuelas de derecho estadounidenses en 40 preguntas anónimas sobre derecho contractual. El resultado: las respuestas de la IA ganaron aproximadamente el 75% de los casi 3.000 emparejamientos ciegos. Los propios investigadores esperaban el resultado opuesto.
Los números muestran una imagen desequilibrada
El estudio, publicado a principios de junio de 2026, evaluó modelos de IA, incluidos Gemini 2.5 Pro y NotebookLM, frente a respuestas escritas por humanos de académicos legales experimentados. Los modelos de IA mostraron tasas de victoria entre el 75,33 % y el 75,92 % frente a sus contrapartes humanas, una dispersión notablemente estrecha que sugiere que esto no fue un accidente de ningún modelo en particular.
Aquí está la parte que debería hacer que los profesionales del derecho se sienten un poco más derechos. Solo el 3.53% de las respuestas generadas por IA fueron marcadas como potencialmente dañinas o engañosas. En las respuestas escritas por el profesor, esa cifra fue del 12.06%. En inglés: la IA no solo fue más persuasiva, sino que también fue aproximadamente tres veces menos probable de producir algo que un profesor colega consideraría un consejo peligroso.
Las preguntas tampoco fueron fáciles. Fueron diseñadas alrededor del terreno matizado del derecho de contratos, un tipo de material donde se suponía que el juicio humano, la comprensión contextual y años de experiencia en el aula deberían importar más. Los investigadores eligieron específicamente este dominio porque creían que favorecería a los respondientes humanos. No lo hizo.
La metodología de evaluación merece atención. Se trataba de comparaciones ciegas, lo que significa que los profesores que realizaban la evaluación no sabían si estaban leyendo el trabajo de un colega o de un modelo de lenguaje. Esto elimina el sesgo más obvio y hace que los resultados sean más difíciles de descartar como mera preferencia por la novedad.
Lo que esto significa más allá del aula
Los autores del estudio tuvieron cuidado en señalar que la IA debería funcionar como una herramienta de apoyo en lugar de un reemplazo total de los instructores humanos. Esa es una posición razonable, y también el tipo de advertencia que tiende a envejecer mal cuando la brecha de rendimiento es tan amplia.
Stanford ya ha examinado previamente las limitaciones de la IA en entornos legales, particularmente el problema bien documentado de las alucinaciones, donde los modelos fabrican citas de casos o inventan precedentes legales que no existen. Este nuevo estudio sugiere que la brecha entre la capacidad de razonamiento legal de la IA y su confiabilidad se está cerrando más rápido de lo que muchos en el campo anticipaban.
Para el sector legal en general, las implicaciones son significativas. Si la IA puede superar a profesores experimentados en tareas de razonamiento legal estructurado, casi con certeza puede manejar una gran parte del trabajo analítico actualmente realizado por asociados juniors, asistentes legales e investigadores jurídicos. Eso ya no es una preocupación teórica. Es una conversación sobre personal.
El estudio también se basa en un cuerpo creciente de evidencia que muestra que las ventajas de la IA no se limitan a la velocidad o el costo. El argumento de calidad, según el cual los expertos humanos producen un razonamiento fundamentalmente superior, se vuelve cada vez más difícil de sostener con cada nuevo dato. Y este caso involucró casi 3,000 comparaciones, no solo unos pocos ejemplos seleccionados.
Por qué los desarrolladores de criptomonedas y contratos inteligentes deben prestar atención
Mira, este estudio no mencionó criptomonedas, tokens ni tecnología de cadena de bloques. Pero las implicaciones para el espacio de activos digitales son difíciles de ignorar.
Los contratos inteligentes son, en esencia, acuerdos legales expresados en código. La intersección entre el razonamiento jurídico contractual y la ejecución automatizada es exactamente donde las fortalezas demostradas por la IA se vuelven comercialmente relevantes. Si los modelos de IA pueden razonar sobre obligaciones contractuales de manera más confiable que los profesores humanos, el argumento a favor de la auditoría, redacción y resolución de disputas de contratos inteligentes asistidas por IA se vuelve sustancialmente más fuerte.
Los protocolos de resolución de disputas en la cadena, que ya existen en diversas formas en el DeFi, podrían beneficiarse de sistemas de IA que razonen sobre los términos contractuales con el nivel de precisión que demuestra este estudio. La tasa de respuestas perjudiciales del 3.53% en comparación con el 12.06% para humanos es particularmente relevante aquí, donde una interpretación engañosa de una cláusula de contrato inteligente puede traducirse directamente en pérdidas financieras.
El cumplimiento normativo es otro área donde estas conclusiones tienen relevancia. Las empresas de criptomonedas que navegan un panorama legal cada vez más complejo, que abarca múltiples jurisdicciones con reglas que cambian con frecuencia, podrían utilizar herramientas de IA que razonen sobre preguntas legales con competencia de nivel profesional. Los ahorros en costos por sí solos serían significativos para las startups que actualmente destinan partes importantes de sus presupuestos a asesoría legal.
Para los inversores, este estudio refuerza la tesis de que la tecnología legal impulsada por IA está cerca de alcanzar un punto de inflexión. Las empresas que desarrollan soluciones en la intersección de la IA, el razonamiento jurídico y la infraestructura de cadena de bloques podrían encontrarse con una propuesta de valor más fuerte que hace seis meses. Los datos de rendimiento de Stanford no solo validan el potencial de la IA en aplicaciones jurídicas; lo cuantifican de una manera difícil de descartar para los escépticos.
El panorama competitivo para herramientas legales nativas de IA que sirven al sector cripto, como plataformas de cumplimiento automatizado, motores de análisis de contratos inteligentes y sistemas de arbitraje descentralizado, probablemente atraerá una mayor atención tanto de capital de riesgo como de adquirentes estratégicos. Cuando un estudio de Stanford afirma que la máquina es mejor en el razonamiento legal el 75% del tiempo y se equivoca menos de un tercio de las veces, eso no es una curiosidad de investigación. Eso es una señal del mercado.
