Quando professores de direito foram solicitados a avaliar respostas de direito contratual sem saber quem as escreveu, escolheram as respostas geradas por IA aproximadamente três vezes a cada quatro. Os humanos não apenas perderam. Perderam de forma convincente.
Um estudo da Stanford Law School liderado pelo professor Julian Nyarko, diretor do Legal Innovation through Frontier Technology Lab da universidade, confrontou modelos de IA com 16 professores de direito de 14 escolas de direito dos EUA em 40 perguntas anônimas sobre direito contratual. O resultado: as respostas da IA venceram aproximadamente 75% das quase 3.000 comparações cegas. Os próprios pesquisadores esperavam o resultado oposto.
Os números apresentam uma imagem desequilibrada
O estudo, publicado no início de junho de 2026, testou modelos de IA, incluindo Gemini 2.5 Pro e NotebookLM, contra respostas escritas por humanos de acadêmicos jurídicos experientes. Os modelos de IA demonstraram taxas de vitória entre 75,33% e 75,92% em comparação com seus pares humanos, uma diferença notavelmente estreita que sugere que isso não foi um acaso de qualquer modelo único.
Aqui está a parte que deveria fazer os profissionais de direito sentarem um pouco mais retos. Apenas 3,53% das respostas geradas por IA foram sinalizadas como potencialmente prejudiciais ou enganosas. Para as respostas escritas pelo professor, esse valor foi de 12,06%. Em inglês: a IA não era apenas mais persuasiva, mas cerca de três vezes menos provável de produzir algo que outro professor consideraria um conselho perigoso.
As perguntas também não foram fáceis. Elas foram elaboradas em torno do terreno nuances da lei contratual, um tipo de conteúdo onde o julgamento humano, a compreensão contextual e anos de experiência em sala de aula deveriam ser mais importantes. Os pesquisadores escolheram especificamente esse domínio porque acreditavam que favoreceria os respondentes humanos. Não foi o que aconteceu.
A metodologia de avaliação merece atenção. Tratou-se de comparações cegas, o que significa que os professores responsáveis pela avaliação não tinham ideia se estavam lendo o trabalho de um colega ou de um modelo de linguagem. Isso elimina o viés mais óbvio e torna os resultados mais difíceis de descartar como mera preferência por novidade.
O que isso significa além da sala de aula
Os autores do estudo foram cuidadosos em observar que a IA deve funcionar como uma ferramenta de suporte, e não como substituição total dos instrutores humanos. Essa é uma posição razoável, e também o tipo de advertência que tende a ficar obsoleta quando a lacuna de desempenho é tão ampla.
A própria Stanford já examinou anteriormente as limitações da IA em ambientes jurídicos, particularmente o problema bem documentado de alucinações, onde modelos fabricam citações de casos ou inventam precedentes jurídicos que não existem. Este novo estudo sugere que a lacuna entre a capacidade de raciocínio jurídico da IA e sua confiabilidade está se fechando mais rapidamente do que muitos na área anteciparam.
Para o setor jurídico em geral, as implicações são significativas. Se a IA puder superar professores experientes em tarefas de raciocínio jurídico estruturado, quase certamente conseguirá realizar uma grande parte do trabalho analítico atualmente realizado por estagiários, assistentes jurídicos e pesquisadores jurídicos. Isso não é mais uma preocupação teórica. É uma conversa sobre equipe.
O estudo também se baseia em um corpo crescente de evidências de que as vantagens da IA não se limitam à velocidade ou ao custo. O argumento de qualidade, de que especialistas humanos produzem raciocínios fundamentalmente melhores, está se tornando cada vez mais difícil de sustentar com cada novo dado. E este envolveu quase 3.000 comparações, e não apenas alguns exemplos selecionados.
Por que desenvolvedores de criptomoedas e contratos inteligentes devem prestar atenção
Olhe, este estudo não mencionou criptomoedas, tokens ou tecnologia blockchain. Mas as implicações para o espaço de ativos digitais são difíceis de ignorar.
Contratos inteligentes são, em sua essência, acordos legais expressos em código. A interseção entre o raciocínio jurídico contratual e a execução automatizada é exatamente onde as forças demonstradas pela IA se tornam comercialmente relevantes. Se modelos de IA puderem raciocinar sobre obrigações contratuais de forma mais confiável do que professores humanos, a justificativa para auditoria, redação e resolução de disputas de contratos inteligentes assistidas por IA se torna substancialmente mais forte.
Protocolos de resolução de disputas on-chain, que já existem em diversas formas no DeFi, poderiam se beneficiar de sistemas de IA que raciocinem sobre os termos contratuais com a precisão demonstrada neste estudo. A taxa de respostas prejudiciais de 3,53% em comparação com 12,06% para humanos é particularmente relevante aqui, onde uma interpretação enganosa de uma cláusula de contrato inteligente pode se traduzir diretamente em perdas financeiras.
A conformidade regulatória é outra área onde esses achados ressoam. Empresas de criptomoedas que operam em um cenário legal cada vez mais complexo, abrangendo múltiplas jurisdições com regras frequentemente alteradas, poderiam utilizar ferramentas de IA que raciocinem sobre questões legais com competência de nível professoral. Os economias de custo sozinhas seriam significativas para startups que atualmente gastam grandes porções de seus orçamentos com assessoria jurídica.
Para investidores, este estudo reforça a tese de que a tecnologia jurídica impulsionada por IA está se aproximando de um ponto de virada. Empresas que desenvolvem soluções na interseção entre IA, raciocínio jurídico e infraestrutura de blockchain podem encontrar-se com uma proposta de valor mais forte do que tinham mesmo seis meses atrás. Os dados de desempenho da Stanford não apenas validam o potencial da IA em aplicações jurídicas. Eles quantificam esse potencial de forma difícil de ser descartada por céticos.
A paisagem competitiva para ferramentas legais nativas de IA que atendem ao setor de criptomoedas — como plataformas de conformidade automatizada, motores de análise de contratos inteligentes e sistemas de arbitragem descentralizados — provavelmente atrairá maior atenção tanto de capital de risco quanto de compradores estratégicos. Quando um estudo da Stanford afirma que a máquina é melhor em raciocínio jurídico 75% do tempo e erra menos de um terço das vezes, isso não é uma curiosidade de pesquisa. É um sinal de mercado.
