O ganhador do Prêmio Turing e pai do aprendizado por reforço, Richard Sutton, critica as limitações intrínsecas da IA generativa atual: as partes boas não são novas, e as partes novas não são boas.

Autor do artigo, fonte: Nova Inteligência

IA: O bom não é novo, o novo não é bom

Um dos comentários mais tóxicos do meio acadêmico é:

Este trabalho é inovador e muito bom.

Infelizmente, a parte boa não é nova, e a parte nova não é boa.

Mas Richard Sutton, um dos fundadores do campo de aprendizado por reforço, autor do livro-texto "Reinforcement Learning" e ganhador do Prêmio Turing, voltou esse piada para toda a IA generativa.

Ele disse: Esta avaliação se aplica à maioria da IA que conhecemos hoje.

IA: O bom não é novo, o novo não é bom

A afirmação central de Sutton é extremamente simples, tão simples que é cruel.

A IA generativa é, por natureza, aprendizado supervisionado.

A lógica do aprendizado supervisionado é: mostrar ao modelo muitas amostras criadas por humanos, para que ele aprenda a imitar.

Quanto mais parecido for a imitação, maior será a pontuação.

A questão chegou.

Quando o modelo gera conteúdo estritamente com base nos dados de treinamento, a qualidade da saída é alta, pois está recriando coisas boas já validadas pelos humanos. Mas isso não é inovador. É apenas uma reorganização e reapresentação de coisas que os humanos já conhecem.

Quando o modelo tenta se afastar dos dados de treinamento e gerar conteúdo verdadeiramente novo, a qualidade colapsa. Porque ele não possui nenhum mecanismo interno para avaliar se “esse novo algo é bom ou não”. Ele apenas gera, não avalia.

Essa é a contradição estrutural:

Novidade e qualidade são os extremos de uma gangorra no contexto do aprendizado supervisionado puro.

Você aperta um lado e o outro levanta.

Não é um problema de engenharia. Não pode ser resolvido apenas acumulando dados, aumentando o modelo ou adicionando mais GPUs.

Sutton fez uma analogia extremamente contundente: "ilusões" — o defeito mais criticado dos grandes modelos — são, essencialmente, um subproduto da tentativa do modelo de ser "inovador".

Odiamos ilusões, o que prova exatamente uma coisa: na verdade, não queremos novidade alguma. Queremos apenas imitações de alta qualidade.

Bom não é inovador; inovador não é bom.

A crítica venenosa do revisor da piada descreveu com precisão as limitações internas de toda a IA generativa.

A verdadeira "descoberta" exige um conjunto de três itens

Sutton, a partir dos primeiros princípios, decompôs a “fórmula trinitária” da criatividade:

A verdadeira descoberta (Discovery) = variação (Variation) + avaliação (Evaluation) + retenção seletiva (Retention).

Qualquer verdadeira criatividade e descoberta exigem três etapas, todas indispensáveis:

1. A variação gera possibilidades diversificadas. Pode ser aleatória ou baseada em conhecimento pré-existente, mas deve haver incerteza real — caso contrário, não se chama exploração, chama-se consulta de tabela.

2. Avaliação: Determinar quais variações são valiosas. Isso exige um objetivo claro ou um critério capaz de identificar o que é "bom" ou "ruim".

3. Retenção seletiva: mantenha as mutações valiosas para que influenciem ações e aprendizados futuros.

Esses três passos não são uma invenção de Sutton. É a lógica da seleção natural, a lógica do método científico, a lógica da aprendizagem humana.

Teoria da evolução: mutações genéticas aleatórias (variação) → seleção ambiental (avaliação) → sobrevivência do mais apto (retenção seletiva).

Método científico: formular hipótese (variação) → experimento de verificação (avaliação) → publicação de artigo (retenção seletiva).

Aprendizado humano: tentar diferentes abordagens (variação) → verificar acertos e erros (avaliação) → lembrar dos métodos eficazes (retenção seletiva).

Atualmente, a IA generativa completou apenas o primeiro passo da trindade: quase nenhuma avaliação, muito menos retenção seletiva,

É como um arqueiro que atira flechas aleatoriamente, mas com os olhos vendados, e após disparar, não olha para o alvo nem ajusta sua postura com base no resultado.

Você pede que atire dez mil flechas; às vezes, uma acerta o alvo, mas ela nunca sabe por que acertou.

Então, os cientistas ainda têm utilidade?

Aqui você pode começar a se sentir um pouco ansioso: se, no futuro, a IA realmente conseguir realizar autonomamente o trio de “descoberta”, os cientistas não ficarão desempregados?

A própria resposta de Sutton foi: não pode ser substituído, mas o papel precisa ser totalmente transformado.

Ele disse em seu discurso que, mesmo um AI capaz de provar teoremas matemáticos independentemente ainda precisa que humanos lhe digam quais problemas são importantes.

Isso não é modéstia, mas sim o limite real do conhecimento.

O matemático Shiqian Ma, especialista em otimização da Universidade Rice, disse que usou o ChatGPT para provar um problema de convergência de algoritmo que ele estudou durante seis anos.

Há uma frase no resumo:

Prova gerada pelo ChatGPT 5.5, verificada pelo autor.

Este algoritmo é chamado de BDRS, sigla para Bregman Douglas-Rachford Splitting, e é usado para resolver problemas de transporte ótimo (Optimal Transport).

Título do artigo: Método de Divisão Bregman Douglas-Rachford

Endereço do preprint:

Isso era algo que ele e seus coautores projetaram sozinhos, e o que o preocupou por seis anos foi a prova de convergência — ou seja, a explicação matemática mais rigorosa de “por que isso está correto”.

A plataforma de preprints arXiv ainda está mantendo a submissão em espera após o recebimento.

Ele especulou que a razão é que o resumo contém as três palavras "ChatGPT", e a plataforma não sabe como lidar com esse tipo de artigo.

Mas os seres humanos podem ser substituídos pela IA?

Sua resposta foi: não. Ele disse francamente:

Acho que a IA não consegue criar criativamente esse algoritmo e afirmar: "Este é um algoritmo eficiente para transporte ótimo; agora vamos tentar provar sua convergência".

Sem orientação humana, a IA não sabe qual problema resolver.

Esta frase corresponde exatamente a Sutton: o problema em si deve ser definido pelo ser humano.

Ele levou seis anos para "fazer a pergunta correta":

Quais perguntas fazer realmente exige que você tenha um entendimento muito profundo sobre o assunto.

Neste caso, tenho estudado este problema por seis anos, portanto conheço bem os desafios envolvidos.

Esses seis anos não foram desperdiçados, são uma condição prévia.

Foi exatamente nesses seis anos que ele soube onde estava o problema na prova, por que todos os caminhos anteriores falharam e qual direção fornecida pelo ChatGPT valia a pena seguir, e qual era uma ilusão.

E não foi uma única pergunta, mas cinco meses. Esse é o ponto mais mal interpretado, e ele próprio já se enganou:

De janeiro a maio, exatamente cinco meses, inúmeras conversas, cada prompt se aproximando da prova.

Ele resumiu de forma extremamente clara:

A essência da pesquisa não mudou: ainda é tentativa e erro. O que mudou é a velocidade de cada tentativa — antes, levaria semanas para validar uma direção; agora, em minutos já se sabe se esse caminho é viável.

Mas a contribuição da IA é indelével:

E, em seguida, o final é diretamente divino:

Voltando ao meu artigo sobre a convergência dos BDRS, tenho uma boa certeza de que a prova está correta.

Mas se você encontrar qualquer erro, a responsabilidade é toda minha — não culpe o ChatGPT, ele tem apenas 3,5 anos.

A beleza dessa frase está na dualidade: é uma declaração sincera de responsabilidade e também uma metáfora precisa.

“3,5 anos” descreve a situação real da IA neste momento: capacidade impressionante, mas julgamento ainda imaturo.

After all, humans have never expected a 3.5-year-old child to make any contribution.

Embora você não possa entregar o direito final de assinatura da prova à IA, também não pode fingir que a IA não fez nenhuma contribuição.

É por isso que as verdadeiras descobertas científicas não desaparecem nas mãos dos seres humanos.

Pelo contrário, ele filtrará os humanos de forma mais cruel: apenas aqueles que souberem fazer boas perguntas merecerão ter IA poderosa.

No futuro, cientistas que não utilizam IA podem parecer tão obsoletos quanto astrônomos que não usam computadores.

Por fim, reflitamos juntos sobre as palavras declarativas de Sutton:

Se quisermos aproveitar plenamente o poder dos cientistas de IA, devemos compartilhar com eles nossos objetivos, permitindo que criem, avaliem e descubram, participando integralmente da realização desses objetivos.

Vamos ousar mais! Vamos automatizar completamente a criatividade e a descoberta!

ChatGPT resolve problema matemático de 6 anos, vencedor do Prêmio Turing diz que 'é muito cedo para comemorar'

A verdadeira "descoberta" exige um conjunto de três itens

Então, os cientistas ainda têm utilidade?