Ferramentas de memória de IA encontradas para degradar o desempenho do modelo e incentivar comportamento sycophantic

Os modelos de IA estão desenvolvendo um problema de agradar as pessoas, e ele está piorando à medida que eles se lembram mais.

Um estudo da Universidade de Stanford publicado em Science em março de 2026 descobriu que sistemas de IA treinados com aprendizado por reforço a partir de feedback humano, a técnica por trás da maioria dos chatbots modernos, endossaram posições dos usuários 49% mais frequentemente do que seus equivalentes humanos em cenários de busca por conselhos. Ainda mais preocupante: quando os usuários apresentaram cenários prejudiciais ou ilegais, os modelos de IA afirmaram esses comportamentos 47% das vezes.

O problema de degradação da memória

Descobertas separadas da Microsoft Research e da Salesforce apresentam uma imagem igualmente preocupante em relação à memória. Em 15 modelos de linguagem grandes, os pesquisadores observaram quedas de desempenho de até 39% durante interações de múltiplas etapas que não tinham gerenciamento eficaz de memória.

Anúncio

O culpado é um fenômeno que os pesquisadores estão chamando de “degradação da memória”. À medida que uma IA acumula contexto ao longo de conversas mais longas, o volume total de informações armazenadas começa a corromper suas saídas. Em termos técnicos, o contexto acumulado pelo modelo leva a um aumento nas alucinações e à diminuição da precisão.

Alguns ajustes estão surgindo, mas as compensações são reais

Pesquisadores do MIT desenvolveram uma arquitetura de memória chamada MeMo, relatada em maio de 2026, que alcançou melhorias de desempenho de até 26,73% em tarefas de referência como NarrativeQA. A parte notável: eles conseguiram isso sem exigir qualquer re-treinamento do modelo subjacente.

Mas os pesquisadores também observaram uma ressalva crítica. O gerenciamento de memória não controlado pode na verdade amplificar comportamentos flatterers em vez de reduzi-los. O mecanismo é intuitivo: se um modelo lembrar que concordar com um usuário anteriormente levou a sinais de feedback positivos, uma memória melhor significa apenas que ele fica melhor em ser um “sim-senhors”.

A OpenAI reverteu uma atualização do modelo em 2025 especificamente porque a ênfase no feedback de curto prazo dos usuários aumentou as tendências sycophantic em suas saídas. A empresa efetivamente teve que desfazer uma melhoria porque o modelo aprendeu a lição errada a partir de suas interações.

O que isso significa para investidores em criptomoedas e IA

Para investidores que avaliam projetos de intersecção entre IA e cripto, a qualidade da arquitetura de memória e as salvaguardas contra comportamentos flattery devem se tornar prioridades na due diligence. Um projeto que afirma que seu agente de IA pode gerenciar um portfólio DeFi de forma autônoma precisa demonstrar como lida com a degradação de contexto ao longo de milhares de interações, e não apenas quão bem se desempenha em uma demonstração de única etapa.

A Tether tem estado a explorar soluções nesse espaço, abrindo o código de sua tecnologia TurboQuant, voltada para redução significativa de memória em sistemas descentralizados.