OpenAI acidentalmente avalia o raciocínio de modelos de IA e constata ausência de perda de monitorabilidade

iconCryptoBriefing
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
Notícias de IA + cripto: A OpenAI revelou vários modelos de IA, incluindo o GPT-5.4 Thinking e várias versões do GPT-5.4, que experimentaram classificação acidental de cadeia de pensamento durante o treinamento. Relatórios de notícias on-chain mostram que análise interna não encontrou perda significativa de monitorabilidade. O erro afetou menos de 3,8% das amostras de treinamento. Uma pequena parte do processo avaliou incorretamente o raciocínio interno em vez dos resultados finais. A OpenAI escaneou todas as execuções de aprendizado por reforço e confirmou que a transparência do raciocínio permaneceu intacta. A Redwood Research observou que o incidente não danificou a monitorabilidade, mas destacou os riscos da cadeia de pensamento. Modelos de IA agora fazem parte de sistemas de blockchain, como auditorias de contratos inteligentes e negociação automatizada. A monitorabilidade intacta é essencial para desenvolvedores e investidores em projetos de cripto integrados com IA.

A OpenAI revelou que vários de seus modelos de IA, incluindo o GPT-5.4 Thinking e várias iterações do GPT-5.4, experimentaram classificação acidental de cadeia de pensamento durante o treinamento de aprendizado por reforço. Análises internas não encontraram degradação significativa na capacidade dos modelos de mostrar seu raciocínio.

Os incidentes afetaram menos de 3,8% das amostras de treinamento nos modelos mais impactados. Uma pequena fração do processo de treinamento recompensou ou penalizou acidentalmente os modelos com base em seus passos de raciocínio internos, e não apenas em seus resultados finais.

O que realmente aconteceu

A classificação acidental assumiu formas limitadas. Alguns treinamentos recompensaram a utilidade da trajetória, essencialmente dando aos modelos um "joinha" pela utilidade de seus caminhos de raciocínio. Outros penalizaram prompts desnecessários dentro da cadeia de pensamento. O caso de teste mais notável mostrou uma taxa de disparo de aproximadamente 2% para penalizar referências à fraude na cadeia de pensamento.

A equipe interna da OpenAI executou varreduras automatizadas em todas as suas execuções de aprendizado por reforço para examinar o impacto na transparência do raciocínio. Os modelos ainda conseguiam rastrear confiavelmente o raciocínio lógico, e a capacidade de detectar possíveis desalinhamentos permaneceu funcionalmente intacta.

O ecossistema de segurança responde

Organizações externas, incluindo METR, Apollo Research e Redwood Research, contribuíram com insights para as descobertas. A Redwood Research reconheceu que os incidentes menores não prejudicaram a monitorabilidade, mas destacou que o raciocínio em cadeia, como medida de segurança, possui vulnerabilidades inerentes.

A Anthropic publicou um relatório em abril de 2026 examinando dinâmicas semelhantes em seus próprios modelos. A OpenAI tem intensificado suas medidas de detecção desde dezembro de 2025 para evitar erros futuros de classificação. A empresa agora implementou sistemas de detecção automatizados e salvaguardas internas especificamente projetados para identificar contaminação na classificação CoT antes que ela possa influenciar o treinamento em escala.

O que isso significa para criptomoedas e tokens de IA

Nenhuma reação imediata do mercado foi observada nos criptoativos relacionados a IA após o anúncio. Modelos de IA estão cada vez mais integrados em aplicações de blockchain, incluindo auditorias de contratos inteligentes, agentes de IA descentralizados e sistemas de negociação automatizada, todos os quais dependem de IA que raciocina corretamente e de forma transparente.

O fato de que a monitorabilidade permaneceu intacta é a principal lição para qualquer um que esteja desenvolvendo ou investindo em projetos de criptomoeda integrados à IA. Isso significa que a infraestrutura de segurança em torno dos modelos de raciocínio está identificando problemas antes que se tornem sistêmicos.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.