source avatarEdu3Labs

Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy

O maior problema não resolvido em IA pode não ser o alinhamento ou as alucinações. É a avaliação. ⚠️ Ainda não temos maneiras confiáveis de medir se os modelos estão realmente ficando mais inteligentes — ou apenas ficando melhores em benchmarks. Lei de Goodhart: “Quando uma medida se torna um alvo, deixa de ser uma boa medida.” Os laboratórios otimizam para: ↳ MMLU ↳ HumanEval ↳ MATH Os modelos os dominam. 🏆 Mas a inteligência do mundo real é mais complexa: ↳ Raciocínio de longo prazo ↳ Tarefas abertas ↳ Ambientes não vistos ↳ Interação real com humanos Talvez estejamos benchmarkando a nós mesmos para uma falsa sensação de progresso. 🧠 #AI #Edu3Labs

No.0 picture
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.