source avatarEdu3Labs

Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy

El problema más grande sin resolver en IA quizás no sea la alineación ni las alucinaciones. Es la evaluación. ⚠️ Aún no tenemos formas confiables de medir si los modelos realmente se están volviendo más inteligentes — o solo están mejorando en los benchmarks. La Ley de Goodhart: “Cuando una medida se convierte en un objetivo, deja de ser una buena medida.” Los laboratorios optimizan para: ↳ MMLU ↳ HumanEval ↳ MATH Los modelos los superan. 🏆 Pero la inteligencia del mundo real es más caótica: ↳ Razonamiento de largo plazo ↳ Tareas abiertas ↳ Entornos no vistos ↳ Interacción real con humanos Podríamos estar evaluándonos a nosotros mismos hasta crear una falsa sensación de progreso. 🧠 #AI #Edu3Labs

No.0 picture
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.