El benchmark CUSP revela que los modelos de IA carecen de capacidad de pronóstico científico
KuCoinFlashCompartir






Las plataformas de noticias de IA y cripto están rastreando un nuevo indicador llamado CUSP, desarrollado por Stanford, Oxford y el Allen Institute for AI. La prueba muestra que los mejores modelos, como GPT-5.4 y Claude Sonnet 4.5, tienen dificultades para predecir el progreso científico. La precisión es cercana al azar y las estimaciones de tiempo están desfasadas por meses. El conjunto de datos CUSP incluye 4.760 hitos y 17.429 tareas. Los nuevos listados de tokens a menudo dependen de modelos predictivos, pero este estudio plantea dudas sobre su fiabilidad.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.