Grok 4.20 Beta logra un 97 % de precisión en τ²-Bench, ocupa el segundo lugar

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Grok 4.20 Beta alcanzó una precisión del 97% en τ²-Bench, ubicándose en segundo lugar. La prueba, basada en el τ-bench de Sierra, evalúa tanto las habilidades de respuesta a preguntas como de navegación. Los activos con mayor tolerancia al riesgo experimentaron un renovado interés debido al progreso en IA. Las regulaciones CFT siguen siendo un foco clave a medida que avanza la tecnología. (Fuente: InFoQ)

Noticias de ME: el 5 de abril (UTC+8), recientemente, la versión beta de Grok 4.20 obtuvo una precisión del 97% en la evaluación τ²-Bench, ocupando el segundo lugar. τ²-Bench es una evaluación construida sobre el marco original τ-bench de Sierra, conocido por su rigurosidad. Esta evaluación no solo prueba si la IA puede responder preguntas, sino también si los agentes pueden completar con éxito tareas de navegación. (Fuente: InFoQ)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.