Mensaje de AIMPACT, 13 de mayo (UTC+8): La reconocida institución de evaluación global Artificial Analysis lanzó el nuevo índice de Agentes de Codificación: Artificial Analysis Coding Agent Index, diseñado para medir el rendimiento de combinaciones de Agentes y modelos en tres benchmarks principales: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 y SWE-Atlas-QnA. En esta evaluación, el modelo propietario Opus 4.7 (ejecutado en Cursor CLI) obtuvo el primer lugar mundial, mientras que GLM-5.1 (ejecutado en Claude Code) logró el primer lugar entre los modelos de código abierto. Este índice cubre tareas de programación reales, tareas agentes en terminal y preguntas técnicas, con el objetivo de reflejar el rendimiento real en escenarios de agentes de programación. Se considera que GLM-5.1 representa la capacidad SOTA de los grandes modelos nacionales en este contexto. (Fuente: InFoQ)
GLM-5.1 ocupa el primer lugar entre los modelos de código abierto en el benchmark de agente de codificación de análisis artificial
KuCoinFlashCompartir






La firma de análisis on-chain Artificial Analysis lanzó el Índice de Agentes de Codificación el 13 de mayo (UTC+8), evaluando modelos en SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 y SWE-Atlas-QnA. GLM-5.1 (que funciona en Claude Code) lideró los modelos de código abierto, mientras que Opus 4.7 (Cursor CLI) lideró en general. La prueba evalúa codificación en el mundo real, tareas de terminal y preguntas y respuestas técnicas. GLM-5.1 muestra el mejor rendimiento entre los modelos de código abierto, con un interés creciente en modelos nacionales.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.