GLM-5.1 ocupa o primeiro lugar entre modelos de código aberto no benchmark Artificial Analysis Coding Agent

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A empresa de análise on-chain Artificial Analysis lançou o Índice Coding Agent em 13 de maio (UTC+8), avaliando modelos no SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. O GLM-5.1 (em execução no Claude Code) liderou os modelos de código aberto, enquanto o Opus 4.7 (Cursor CLI) liderou globalmente. O benchmark testa codificação no mundo real, tarefas de terminal e perguntas e respostas técnicas. O GLM-5.1 demonstra o melhor desempenho entre modelos de código aberto, com o interesse aberto em modelos nacionais em ascensão.

Mensagem AIMPACT, 13 de maio (UTC+8): A renomada instituição de avaliação global Artificial Analysis lançou o novo benchmark Coding Agent — Artificial Analysis Coding Agent Index — para medir o desempenho de combinações de Agent harnesses e modelos nos três benchmarks principais: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. Nesta avaliação, o modelo proprietário Opus 4.7 (executado no Cursor CLI) obteve o primeiro lugar global, enquanto o GLM-5.1 (executado no Claude Code) alcançou o primeiro lugar entre modelos abertos. O benchmark cobre tarefas de programação reais, tarefas agênticas em terminal e perguntas e respostas técnicas, visando refletir o desempenho real em cenários de Agentes de programação. O artigo afirma que o GLM-5.1 representa a capacidade SOTA dos grandes modelos nacionais nesse cenário. (Fonte: InFoQ)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.