Сообщение AIMPACT, 13 мая (UTC+8): мировой авторитетный оценочный институт Artificial Analysis представил новый индекс Coding Agent — Artificial Analysis Coding Agent Index, предназначенный для оценки производительности комбинаций Agent harnesses и моделей на трех ведущих тестовых наборах: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. В этом тестировании закрытая модель Opus 4.7 (работающая на Cursor CLI) заняла первое место в мире, а открытая модель GLM-5.1 (работающая на Claude Code) заняла первое место среди открытых моделей. Данный индекс охватывает реальные задачи программирования, агентные задачи в терминале и технические вопросы, направленные на отражение реальной производительности программных агентов в практических сценариях. В статье отмечается, что GLM-5.1 демонстрирует передовые возможности китайских крупных моделей в данной области. (Источник: InFoQ)
GLM-5.1 занимает первое место среди открытых моделей в бенчмарке Artificial Analysis Coding Agent
KuCoinFlashПоделиться






Компания по анализу в блокчейне Artificial Analysis выпустила Индекс кодирующих агентов 13 мая (UTC+8), оценив модели на наборах SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. GLM-5.1 (работающий на Claude Code) занял первое место среди открытых моделей, а Opus 4.7 (Cursor CLI) — общее первое место. Бенчмарк тестирует реальные задачи программирования, работы в терминале и технические вопросы и ответы. GLM-5.1 демонстрирует лучшую производительность среди открытых моделей, при этом интерес к отечественным моделям растет.
Источник:Показать оригинал
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации.
Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.