Aliyun PAI открывает исходный код небольшой модели AgenticQwen с обучением на двойной системе данных

iconKuCoinFlash
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Новость в блокчейне появилась 27 апреля (UTC+8), когда команда PAI Alibaba открыла исходный код AgenticQwen — небольшую модель для вызова промышленных инструментов. Построенная на MetaEra, версии 8B и 30B-A3B используют двухступенчатую систему обратной связи для снижения затрат на вывод. AgenticQwen-8B показал результат 47,4 по шкалам TAU-2 и BFCL-V4, превзойдя Qwen3-8B (23,8) и приблизившись к Qwen3-235B (52,0). AgenticQwen-30B-A3B (3 млрд активных параметров) показал результат 50,2. Модель уже внедрена в производственные системы и достигла скорости вывода, сопоставимой с моделями 235B. Отслеживание данных по инфляции и другие реальные задачи теперь стали более эффективными благодаря этому выпуску.

Сообщение AIMPACT, 27 апреля (UTC+8): по данным мониторинга Beating, команда PAI Alibaba выпустила и открыла исходный код небольшой языковой модели агента, специально разработанной для вызова промышленных инструментов — AgenticQwen (включая две версии: 8B и 30B-A3B). Эта серия моделей была обучена с использованием инновационной системы усиленного обучения «двойной цикл данных», что позволило значительно снизить стоимость вывода и достичь способностей агента, близких к моделям с триллионами параметров. Основной механизм заключается в методе обучения «двойной цикл данных». Традиционные синтетические данные часто приводят к гомогенизации, из-за чего производительность модели достигает предела. AgenticQwen вводит два цикла: цикл вывода автоматически генерирует более сложные варианты на основе ошибок модели; цикл агента расширяет простые линейные рабочие процессы (например, бронирование билетов) в многоветвевые деревья поведения с учетом ограничений, отказов и противодействующих условий, имитируя реальные сложные сценарии принятия решений. Тестирование показало, что AgenticQwen-8B в среднем набрал 47.4 балла на реальных базах инструментов (например, TAU-2 и BFCL-V4), значительно превзойдя базовую версию Qwen3-8B (23.8) и приблизившись к Qwen3-235B (52.0). AgenticQwen-30B-A3B (активируются только 3B параметров) показал результат 50.2. В настоящее время модель уже развернута во внутренних производственных системах, аналогичных Manus, значительно сократив разрыв с моделями размером 235B (время вывода в режиме end-to-end короче). Однако в статье признается, что из-за ограничения исходной длины контекста в 40K малые модели все еще имеют ограничения в задачах глубокого поиска. (Источник: BlockBeats)

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.