Aliyun PAI відкриває джерела невеликої моделі AgenticQwen з навчанням за допомогою подвійного механізму даних

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Новина з ланцюга з’явилася 27 квітня (UTC+8), коли команда PAI Alibaba відкрила код AgenticQwen — невелику модель для виклику промислових інструментів. Створена на базі MetaEra, версії 8B і 30B-A3B використовують двоїсту систему «літального колеса» даних для зменшення витрат на висновки. AgenticQwen-8B набрав 47,4 бала за TAU-2 та BFCL-V4, перевершивши Qwen3-8B (23,8) і підійшовши до Qwen3-235B (52,0). AgenticQwen-30B-A3B (3 млрд активних параметрів) набрав 50,2 бала. Модель вже впроваджена в продуктивні системи, досягаючи швидкості висновків, що дорівнює моделям 235B. Відстеження даних про інфляцію та інші реальні завдання тепер ефективніші завдяки цьому випуску.

Повідомлення AIMPACT, 27 квітня (UTC+8): За даними моніторингу Beating, команда Alibaba PAI випустила та відкрила код невеликої мовної моделі агента AgenticQwen, розробленої для виклику промислових інструментів (доступні дві версії: 8B та 30B-A3B). Ця серія моделей навчалася за допомогою інноваційної рамки підсиленого навчання «подвійний інформаційний цикл», що дозволило значно знизити витрати на висновки, зберігаючи здатності агента, близькі до великих моделей з мільярдами параметрів. Основний механізм полягає у «подвійному інформаційному циклі» навчання. Традиційні синтетичні дані часто стають однорідними, що призводить до досягнення межі продуктивності моделі. AgenticQwen впроваджує два цикли: цикл висновків автоматично генерує складніші варіанти на основі помилок моделі; цикл агента розширює прості лінійні робочі процеси (наприклад, бронювання квитків) у багатогалузеве дерево поведінки з обмеженнями, відмовами та протидіючими умовами, імітуючи реальні складні сценарії прийняття рішень. Оцінки показали, що AgenticQwen-8B набрав у середньому 47,4 бала на реальних інструментальних тестах (наприклад, TAU-2 та BFCL-V4), значно перевищивши базову версію Qwen3-8B (23,8) і підійшовши до Qwen3-235B (52,0). AgenticQwen-30B-A3B (активовано лише 3B параметрів) показав результат 50,2. Поточна модель вже розгорнута у внутрішніх виробничих системах, подібних до Manus, значно скоротивши розрив з великою моделлю 235B (менший час кінцевого висновку). Однак у статті зазначено, що через обмеження вихідної довжини контексту 40K, маленькі моделі все ще мають обмеження у завданнях глибокого пошуку. (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.