AIMPACT 消息,4 月 27 日(UTC+8),據動察 Beating 監測,阿里 PAI 團隊發布並開源了專為工業級工具調用設計的小型智能體語言模型 AgenticQwen(包含 8B 和 30B-A3B 兩個版本)。該系列模型透過創新的「雙數據飛輪」強化學習框架訓練,在大幅降低推理成本的同時,實現了接近千億參數大模型的智能體(Agent)能力。核心機制在於其「雙數據飛輪」訓練法。傳統的合成數據容易同質化導致模型性能觸頂,AgenticQwen 此引入了兩個飛輪:推理飛輪會從模型的錯題中自动生成更難的變體;智能體飛輪則根據模型的執行軌跡,將簡單的線性工作流(如單一的訂票流程)擴展為包含約束、拒絕和對抗條件的多分支行為樹,模擬真實的複雜決策場景。評測顯示,AgenticQwen-8B 在真實工具環境基準(如 TAU-2 和 BFCL-V4)中平均得分 47.4,遠超基礎版 Qwen3-8B(23.8),逼近 Qwen3-235B(52.0)。AgenticQwen-30B-A3B(僅激活 3B 參數)得分達 50.2。目前該模型已在內部類似 Manus 的生產系統中部署,大幅縮小了與 235B 大模型的差距(端到端推理時間更短),不過論文也坦言,受限於 40K 的原生上下文長度,小模型在深層搜索任務上仍有局限。(來源:BlockBeats)
阿里雲 PAI 開源 AgenticQwen 小型模型,採用雙數據飛輪訓練
KuCoinFlash分享






於4月27日(UTC+8),阿里巴巴PAI團隊開源了AgenticQwen,這是一款用於工業工具調用的小型模型。該模型基於MetaEra構建,8B和30B-A3B版本採用雙數據飛輪架構,以降低推理成本。AgenticQwen-8B在TAU-2和BFCL-V4上的得分為47.4,優於Qwen3-8B(23.8),並接近Qwen3-235B(52.0)。AgenticQwen-30B-A3B(3B個活動參數)的得分為50.2。該模型目前已投入生產系統,推理速度與235B模型相當。此版本的發布使通脹數據追蹤及其他實際應用任務變得更高效。
來源:顯示原文
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。