Aliyun PAI、デュアルデータフライホイールトレーニングを採用したAgenticQwen小型モデルをオープンソース化

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
4月27日(UTC+8)、アリババのPAIチームが、産業用ツール呼び出し用の小型モデル「AgenticQwen」をオープンソース化しました。MetaEra上に構築されたこのモデルの8Bおよび30B-A3Bバージョンは、デュアルデータフライホイールフレームワークを採用し、推論コストを削減しています。AgenticQwen-8BはTAU-2およびBFCL-V4で47.4のスコアを記録し、Qwen3-8B(23.8)を上回り、Qwen3-235B(52.0)に近づいています。AgenticQwen-30B-A3B(アクティブパラメータ3B)は50.2のスコアを達成しました。このモデルはすでに生産システムで稼働しており、235Bモデルと同等の推論速度を実現しています。今回のリリースにより、インフレーションデータの追跡を含むさまざまな実世界タスクの効率が向上しました。

AIMPACT メッセージ:4月27日(UTC+8)、Beating監視によると、アリババPAIチームは、産業レベルのツール呼び出し用に設計された小型エージェント言語モデル「AgenticQwen」(8Bおよび30B-A3Bの2バージョン)をリリースし、オープンソース化しました。このモデルシリーズは、革新的な「二重データフライホイール」強化学習フレームワークで訓練され、推論コストを大幅に削減しながら、千億パラメータ規模の大規模モデルに匹敵するエージェント能力を実現しています。その核心メカニズムは「二重データフライホイール」訓練法にあります。従来の合成データは同質化によりモデル性能が頭打ちになる傾向がありますが、AgenticQwenはこれに対し、二つのフライホイールを導入しました。推論フライホイールは、モデルの誤答からより難易度の高いバリエーションを自動生成し、エージェントフライホイールはモデルの実行トラジェクトリに基づいて、単純な線形ワークフロー(例:チケット予約プロセス)を制約、拒否、対抗条件を含むマルチブランチ行動ツリーに拡張し、現実の複雑な意思決定シナリオを模倣します。評価結果によると、AgenticQwen-8Bは実際のツール環境ベンチマーク(TAU-2およびBFCL-V4など)で平均47.4点を記録し、基礎版Qwen3-8B(23.8点)を大幅に上回り、Qwen3-235B(52.0点)に迫っています。AgenticQwen-30B-A3B(3Bパラメータのみ活性化)は50.2点を達成しました。現在、このモデルはManusと類似する内部生産システムに導入されており、235B大規模モデルとの差を大幅に縮小(エンドツーエンド推論時間が短縮)していますが、論文では元のネイティブコンテキスト長が40Kに制限されているため、深層検索タスクにおいて小規模モデルに依然として限界があると認められています。(出典:BlockBeats)

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。