Message AIMPACT, le 27 avril (UTC+8), selon les données surveillées par Beating, l'équipe PAI d'Alibaba a publié et ouvert le modèle de langage d'agent de petite taille AgenticQwen, conçu spécifiquement pour l'appel d'outils industriels (disponible en deux versions : 8B et 30B-A3B). Ce modèle a été formé grâce à un cadre innovant d'apprentissage par renforcement appelé « double roue de données », permettant de réduire considérablement les coûts d'inférence tout en atteignant des capacités d'agent proches de celles des modèles de mille milliards de paramètres. Le mécanisme central réside dans sa méthode d'entraînement à « double roue de données ». Les données synthétiques traditionnelles tendent à devenir homogènes, limitant ainsi les performances du modèle ; AgenticQwen introduit deux roues : la roue d'inférence génère automatiquement des variantes plus difficiles à partir des erreurs du modèle ; la roue d'agent étend les flux de travail linéaires simples (comme une seule réservation de billet) en arbres de comportement multi-branches incluant des contraintes, des refus et des conditions d'adversité, simulant ainsi des scénarios de décision complexes réels. Les évaluations montrent que AgenticQwen-8B obtient une moyenne de 47,4 sur des benchmarks d'environnements d'outils réels (tels que TAU-2 et BFCL-V4), loin devant Qwen3-8B (23,8) et proche de Qwen3-235B (52,0). AgenticQwen-30B-A3B (n'activant que 3 milliards de paramètres) atteint un score de 50,2. Ce modèle a déjà été déployé dans des systèmes de production internes similaires à Manus, réduisant considérablement l'écart avec les modèles de 235 milliards de paramètres (temps d'inférence bout en bout plus court). Toutefois, l'article reconnaît que, limité par une longueur de contexte natif de 40K, le petit modèle présente encore des limites dans les tâches de recherche approfondie. (Source : BlockBeats)
Aliyun PAI open source le petit modèle AgenticQwen avec un entraînement à double volant de données
KuCoinFlashPartager






Des nouvelles sur la chaîne ont été publiées le 27 avril (UTC+8) : l'équipe PAI d'Alibaba a open-sourcé AgenticQwen, un petit modèle dédié à l'appel d'outils industriels. Construit sur MetaEra, les versions 8B et 30B-A3B utilisent un cadre à double flywheel de données pour réduire les coûts d'inférence. AgenticQwen-8B a obtenu 47,4 sur TAU-2 et BFCL-V4, surpassant Qwen3-8B (23,8) et s'approchant de Qwen3-235B (52,0). AgenticQwen-30B-A3B (3 Go de paramètres actifs) a obtenu 50,2. Le modèle est désormais intégré dans des systèmes de production, offrant une vitesse d'inférence équivalente à celle des modèles 235B. Le suivi des données d'inflation et d'autres tâches du monde réel sont désormais plus efficaces avec cette publication.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.