Aliyun PAI lanza como código abierto el modelo pequeño AgenticQwen con entrenamiento de doble volante de datos

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Las noticias on-chain se publicaron el 27 de abril (UTC+8) cuando el equipo PAI de Alibaba lanzó AgenticQwen como código abierto, un modelo pequeño para la llamada de herramientas industriales. Construido sobre MetaEra, las versiones de 8B y 30B-A3B utilizan un marco de doble volante de datos para reducir los costos de inferencia. AgenticQwen-8B obtuvo 47.4 en TAU-2 y BFCL-V4, superando a Qwen3-8B (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (3B parámetros activos) obtuvo 50.2. El modelo ya está en sistemas de producción, igualando la velocidad de inferencia de los modelos de 235B. El seguimiento de datos de inflación y otras tareas del mundo real son ahora más eficientes con este lanzamiento.

Mensaje de AIMPACT, 27 de abril (UTC+8): según el monitoreo de Beating, el equipo de PAI de Alibaba ha lanzado y abierto el modelo de lenguaje de agente pequeño diseñado para llamadas de herramientas industriales, AgenticQwen (disponible en dos versiones: 8B y 30B-A3B). Este conjunto de modelos se entrenó mediante un innovador marco de aprendizaje por refuerzo denominado «doble volante de datos», logrando capacidades de agente cercanas a las de modelos de mil millones de parámetros, al tiempo que reduce significativamente el costo de inferencia. El mecanismo central radica en su método de entrenamiento con «doble volante de datos». Los datos sintéticos tradicionales tienden a homogeneizarse, lo que lleva a un techo en el rendimiento del modelo; AgenticQwen introduce dos volantes: el volante de inferencia genera automáticamente variantes más difíciles a partir de los errores del modelo; el volante de agente expande flujos de trabajo lineales simples (como un solo proceso de reserva) en árboles de comportamiento multirrama que incluyen restricciones, rechazos y condiciones adversas, simulando escenarios de toma de decisiones complejos reales. Las evaluaciones muestran que AgenticQwen-8B obtuvo una puntuación promedio de 47.4 en benchmarks de entornos reales de herramientas (como TAU-2 y BFCL-V4), superando ampliamente a Qwen3-8B básico (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (con solo 3B parámetros activados) alcanzó una puntuación de 50.2. Actualmente, este modelo ya se ha implementado en sistemas de producción internos similares a Manus, reduciendo significativamente la brecha con los modelos de 235B (con tiempos de inferencia extremo a extremo más cortos), aunque el artículo reconoce que, limitado por una longitud de contexto nativa de 40K, los modelos pequeños aún presentan limitaciones en tareas de búsqueda profunda. (Fuente: BlockBeats)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.