Aliyun PAI lança de código aberto o pequeno modelo AgenticQwen com treinamento em duplo flywheel de dados

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
Notícias on-chain foram divulgadas em 27 de abril (UTC+8), quando a equipe PAI da Alibaba lançou o AgenticQwen como código aberto, um modelo pequeno para chamada de ferramentas industriais. Desenvolvido no MetaEra, as versões de 8B e 30B-A3B utilizam um framework de dupla roda de dados para reduzir os custos de inferência. O AgenticQwen-8B obteve 47,4 no TAU-2 e BFCL-V4, superando o Qwen3-8B (23,8) e aproximando-se do Qwen3-235B (52,0). O AgenticQwen-30B-A3B (3B parâmetros ativos) obteve 50,2. O modelo já está em sistemas de produção, igualando em velocidade de inferência modelos de 235B. A rastreamento de dados de inflação e outras tarefas do mundo real agora são mais eficientes com este lançamento.

Mensagem AIMPACT, 27 de abril (UTC+8), segundo monitoramento da Beating, a equipe do PAI da Alibaba lançou e abriu o código do modelo de linguagem agente pequeno projetado para chamadas de ferramentas industriais, chamado AgenticQwen (disponível nas versões 8B e 30B-A3B). Essa série de modelos foi treinada por meio de um inovador framework de aprendizado por reforço chamado “dual data flywheel”, alcançando capacidades de agente próximas às de modelos grandes com centenas de bilhões de parâmetros, ao mesmo tempo em que reduz significativamente os custos de inferência. O mecanismo central reside no método de treinamento “dual data flywheel”. Dados sintéticos tradicionais tendem a se tornar homogêneos, levando ao teto de desempenho do modelo; o AgenticQwen introduz dois flywheels: o flywheel de inferência gera automaticamente variantes mais difíceis a partir dos erros do modelo; o flywheel de agente expande fluxos de trabalho lineares simples (como um único processo de reserva) em árvores de comportamento multirramificadas, incorporando restrições, recusas e condições adversas, simulando cenários complexos de tomada de decisão reais. Avaliações mostram que o AgenticQwen-8B obteve uma pontuação média de 47,4 em benchmarks de ambientes reais de ferramentas (como TAU-2 e BFCL-V4), superando significativamente o Qwen3-8B básico (23,8) e aproximando-se do Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) alcançou 50,2. Atualmente, o modelo já foi implantado em sistemas de produção internos semelhantes ao Manus, reduzindo consideravelmente a lacuna em relação aos modelos de 235B (com tempo de inferência ponto a ponto mais curto), embora o artigo reconheça que, limitado pelo comprimento nativo de contexto de 40K, os modelos menores ainda apresentam limitações em tarefas de busca profunda. (Fonte: BlockBeats)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.