Ang AIMPACT ay nagpapahayag, noong Abril 27 (UTC+8), ayon sa pagmamasid ng Beating, ang Alibaba PAI team ay naglabas at isinara ang AgenticQwen, isang maliit na language model para sa agent na disenyo para sa industrial-grade tool invocation (may dalawang bersyon: 8B at 30B-A3B). Ang series na ito ay tinuruan gamit ang inobatibong “dual data flywheel” reinforcement learning framework, na nagpapababa nang malaki sa pagkalkula ng gastos habang nagtataglay ng agent capability na malapit sa mga malalaking model na may milyon-milyong parameter. Ang pangunahing mekanismo ay ang kanilang “dual data flywheel” training method. Ang tradisyonal na synthetic data ay madalas ay homogenous na nagdudulot ng pagtigil sa performance; ang AgenticQwen ay naglalagay ng dalawang flywheel: ang reasoning flywheel ay awtomatikong gumagawa ng mas mahirap na variant mula sa mga mali sa model; samantalang ang agent flywheel ay nagpapalawak sa simpleng linear workflow (tulad ng isang pagsisikat ng tiket) sa isang multi-branch behavior tree na may mga constraint, rejection, at adversarial conditions, na sumasalamin sa totoong kompleks na desisyon-making scenario. Ayon sa pagsusuri, ang AgenticQwen-8B ay nakakuha ng average na 47.4 sa mga totoong tool environment benchmarks (tulad ng TAU-2 at BFCL-V4), na mas mataas kaysa sa base version na Qwen3-8B (23.8) at malapit sa Qwen3-235B (52.0). Ang AgenticQwen-30B-A3B (na nag-activate lang ng 3B parameters) ay nakakuha ng 50.2. Kasalukuyang inilalapat na ang model na ito sa loob ng production system na katulad ng Manus, at malaki ang pagkakataon na mabawasan ang pagkakaiba sa pagitan nito at ang 235B model (mas maikli ang end-to-end inference time), bagaman kilala rin ng papel na limitado pa rin ito sa 40K native context length, kaya may limitasyon pa rin ito sa malalim na search tasks. (Source: BlockBeats)
Inilabas ng Aliyun PAI ang AgenticQwen Small Model na may Dual Data Flywheel Training
KuCoinFlashI-share






Nabroke ang on-chain news noong Abril 27 (UTC+8) nang buksan ng PAI team ng Alibaba ang AgenticQwen, isang maliit na modelo para sa pagtawag ng industriyal na tool. Binuo sa MetaEra, ang mga bersyon na 8B at 30B-A3B ay gumagamit ng dual data flywheel framework upang bawasan ang mga gastos sa inference. Nakakuha ang AgenticQwen-8B ng 47.4 sa TAU-2 at BFCL-V4, na higit sa Qwen3-8B (23.8) at malapit na sa Qwen3-235B (52.0). Nakakuha ang AgenticQwen-30B-A3B (3B active parameters) ng 50.2. Ang modelo ay kasalukuyang nasa production systems, na nagtatugma sa bilis ng inference ng 235B models. Mas epektibo na ang pagsubaybay sa impormasyon ng inflasyon at iba pang mga gawain sa totoong mundo sa pamamagitan ng paglabas na ito.
Source:Ipakita ang original
Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito.
Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.