Aliyun PAI Melepaskan Model Kecil AgenticQwen dengan Pelatihan Dual Data Flywheel

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita on-chain muncul pada 27 April (UTC+8) ketika tim PAI Alibaba melepaskan AgenticQwen sebagai model kecil untuk pemanggilan alat industri. Dibangun di atas MetaEra, versi 8B dan 30B-A3B menggunakan kerangka kerja dual data flywheel untuk mengurangi biaya inferensi. AgenticQwen-8B mendapat skor 47.4 pada TAU-2 dan BFCL-V4, mengungguli Qwen3-8B (23.8) dan mendekati Qwen3-235B (52.0). AgenticQwen-30B-A3B (3B parameter aktif) mendapat skor 50.2. Model ini kini telah diterapkan dalam sistem produksi, dengan kecepatan inferensi yang sebanding dengan model 235B. Pelacakan data inflasi dan tugas dunia nyata lainnya kini lebih efisien dengan rilis ini.

Pesan AIMPACT, 27 April (UTC+8), menurut pemantauan Beating, tim PAI Alibaba telah merilis dan mengopensource model bahasa agen kecil yang dirancang khusus untuk pemanggilan alat industri, AgenticQwen (tersedia dalam dua versi: 8B dan 30B-A3B). Seri model ini dilatih menggunakan kerangka pembelajaran penguatan inovatif "dual data flywheel", yang secara signifikan mengurangi biaya inferensi sekaligus mencapai kemampuan agen yang mendekati model besar dengan parameter seribu miliar. Mekanisme intinya terletak pada metode pelatihan "dual data flywheel". Data sintetis tradisional cenderung homogen, menyebabkan kinerja model mencapai batas atas; AgenticQwen memperkenalkan dua flywheel: flywheel inferensi secara otomatis menghasilkan varian yang lebih sulit dari kesalahan model; flywheel agen memperluas alur kerja linier sederhana (seperti proses pemesanan tiket saja) menjadi pohon perilaku multi-cabang yang mencakup batasan, penolakan, dan kondisi adversarial, mensimulasikan skenario pengambilan keputusan kompleks yang nyata. Evaluasi menunjukkan bahwa AgenticQwen-8B mencapai skor rata-rata 47.4 pada benchmark lingkungan alat nyata (seperti TAU-2 dan BFCL-V4), jauh melampaui Qwen3-8B versi dasar (23.8), dan mendekati Qwen3-235B (52.0). AgenticQwen-30B-A3B (hanya mengaktifkan 3B parameter) mencapai skor 50.2. Saat ini, model ini telah dideploy dalam sistem produksi internal serupa Manus, secara signifikan mempersempit kesenjangan dengan model 235B (waktu inferensi end-to-end lebih singkat), meskipun makalah tersebut mengakui bahwa model kecil masih memiliki keterbatasan dalam tugas pencarian mendalam akibat panjang konteks asli 40K. (Sumber: BlockBeats)

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.