Aliyun PAI ने ड्यूअल डेटा फ्लायव्हील ट्रेनिंग के साथ AgenticQwen छोटा मॉडल ओपन सोर्स किया है

KuCoinFlash

रिलीज़ समय: 27/04/2026, 06:51:58

साझा करें

सारांश

ऑन-चेन समाचार 27 अप्रैल (UTC+8) को सामने आया, जब अलीबाबा की PAI टीम ने AgenticQwen, एक औद्योगिक टूल कॉलिंग के लिए छोटा मॉडल, ओपन-सोर्स किया। मेटाएरा पर बनाया गया, 8B और 30B-A3B संस्करण एक डुअल डेटा फ्लायव्हील फ्रेमवर्क का उपयोग करते हैं जिससे निष्पादन लागत कम होती है। AgenticQwen-8B ने TAU-2 और BFCL-V4 पर 47.4 का स्कोर प्राप्त किया, जो Qwen3-8B (23.8) से बेहतर है और Qwen3-235B (52.0) के करीब है। AgenticQwen-30B-A3B (3B सक्रिय पैरामीटर) ने 50.2 का स्कोर प्राप्त किया। यह मॉडल अब उत्पादन प्रणालियों में है, जहाँ यह 235B मॉडल्स के समान निष्पादन गति प्रदान करता है। इस रिलीज के साथ, मुद्रास्फीति डेटा ट्रैकिंग और अन्य वास्तविक-दुनिया के कार्य अब अधिक कुशलता से किए जा सकते हैं।

AIMPACT संदेश, 27 अप्रैल (UTC+8), Beating द्वारा मॉनिटर किए जाने पर, अलीबाबा PAI टीम ने औद्योगिक स्तर के टूल कॉल के लिए डिज़ाइन किए गए छोटे एजेंट भाषा मॉडल AgenticQwen (8B और 30B-A3B दो संस्करणों के साथ) को प्रकाशित और ओपन सोर्स किया है। इस सीरीज़ मॉडल को एक नवीन 'डुअल डेटा फ्लाइव्हील' रीइनफोर्समेंट लर्निंग फ्रेमवर्क के माध्यम से प्रशिक्षित किया गया है, जिससे निष्कर्षण लागत में काफी कमी हुई है और करोड़ों पैरामीटर वाले बड़े मॉडल के समान एजेंट क्षमता प्राप्त हुई है। मुख्य तंत्र 'डुअल डेटा फ्लाइव्हील' प्रशिक्षण पद्धति में निहित है। पारंपरिक सिंथेटिक डेटा में समानता के कारण मॉडल की प्रदर्शन सीमा पहुँच जाती है, AgenticQwen ने इसके लिए दो फ्लाइव्हील पेश किए हैं: इनफरेंस फ्लाइव्हील मॉडल की गलतियों से स्वयं अधिक कठिन विविधताएँ स्वतः उत्पन्न करता है; एजेंट फ्लाइव्हील मॉडल के निष्पादन पथ के आधार पर सरल रेखीय कार्यप्रवाह (जैसे एकल बुकिंग प्रक्रिया) को प्रतिबंध, अस्वीकृति और प्रतिरोधी स्थितियों सहित बहुशाखा व्यवहार वृक्ष में विस्तारित करता है, जो वास्तविक जटिल निर्णय परिदृश्यों का अनुकरण करता है। मूल्यांकन परिणामों के अनुसार, AgenticQwen-8B, वास्तविक टूल परिवेश में (जैसे TAU-2 और BFCL-V4) 47.4 का औसत स्कोर प्राप्त करता है, जो Qwen3-8B (23.8) से काफी अधिक है, Qwen3-235B (52.0) के करीब पहुँचता है। AgenticQwen-30B-A3B (केवल 3B पैरामीटर सक्रिय) का स्कोर 50.2 है। वर्तमान में, मॉडल को Manus के समान आंतरिक उत्पादन प्रणाली में स्थापित किया गया है, 235B मॉडल के साथ अंतर को काफी कम करते हुए (एंड-टू-एंड इनफरेंस समय कम), हालाँकि पेपर में स्वीकार किया गया है कि 40K मूल संदर्भ लंबाई के प्रतिबंध के कारण, छोटे मॉडल में गहन सर्च कार्यों में सीमाएँ हैं। (स्रोत: BlockBeats)

स्रोत:मूल दिखाएं

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।