الی‌یون پی اے نے ایجنٹکووین چھوٹا ماڈل اور ڈوئل ڈیٹا فلائی ویل تربیت کو اوپن سورس کر دیا ہے

iconKuCoinFlash
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
آن-چین خبروں نے 27 اپریل (UTC+8) کو بریک کیا، جب علی بابا کی PAI ٹیم نے AgenticQwen کو اوپن سورس کیا، جو صنعتی ٹول کالنگ کے لیے ایک چھوٹا ماڈل ہے۔ MetaEra پر بنایا گیا، 8B اور 30B-A3B ورژنز ایک ڈوئل ڈیٹا فلائی ویل فریم ورک استعمال کرتے ہیں تاکہ انفرنس لاگت کم ہو۔ AgenticQwen-8B نے TAU-2 اور BFCL-V4 پر 47.4 اسکور کیا، جو Qwen3-8B (23.8) سے زیادہ اور Qwen3-235B (52.0) کے قریب ہے۔ AgenticQwen-30B-A3B (3B فعال پیرامیٹرز) نے 50.2 اسکور کیا۔ یہ ماڈل اب پروڈکشن سسٹمز میں استعمال ہو رہا ہے، جو 235B ماڈلز کے برابر انفرنس سپیڈ فراہم کرتا ہے۔ اب تخلیقی ڈیٹا ٹریکنگ اور دیگر حقیقی دنیا کے کاموں کو اس ریلیز کے ساتھ زیادہ موثر بنایا جا سکتا ہے۔

AIMPACT کا پیغام، 27 اپریل (UTC+8)، Beating کی نگرانی کے مطابق، علی پی اے ٹیم نے صنعتی سطح کے ٹولز کے استعمال کے لیے ڈیزائن کردہ چھوٹے ایجنٹ زبان ماڈل AgenticQwen (8B اور 30B-A3B دو ورژن) کو جاری اور اوپن سورس کیا ہے۔ اس سیریز ماڈلز کو ایک نوآورانہ "ڈوبل ڈیٹا فلائیر" رینفورسمنٹ لرننگ فریم ورک کے ذریعے تربیت دی گئی ہے، جس سے استدلال کی لاگت میں کافی کمی آئی ہے اور اس نے تقریباً اربوں پیرامیٹرز والے بڑے ماڈلز جیسی ایجنٹ صلاحیت حاصل کر لی ہے۔ اس کا مرکزی مکانیزم "ڈوبل ڈیٹا فلائیر" تربیت کا طریقہ ہے۔ روایتی سنتھیٹک ڈیٹا میں ہم آہنگی کی وجہ سے ماڈل کی صلاحیت محدود ہو جاتی ہے، جبکہ AgenticQwen نے دو فلائیرس متعارف کرائے ہیں: استدلال فلائیر ماڈل کی غلط جوابات سے خودکار طور پر مشکل تر ورژن تخلیق کرتا ہے؛ اور ایجنٹ فلائیر ماڈل کے انجام دہی کے راستوں کے مطابق، سادہ لینئر ورک فلو (جیسے صرف بکنگ پروسیس) کو پابندیوں، انکار اور مقابلہ والے شرائط کے ساتھ متعدد شاخوں والے بھیٹر کے طور پر وسعت دे�تا ہے، جو حقیقی پیچیدہ فیصلہ سازی کے مناظر کا تقسیم کرتا ہے۔ جائزہ کے مطابق، AgenticQwen-8B نے حقیقی ٹولز کے ماحول میں (جیسے TAU-2 اور BFCL-V4) اوسطاً 47.4 نمبر حاصل کیے، جو بنیادی Qwen3-8B (23.8) سے کافی زیادہ ہے اور Qwen3-235B (52.0) کے قریب ہے۔ AgenticQwen-30B-A3B (صرف 3B پیرامیٹرز فعال) نے 50.2 نمبر حاصل کیے۔ اب تک، یہ ماڈل Manus جیسے اندر کے پروڈکشن سسٹمز میں لاگو کر دیا گيا ہے، جس سے 235B بڑے ماڈلز کے درمیان فرق بڑھا ہے (اینڈ تو اینڈ استدلال وقت مختصر تر)، تاہم، تحقیق میں تسلیم کیا گيا ہے کہ اصل نینسٹ کانٹینکس لمبائی 40K تک محدود ہونے کی وجہ سے، چھوٹے ماڈلز کو گہرائی والے سرچ ٹاسکس میں پابندیاں درپوند ہيں۔ (ذرائع: BlockBeats)

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔