ریو دی جنیرو حکومت نے بہتر شدہ ضمنی استدلال کے ساتھ 397B پیرامیٹر AI ماڈل کھولا ہے

iconKuCoinFlash
بانٹیں
AI summary iconخلاصہ
ME AI کی خبر، ایک ڈیٹا مونیٹرنگ سروس Beating کے مطابق، برازیل کے ریو دی جینیرو شہر کی میونسپل انفارمیشن اور پلاننگ کمپنی IplanRIO نے Hugging Face پر Rio-3.5-Open-397B کو اوپن سورس کیا ہے۔ یہ ماڈل Qwen 3.5 397B پر مبنی ہے جسے بعد کی تربیت کے ذریعے ترقی دی گئی ہے، اور اس میں MoE آرکٹیکچر استعمال کیا گیا ہے، جس کے کل پیرامیٹرز تقریباً 3970 ارب ہیں، جبکہ ہر ٹوکن کے لیے تقریباً 170 ارب پیرامیٹرز فعال ہوتے ہیں۔ اس کا حمایت شدہ کنٹیکس تقریباً 10 لاکھ ٹوکن ہے اور اسے MIT لائسنس کے تحت اوپن سورس کیا گیا ہے۔ ماڈل کارڈ کے مطابق، Rio-3.5-Open-397B میں SwiReasoning انفرنس فریم ورک شامل ہے۔ SwiReasoning ایک تربیت کے بغیر انفرنس طریقہ ہے جو معلومات کی اینٹروپی میں تبدیلی کے مطابق، صریح سوچ کے سلسلے اور خفیہ ویکٹر سپیس انفرنس کے درمیان تبدیلی کرتا ہے۔ صریح انفرنس مخصوص نتائج کو قدرتی زبان کے ٹوکن میں لکھنے کے لیے ذمہ دار ہے، جبکہ خفیہ انفرنس پوشیدہ سپیس میں متعدد راستوں کا جائزہ لینے کے لیے استعمال ہوتا ہے تاکہ غیر ضروری متن کا پیداوار کم ہو۔ ٹیم نے جو ٹیسٹ شیئر کیے ہیں، ان کے مطابق، جب SwiReasoning فعال ہوتا ہے تو Rio-3.5-Open-397B کا SWE-Bench Pro سکور 58.1 اور IMOAnswerBench سکور 89.5 ہوتا ہے۔ اس کا مقابلہ Qwen 3.5 397B اصل ورژن سے کرتے ہوئے، جس کا سکور lầnً 50.9 اور 80.9 تھا، اور صرف بعد کی تربیت کے ساتھ (بدون خفیہ انفرنس) سکور lầnً 54.8 اور 84.5 تھا۔ یعنی، خفیہ انفرنس نے ماڈل کی مطلق صلاحیت دگنا نہیں کی، لیکن بنیادی ماڈل کے مقابلے میں بہتری کا تناسب تقریباً دگنا ہو گیا۔ اس کا اصل پابندی مطابقت ہے۔ Hugging Face کے فورم میں، ٹیم نے تصدیق کی ہے کہ ان تمام شائع شدہ سکورز SwiReasoning فعال حالت میں حاصل کئے گئے تھے۔ SwiReasoning کو انفرنس کے دوران احتمالات وزن دار لگاتار "سافٹ امبڈنگ" ویکٹرز درکار ہوتے ہیں، جبکہ llama.cpp جیسے صرف منفصل ٹوکن ID جنریشن کو سپورٹ کرنے والے انفرنس انجن ابھی تک اسے مکمل طور پر لاگو نہیں کر سکتے۔ ٹیم نے بتایا کہ جب خفیہ انفرنس غیر فعال ہو تو بھی ماڈل Qwen 3.5 397B اصل ورژن سے واضح طور پر زبردست ہے، لیکن مکمل صلاحیت حاصل کرنے کے لئے انفرنس فریم ورک کو سافٹ امبڈنگ ان پٹس کو سپورٹ کرنا ضروری ہے۔ (ذرائع: BlockBeats)
اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔