شیائومی کا MiMo-V2.5 ماڈل 10 لیئر کے مساوی توجہ کی حسابگری کے ساتھ لاگت کم کرتا ہے

iconKuCoinFlash
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
شیائومی کا MiMo-V2.5 ماڈل 10 لیئر کے مساوی توجہ کے حساب کے ذریعے لاگت کو کم کرتا ہے۔ 70 لیئر والی پرو ورژن کی کیش ہٹ لاگت میں 99% اور ان پٹ/آؤٹ پٹ لاگت میں 60-80% کمی آتی ہے۔ آن چین خبروں کے مطابق، یہ ماڈل عالمی اور سلائڈنگ ونڈو توجہ کے درمیان 1:7 کی اسپارسٹی نسبت استعمال کرتا ہے۔ عالمی کرپٹو پالیسی کے تبدیلیوں سے ایسی کارکردگی میں اضافہ AI کے اطلاق پر اثر انداز ہو سکتا ہے۔

ME نیوز کے مطابق، 27 مئی (UTC+8) کو، Beating کی نگرانی کے مطابق، مائیکرو سافٹ نے اپنے خود ساختہ بڑے ماڈل MiMo-V2.5 سیریز پر API کی قیمت میں مستقل کمی کی ہے، اس کے بعد مائیکرو سافٹ کے بڑے ماڈل ٹیم کے ہیڈ رو فولی نے X پلیٹ فارم پر الگورتھم کی لاگت میں کمی کے طریقہ کار کا اعلان کیا۔ رو فولی نے بتایا کہ API کی قیمت DeepSeek کے برابر ہونے کے باوجود، مائیکرو سافٹ کا ہائی لود ریزنگ انجن اب بھی خرچ اور آمدنی کے درمیان توازن برقرار رکھ رہا ہے۔ لاگت میں کمی کا بنیادی سبب مخلوط توجہ آرکٹیکچر اور ہائیرارکل KV کیش آپٹیمائزیشن ہے۔ کیش ہٹ (Cache Hit) کی لاگت میں 99 فیصد کمی کے ہدف کے لیے، مائیکرو سافٹ نے سلائڈنگ ونڈو توجہ (SWA) کے لیے ہائیرارکل KV کیش آپٹیمائزیشن حاصل کی ہے۔ پیداواری ٹیسٹنگ سے پتہ چلتا ہے کہ ہائیرارکل آپٹیمائزیشن نے کیش میں ٹوکن کی صلاحیت پانچ گنا بڑھا دی ہے اور کیش لاگت میں 80 فیصد کمی آئی ہے۔ عالمی توجہ ماڈولز کے درمیان کیش رید اوورلپ (Cache Read Overlap) تکنالوجی کو جوڑنے سے، سسٹم نے کیش ہٹ کی عملی لاگت مزید کم کر دی۔ بنیادی ان پٹ اور آؤٹ پٹ لاگت میں 60 فیصد سے 80 فیصد تک کمی کا سبب رو فولی نے ماڈل میں شامل 1:7 لیر وائس اسپارسٹی نسبت بتائی، جس میں عالمی توجہ (GA) اور سلائڈنگ ونڈو توجہ (SWA) کے لیرز کا تناسب 1:7 ہے۔ لمبے متن پر فراہم (Prefill) مرحلے میں، 60 لیر SWA صرف مقامی سلائڈنگ ونڈو پر حساب لگاتا ہے، جس سے 70 لیر والے MiMo-V2.5-Pro ماڈل کا مجموعی توجہ حساب صرف ایک 10 لیر والے روایتی عالمی GQA ماڈل جتنا ہوتا ہے۔ انتہائی کم حساباتی لوڈ نے اصل رینسنگ لاگت کو کم کر دیا، جس سے قیمت میں کمی سے پہلے مائیکرو سافٹ کو 2 سے 3 گنا منافع کا خلا دسترس تھا۔ اس لئے، قیمت میں کمی ساختی لاگت مینٹننس کا نتیجہ ہے، نہ کہ نقصان دہ مقابلہ۔ رو فولی نے کہا کہ سستا رینسنگ سروس آخری صارفین کے ذكاء مند تقاضوں کو فروغ دینے مें مدد دے گا۔ بڑے ماڈل اداروں کو بھول بھلائے قدر مقابلہ سے بچنا چاہئے اور الگورتھم اور رینسنگ سسٹم کے بنیادی تعاون سے عملی رننگ لاگت کو خرچ اور آمدنی کے توازن سے نچلا رکھنا چاہئے۔ (ذرائع: BlockBeats)

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔