مینی میکس نے MSA اسپارس ایٹینشن میتھڈ اور مینی میکس-M3 ماڈل شروع کیا

iconKuCoinFlash
بانٹیں
AI summary iconخلاصہ
ME AI کا پیغام، MiniMax نے MSA (MiniMax Sparse Attention) جاری کیا ہے، جو Grouped Query Attention پر مبنی ایک اسپارس توجہ کا طریقہ ہے۔ اس میں توجہ کو انڈیکس برانچ اور مین برانچ میں تقسیم کیا جاتا ہے: انڈیکس برانچ ہر GQA گروپ کے لیے بلاک کے سطح پر (ڈیفالٹ 128 ٹوکن) 16 ٹوکن بلاکس منتخب کرتا ہے (مستقل بجٹ 2048 کلیدی-قدرتی ٹوکن)، جبکہ مین برانچ صرف ان بلاکس پر درست softmax توجہ انجام دیتا ہے۔ MSA کو 109B پیرامیٹر MoE ماڈل پر تربیت دی گئی ہے، اور NVIDIA SM100 GPU کے لیے اوپن سورس انفرینس کرنل `fmha_sm100` (MIT لائسنس، BF16/FP8/NVFP4/FP4 کی حمایت کے ساتھ) جاری کیا گیا ہے، اور پروڈکشن ماڈل MiniMax-M3 بھی جاری کیا گیا ہے۔ MSA-PT نے MMLU، GSM8K، HumanEval، RULER-8K، RULER-32K پر بالترتیب 67.2، 77.7، 64.0، 84.2، 77.5 حاصل کیے، جو مکمل توجہ کے بنیادی معیار کے برابر ہیں۔ 128K کنٹیکسٹ پر، اس کا exp-free Top-k انتخاب `torch.topk` سے 5.1 گنا تیز ہے۔ (ذرائع: AiHot)
اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔