মিনিম্যাক্স এমএসএ স্পার্স অ্যাটেনশন পদ্ধতি এবং মিনিম্যাক্স-এম৩ মডেল চালু করেছে

iconKuCoinFlash
শেয়ার
AI summary iconসারাংশ
ME AI মেসেজ, MiniMax এমএসএ (MiniMax Sparse Attention) প্রকাশ করেছে, যা Grouped Query Attention-এর উপর ভিত্তি করে তৈরি একটি স্পার্স অ্যাটেনশন পদ্ধতি। এটি অ্যাটেনশনকে ইনডেক্স ব্রাঞ্চ এবং মেইন ব্রাঞ্চে বিভক্ত করে: ইনডেক্স ব্রাঞ্চ প্রতিটি GQA গ্রুপের জন্য ব্লক গ্রেনুলারিটিতে (ডিফল্ট 128 টোকেন) 16টি টোকেন ব্লক নির্বাচন করে (স্থির বাজেট 2048টি কী-ভ্যালু টোকেন), মেইন ব্রাঞ্চ শুধুমাত্র এই ব্লকগুলিতে পরিশুদ্ধ softmax অ্যাটেনশন প্রয়োগ করে। MSA 109B প্যারামিটার MoE মডেলে ট্রেনিং করা হয়েছে, NVIDIA SM100 GPU-এর জন্য `fmha_sm100` (MIT লাইসেন্স, BF16/FP8/NVFP4/FP4 সমর্থন) ইনফারেন্স কোর ওপেন-সোর্স করা হয়েছে, এবং প্রোডাকশন মডেল MiniMax-M3 প্রকাশ করা হয়েছে। MSA-PT MMLU, GSM8K, HumanEval, RULER-8K, RULER-32K-এ 67.2, 77.7, 64.0, 84.2, 77.5 স্কোর অর্জন করে, যা ফুল-অ্যাটেনশন বেসলাইনের সমান। 128K কনটেক্সটে, এটির exp-free Top-k নির্বাচন `torch.topk`-এর চেয়ে 5.1 গুণ দ্রুত। (উৎস: AiHot)
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।