MiniMax запускає метод MSA Sparse Attention та модель MiniMax-M3
KuCoinFlashПоділитися
Новини на ланцюгу виявляють, що MiniMax представила MSA (MiniMax Sparse Attention) — метод розрідженої уваги, побудований на основі Grouped Query Attention. Метод розділяє увагу на індексну гілку та основну гілку, де індексна гілка вибирає 16 блоків токенів на групу GQA, а основна гілка виконує точну softmax-увагу на цих блоках. MSA була навчена на MoE-моделі з 109 мільярдами параметрів, а MiniMax відкрила код інференс-ядра `fmha_sm100` для GPU NVIDIA SM100 за ліцензією MIT. Компанія також запустила продукційну модель MiniMax-M3, яка демонструє результати, що відповідають базовим моделям з повною увагою за кількома тестами. Нові токени можуть отримати переваги від цих досягнень у ефективності та продуктивності моделей.
Джерело:Показати оригінал
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.