MiniMax ra mắt phương pháp MSA Sparse Attention và mô hình MiniMax-M3

KuCoinFlash

Thời gian phát hành: 06/17/2026 08:25:46

Chia sẻ

Tóm tắt

Tin tức trên chuỗi cho thấy MiniMax đã ra mắt MSA (MiniMax Sparse Attention), một phương pháp chú ý thưa được xây dựng trên Grouped Query Attention. Phương pháp này chia chú ý thành nhánh chỉ số và nhánh chính, với nhánh chỉ số chọn 16 khối token mỗi nhóm GQA và nhánh chính thực hiện chú ý softmax chính xác trên các khối đó. MSA được huấn luyện trên mô hình MoE 109 tỷ tham số, và MiniMax đã mở nguồn kernel suy luận `fmha_sm100` cho GPU NVIDIA SM100 dưới giấy phép MIT. Công ty cũng đã ra mắt mô hình sản xuất MiniMax-M3, có hiệu suất tương đương các mô hình cơ sở sử dụng chú ý đầy đủ trên nhiều bộ kiểm tra. Các danh sách token mới có thể hưởng lợi từ những tiến bộ này trong hiệu quả và hiệu suất mô hình.

ME AI Tin nhắn, MiniMax đã ra mắt MSA (MiniMax Sparse Attention), một phương pháp chú ý thưa thớt được xây dựng trên Grouped Query Attention. Nó chia chú ý thành nhánh chỉ mục và nhánh chính: nhánh chỉ mục chọn 16 khối token (ngân sách cố định 2048 token khóa-giá trị) ở mức độ khối (mặc định 128 token) cho mỗi nhóm GQA, trong khi nhánh chính chỉ thực hiện chú ý softmax chính xác trên các khối này. MSA được huấn luyện trên mô hình MoE 109B tham số, đã mở nguồn nhân bản suy luận dành cho GPU NVIDIA SM100 `fmha_sm100` (giấy phép MIT, hỗ trợ BF16/FP8/NVFP4/FP4), và công bố mô hình sản xuất MiniMax-M3. MSA-PT đạt lần lượt 67.2, 77.7, 64.0, 84.2, 77.5 trên MMLU, GSM8K, HumanEval, RULER-8K, RULER-32K, tương đương với cơ sở chú ý đầy đủ. Trong ngữ cảnh 128K, lựa chọn Top-k không cần exp của nó nhanh hơn 5,1 lần so với `torch.topk`. (Nguồn: AiHot)

Nguồn:Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.