Tin nhắn từ ME AI, MiniMax chính thức ra mắt mô hình lớn M3 hôm nay. M3 là mô hình lớn theo hướng mã nguồn mở duy nhất hiện nay tích hợp đầy đủ ba yếu tố tiên tiến: lập trình, ngữ cảnh siêu dài và đa mô tả bản địa (dự kiến công khai trọng số trong vòng 10 ngày tới), đạt trình độ hàng đầu thế giới trong tạo mã, tác nhân thông minh và điều khiển máy tính để bàn, có thể trải nghiệm trên MiniMax Code, Token Plan và API.
Đối với ngữ cảnh siêu dài, M3 lần đầu tiên giới thiệu kiến trúc chú ý thưa thớt MSA, thông qua tổng hợp khối KV để truy vấn, tốc độ truy cập bộ nhớ nhanh gấp 4 lần so với Flash-Sparse-Attention. Với ngữ cảnh 1 triệu, kiến trúc mới giảm lượng tính toán trên mỗi token xuống còn một phần hai mươi so với thế hệ trước, đạt tốc độ tiền điền nhanh gấp 9 lần và giải mã nhanh gấp 15 lần.
Trên SWE-Bench Pro, M3 đạt điểm 59,0%, vượt qua GPT-5.5 và Gemini 3.1 Pro, gần với Opus 4.7, và đạt 66,0% điểm trên Terminal Bench 2.1. Nhóm cũng đã xây dựng khung mô phỏng người dùng tương tác để huấn luyện khả năng lập kế hoạch hợp tác dài hạn và tương tác đa vòng của mô hình.
Trong thử nghiệm thực tế, M3 tự vận hành 12 giờ để tái hiện bài báo ICLR 2025 và quan sát thấy hiệu ứng DPO. Trong nhiệm vụ tối ưu hóa bộ toán tử FP8 trên Hopper, trong vòng 24 giờ, M3 đã tự gọi công cụ 1959 lần, nâng tỷ lệ sử dụng phần cứng từ 7,6% lên 71,3%, tăng tốc 9,4 lần. Trong thử nghiệm đào tạo mô hình tự chủ trên PostTrainBench, mô hình đạt điểm 0,37, dù hơi thấp hơn Opus 4.7 và GPT-5.5, nhưng rõ ràng dẫn đầu các mô hình còn lại.
MiniMax Code đã được cập nhật đồng bộ, hỗ trợ điều khiển máy tính để bàn. Gói đăng ký Plus với giá 49 nhân dân tệ mỗi tháng cung cấp 6 tỷ token, tương đương khoảng 5 lần dung lượng của gói đăng ký Claude Pro. API hiện đã ra mắt, cung cấp chế độ suy luận thinking và chế độ nhanh non-thinking, kế hoạch mở nguồn mã nguồn sẽ được thực hiện trong vòng 10 ngày.(来源:MiniMax)
