ME AI mesajı, MiniMax bugün büyük model MiniMax M3'ü resmen duyurdu. M3, programlama, uzun bağlam ve yerel çoklu modallite gibi üç önde gelen özelliği bir araya getiren tek açık kaynaklı büyük modeldir (ağırlıkların resmi olarak açık kaynak hale getirilmesi 10 gün içinde planlanmaktadır). Kod üretimi, akıllı ajanlar ve masaüstü kontrolünde uluslararası düzeyde öncü düzeyde performans gösterir ve MiniMax Code, Token Plan ve API üzerinden deneylenebilir.
Uzun bağlam için M3, KV blok birleştirme ile sorgulara erişen ilk seyrek dikkat mimarisi MSA'yı geliştirdi; bellek erişimi Flash-Sparse-Attention'dan 4 kat daha hızlı. 1 milyon bağlamda, yeni mimari, her token için hesaplama yükünü önceki neslin yirmide birine düşürerek, ön doldurmayı 9 kat, çözümlemeyi 15 kat hızlandırdı.
SWE-Bench Pro üzerinde M3, %59,0 puan alarak GPT-5.5 ve Gemini 3.1 Pro'yu geçerek Opus 4.7'e yaklaştı ve Terminal Bench 2.1'de %66,0 puan elde etti. Takım, modelin uzun vadeli iş birliği planlama ve çok aşamalı etkileşim yeteneklerini eğitmek için etkileşimli kullanıcı simülatörü çerçevesi de geliştirdi.
Gerçek testlerde, M3, 12 saat içinde ICLR 2025 makalesini kendi kendine yeniden üretti ve DPO etkisini gözlemledi. Hopper üzerinde FP8 işlemcileri optimize etme görevinde, 24 saat içinde 1959 kez kendi kendine araçları çağırdı ve donanım kullanım oranını %7,6'dan %71,3'e çıkardı, bu da 9,4 kat hızlanma sağladı. PostTrainBench üzerinde kendi kendine model eğitimi gerçekleştirmede, model 0,37 puan aldı; bu puan Opus 4.7 ve GPT-5.5'in biraz altında olsa da, diğer tüm modellerden açıkça önde.
MiniMax kodu eşzamanlı olarak güncellendi ve masaüstü kontrolü desteği eklendi. Plus abonelik planı aylık 49 yuan karşılığında 6 milyar token sunuyor, bu Claude Pro aboneliğinin yaklaşık 5 katı kapasitedir. API artık kullanıma sunuldu ve thinking (düşünme) ve non-thinking (hızlı) modları sunuyor. Ağırlıklar 10 gün içinde açık kaynak hale getirilecek.(来源:MiniMax)
