ME AI کا پیغام، MiniMax نے آج مکمل طور پر بڑا ماڈل MiniMax M3 جاری کیا ہے۔ M3 اب تک کا واحد اوپن سورس ماڈل ہے جس میں پروگرامنگ، بہت لمبے کانٹیکسٹ اور نیچے سے متعدد ماڈلز کے تینوں جدید عناصر موجود ہیں (وزن 10 دن کے اندر اوپن سورس ہونے کی منصوبہ بندی ہے)، جو کوڈ جنریشن، انسٹنس اور ڈیسک ٹاپ کنٹرول میں عالمی سطح پر قائد ہے، جسے MiniMax Code، Token Plan اور API میں تجربہ کیا جا سکتا ہے۔
طویل سیاق و سباق کے لیے، M3 نے مخصوص توجہ کی ساخت MSA کو متعارف کرایا، جو KV بلاکس کے اکٹھا کرنے سے کوئریز کو ہٹاتا ہے اور Flash-Sparse-Attention کے مقابلے میں 4 گنا تیز یادداشت تک رسائی فراہم کرتا ہے۔ 100 لاکھ سیاق و سباق پر، نئی ساخت نے ہر ٹوکن کی حسابگاری کو پچھلی نسل کے بیسواں حصے تک کم کر دیا، جس سے پری فلِل 9 گنا اور ڈیکوڈنگ 15 گنا تیز ہوئی۔
SWE-Bench Pro پر، M3 نے 59.0% کا اسکور حاصل کیا، جو GPT-5.5 اور Gemini 3.1 Pro کو پیچھے چھوڑ دیتا ہے اور Opus 4.7 کے قریب پہنچ جاتا ہے، جبکہ Terminal Bench 2.1 پر 66.0% کا اسکور حاصل کیا۔ ٹیم نے مدلز کی لمبے عرصے تک کے تعاونی منصوبہ بندی اور متعدد مکالموں کی صلاحیت کو تربیت دینے کے لیے ایک انٹرایکٹو صارف سیمولیٹر فریم ورک بھی تعمیر کیا ہے۔
تجربی طور پر، M3 نے 12 گھنٹے کے دوران خودکار طور پر ICLR 2025 کے پیپر کو دہرایا اور DPO اثر کا مشاہدہ کیا۔ Hopper کے FP8 آپریٹرز کے لیے تہذیب کے کام میں، 24 گھنٹوں میں خودکار طور پر 1959 بار ٹولز کا استعمال کیا گیا، جس سے ہارڈویئر کا استعمال 7.6% سے بڑھا کر 71.3% کر دیا گیا اور 9.4 گنا تیزی آئی۔ PostTrainBench پر خودکار مدل تربیت کے تجربے میں، مدل نے 0.37 اسکور حاصل کیا، جو Opus 4.7 اور GPT-5.5 سے تھوڑا کم ہے، لیکن باقی تمام مڈلز سے واضح طور پر آگے ہے۔
مینی میکس کوڈ کا مزید اپ ڈیٹ، کمپیوٹر استعمال اور ڈیسک ٹاپ کنٹرول کی سہولت کے ساتھ۔ پلس منصوبہ مہینہ کے 49 یوان میں 6 بلین ٹوکن فراہم کرتا ہے، جو کلاؤڈ پرو کے سبسکرپشن سے تقریباً 5 گنا زیادہ کیپسیٹی ہے۔ API اب دستیاب ہے، جس میں سوچنے والے اور سوچے بغیر تیز رفتار موڈز شامل ہیں، اور وزن 10 دن کے اندر اوپن سورس ہو جائیں گے۔(来源:MiniMax)
