Сообщение от ME AI: сегодня MiniMax официально запустила большую модель MiniMax M3. M3 — это единственная открытая модель, объединяющая три передовых элемента: программирование, сверхдлинный контекст и нативную мультимодальность (веса планируется открыть в течение 10 дней). Она достигла международного уровня в генерации кода, агентах и управлении рабочим столом, и её можно протестировать в MiniMax Code, Token Plan и API.
Для сверхдлинных контекстов M3 впервые внедрила разреженную архитектуру внимания MSA, которая с помощью агрегации блоков KV достигает в 4 раза более высокой скорости доступа к памяти по сравнению с Flash-Sparse-Attention. При контексте в 1 миллион токенов новая архитектура снижает вычислительную нагрузку на токен до двадцатой части от предыдущего поколения, обеспечивая ускорение предзаполнения в 9 раз и декодирования в 15 раз.
На SWE-Bench Pro M3 показала результат 59,0%, превзойдя GPT-5.5 и Gemini 3.1 Pro, приблизившись к Opus 4.7, и набрала 66,0% на Terminal Bench 2.1. Команда также создала интерактивную рамку для моделирования пользователей, предназначенную для обучения модели долгосрочному совместному планированию и многократному взаимодействию.
В реальных тестах M3 самостоятельно запустил 12 часов, воспроизвел статью ICLR 2025 и зафиксировал эффект DPO. В задаче оптимизации FP8-операторов на Hopper за 24 часа он самостоятельно вызвал инструменты 1959 раз, повысив использование аппаратных ресурсов с 7,6% до 71,3%, ускорив процесс в 9,4 раза. В реальных тестах PostTrainBench по самостоятельной тренировке модели модель показала результат 0,37 — немного ниже, чем у Opus 4.7 и GPT-5.5, но явно превосходит остальные модели.
MiniMax Code синхронизирован с обновлением, поддерживающим управление рабочим столом через компьютер. Подписка на уровень Plus за 49 юаней в месяц предоставляет 6 миллиардов токенов — примерно в 5 раз больше, чем у подписки Claude Pro. API уже доступен и предлагает два режима: с рассуждениями и быстрый режим без рассуждений. Веса будут открыты через 10 дней.(来源:MiniMax)
