MiniMax анонсирует модель M3 с в 15,6 раза более высокой скоростью декодирования

MiniMax, лаборатория ИИ из Шанхая, поддерживаемая Tencent, Alibaba и miHoYo, только что опубликовала технический отчет о серии моделей M2. Внутри него содержится намек на следующее поколение модели M3, которую компания утверждает, достигает скорости декодирования в 15,6 раза выше и скорости предзаполнения в 9,7 раза выше по сравнению с M2 при обработке контекстов объемом 1 млн токенов.

Что на самом деле построила MiniMax

Секретный ингредиент за тизером M3 — это то, что MiniMax называет MiniMax Sparse Attention (MSA). Он основан на технологии, называемой GQA-driven dynamic block selection. Вместо того чтобы заставлять модель обращать внимание на каждую единицу информации в огромном контекстном окне, MSA интеллектуально выбирает, какие блоки данных действительно важны для конкретного запроса. Результат — значительно меньшие вычислительные затраты при примерно том же качестве вывода.

MiniMax утверждает, что модель M3 сохраняет качество вывода, сопоставимое с M2, несмотря на эти значительные улучшения скорости.

Сам технический отчет охватывает инженерные инновации во всей линейке M2: M2, M2.5 и M2.7.

Стоит отметить: пока не предоставлено подтвержденных данных о количестве параметров, лицензионных деталях или графике выпуска M3.

Растущее присутствие MiniMax

Основанная в начале 2022 года, MiniMax была размещена на Гонконгской фондовой бирже в январе 2026 года. Ее инвесторы — Tencent, Alibaba и miHoYo (студия, стоящая за Genshin Impact) — представляют собой панораму технологической и игровой элиты Китая.

Помимо текста и кода, MiniMax управляет платформой Hailuo для генерации видео. Последняя версия, Hailuo 2.3, по данным компании, обработала миллиарды результатов.

Почему инвесторы в криптовалюты и ИИ должны обратить внимание

Децентрализованные сети вывода постоянно страдают от задержек и затрат. Если повышение эффективности MSA приведет к уменьшению объема ресурсов на один запрос, операторы нод смогут обрабатывать больше запросов без апгрейда своего оборудования.

Крипто-натуральные ИИ-агенты, которые отслеживают данные в цепочке, выполняют сделки или анализируют смарт-контракты в реальном времени, также ограничены скоростью, с которой их базовые модели могут обрабатывать информацию. Модель, обрабатывающая контексты объемом 1 млн токенов почти в 16 раз быстрее предыдущей, открывает возможности, которые ранее были непрактичны.

Прямые интеграции между технологиями MiniMax и любыми блокчейн-платформами или цифровыми токенами не подтверждены. Связь между более быстрыми моделями ИИ и криптоприложениями остается логическим предположением, а не объявлением о продукте.

Для инвесторов в сфере децентрализованного ИИ ключевой показатель, за которым следует следить, — это не дата выпуска M3, а то, будет ли архитектура MSA открыта вместе с весами модели. Если MiniMax последует своему устоявшемуся шаблону либерального лицензирования, каждый децентрализованный проект инференса по всему миру получит бесплатное обновление своей стратегии эффективности. Если компания сохранит MSA проприетарной, конкурентное преимущество останется централизованным в Шанхае.