Согласно сообщению BlockBeats, 21 января, согласно сообщению QbitAI, в годовщину выхода DeepSeek-R1 компания раскрыла информацию о новой модели «MODEL1». DeepSeek обновила код FlashMLA на GitHub, и в 28 файлах из 114 упоминается MODEL1, который появляется как модель, отличная от V32. Известно, что V32 — это DeepSeek-V3.2, а MODEL1, вероятно, представляет собой новую архитектуру. Конкретные различия в коде проявляются в расположении кэша KV, обработке разреженности и декодировании FP8, а также в нескольких аспектах оптимизации памяти.
DeepSeek представила новую модель «MODEL1» через год после запуска DeepSeek-R1
KuCoinFlashПоделиться






21 января 2026 года, ровно через год после запуска DeepSeek-R1, DeepSeek объявил о новой модели под названием «MODEL1». Компания обновила код FlashMLA на GitHub, где упоминание MODEL1 встречается 28 раз в 114 файлах, что явно отличается от V32 (DeepSeek-V3.2). Изменения в коде показывают различия в расположении кэша KV, обработке разреженности и декодировании FP8, что указывает на улучшения в оптимизации памяти. Обновление появилось на фоне продолжающихся новостей о запуске токенов и новых списаниях токенов на крупных платформах.
Источник:Показать оригинал
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации.
Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.