DeepSeek оголошує нову модель «MODEL1» через рік після запуску DeepSeek-R1

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
DeepSeek 21 січня 2026 року оголосила про нову модель під назвою «MODEL1», саме через рік після запуску DeepSeek-R1. Компанія оновила код FlashMLA на GitHub, де модель MODEL1 згадується 28 разів у 114 файлах, що явно відрізняється від V32 (DeepSeek-V3.2). Зміни в коді вказують на відмінності в розташуванні кешу KV, обробці розріджених даних та декодуванні FP8, що свідчить про покращення оптимізації пам'яті. Оновлення виходить на тлі триваючих новин про запуск токенів та нових розміщень токенів на основних платформах.

BlockBeats повідомляє, 21 січня, за даними QbitAI, у день річниці випуску DeepSeek-R1 було розкрите нове моделювання «MODEL1». DeepSeek оновила код FlashMLA на GitHub, у 28 з 114 файлів згадується MODEL1, який відрізняється від V32. Відомо, що V32 - це DeepSeek-V3.2, а MODEL1, ймовірно, є новою архітектурою. Конкретні відмінності в коді проявляються в розташуванні кешу KV, обробці розріджених даних та декодуванні FP8, зокрема, є кілька відмінностей у оптимізації пам'яті.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.