DeepSeek оголошує нову модель «MODEL1» через рік після запуску DeepSeek-R1

iconKuCoinFlash
Поділитися
AI summary iconКороткий зміст

BlockBeats повідомляє, 21 січня, за даними QbitAI, у день річниці випуску DeepSeek-R1 було розкрите нове моделювання «MODEL1». DeepSeek оновила код FlashMLA на GitHub, у 28 з 114 файлів згадується MODEL1, який відрізняється від V32. Відомо, що V32 - це DeepSeek-V3.2, а MODEL1, ймовірно, є новою архітектурою. Конкретні відмінності в коді проявляються в розташуванні кешу KV, обробці розріджених даних та декодуванні FP8, зокрема, є кілька відмінностей у оптимізації пам'яті.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.