DeepSeek revela novo modelo 'MODEL1' um ano após o lançamento do DeepSeek-R1

iconKuCoinFlash
Compartilhar
AI summary iconResumo

Notícia do BlockBeats: Em 21 de janeiro, segundo relatos do Quantum Bit, no aniversário de um ano do lançamento do DeepSeek-R1, foi revelado um novo modelo chamado "MODEL1". O DeepSeek atualizou o código do FlashMLA no GitHub, onde, em 114 ficheiros, o "MODEL1" é mencionado 28 vezes, surgindo como um modelo distinto do V32. Sabe-se que o V32 é o DeepSeek-V3.2, pelo que o MODEL1 provavelmente representa uma nova arquitetura. As diferenças específicas no código manifestam-se na disposição do cache KV, no tratamento da esparsidade e na decodificação FP8, com várias diferenças no otimização da memória.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.