Google DeepMind lança o DiffusionGemma, com aumento de 4x na velocidade de geração de texto
KuCoinFlashCompartilhar






Notícias on-chain: o Google DeepMind lançou o DiffusionGemma, um modelo de geração de texto de código aberto que aumenta a velocidade em 4x. Usando tecnologia de difusão, ele gera 256 tokens em paralelo, alcançando mais de 1000 tokens/s no H100 e 700+ no RTX 5090. O modelo MoE de 26B ativa 3,8B parâmetros durante a inferência e suporta GPUs de consumo após quantização. Ele apresenta atenção bidirecional e autocorreção, ideal para conclusão de código e edição embutida. O modelo foi disponibilizado sob licença Apache 2.0. Novas listagens de tokens podem se beneficiar desses avanços na eficiência de geração.
Fonte:Mostrar original
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações.
Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.