O modelo Qwen 3.6 27B Dense alcança 40 tok/s na RTX 3090

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
Notícias on-chain da MetaEra mostram que o modelo Qwen 3.6 27B Dense atingiu 40 tokens por segundo em uma única GPU RTX 3090 24GB. O usuário @sudoingX publicou os resultados em 24 de abril (UTC+8) usando a quantização Q4_K_M do llama.cpp. Nenhum truque ou kernel fundido foi aplicado. Um benchmark personalizado de enxame de partículas também foi desenvolvido. Plataformas de notícias cripto estão acompanhando de perto o desempenho.

Mensagem do AIMPACT, 24 de abril (UTC+8): Em 24 de abril de 2026, o usuário @sudoingX publicou resultados preliminares de teste: o modelo Qwen 3.6 27B Dense alcançou 40 tok/s em um único GPU RTX 3090 de 24 GB, passando em 10/10 testes. O resultado não utilizou técnicas de quantização ou kernels fusionados, apenas a quantização direta Q4_K_M do llama.cpp. O usuário também desenvolveu um benchmark de enxame de partículas para avaliar o modelo. (Fonte: InFoQ)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.