Google DeepMind lanza DiffusionGemma, la velocidad de generación de texto aumenta 4 veces
KuCoinFlashCompartir






Noticias on-chain: Google DeepMind ha lanzado DiffusionGemma, un modelo de generación de texto de código abierto que aumenta la velocidad en 4 veces. Utilizando tecnología de difusión, genera 256 tokens en paralelo, logrando más de 1000 tokens/s en H100 y 700+ en RTX 5090. El modelo MoE de 26B activa 3.8B parámetros durante la inferencia y es compatible con GPU de consumo tras la cuantización. Cuenta con atención bidireccional y autocorrección, ideal para la finalización de código y edición en línea. El modelo se ha liberado bajo Apache 2.0. Las nuevas listas de tokens podrían beneficiarse de estos avances en eficiencia de generación.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.