Google DeepMind lance DiffusionGemma, la vitesse de génération de texte multipliée par 4
KuCoinFlashPartager






Actualités on-chain : Google DeepMind a lancé DiffusionGemma, un modèle open-source de génération de texte qui augmente la vitesse de 4 fois. En utilisant la technologie diffusion, il génère 256 jetons en parallèle, atteignant plus de 1000 jetons/s sur H100 et 700+ sur RTX 5090. Le modèle MoE de 26 Go active 3,8 Go de paramètres lors de l'inférence et prend en charge les GPU grand public après quantification. Il intègre une attention bidirectionnelle et une auto-correction, idéale pour la complétion de code et l'édition en ligne. Le modèle est mis à disposition en open source sous licence Apache 2.0. De nouvelles listings de jetons pourraient bénéficier de ces avancées en efficacité de génération.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.