Google DeepMind запускає DiffusionGemma, швидкість генерації тексту збільшена в 4 рази
KuCoinFlashПоділитися






Он-чейн новини: Google DeepMind запустив DiffusionGemma — відкриту модель генерації тексту, яка збільшує швидкість у 4 рази. Використовуючи технологію дифузії, вона генерує 256 токенів паралельно, досягаючи більше 1000 токенів/с на H100 та 700+ на RTX 5090. Модель 26B MoE під час висновку активує 3,8 млрд параметрів і підтримує потребительські GPU після квантування. Вона має двонаправлений увагу та самокорекцію, що робить її ідеальною для завершення коду та вбудованого редагування. Модель випущена під ліцензією Apache 2.0. Нові токени можуть вигодувати від таких досягнень у ефективності генерації.
Джерело:Показати оригінал
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.