Google DeepMind、DiffusionGemmaをリリース。テキスト生成速度が4倍に向上

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
オンチェーンニュース:Google DeepMindが、速度を4倍に向上させるオープンソースのテキスト生成モデル「DiffusionGemma」をリリースしました。拡散技術を用いて、256トークンを並列に生成し、H100では1000トークン/秒以上、RTX 5090では700トークン/秒以上を達成します。26BのMoEモデルは推論時に3.8Bのパラメータを活性化し、量子化後には一般消費者向けGPUでも動作します。双方向注意機構と自己修正機能を備え、コード補完やインライン編集に最適です。このモデルはApache 2.0ライセンスでオープンソース化されています。このような生成効率の向上により、新しいトークンの上場が恩恵を受ける可能性があります。
ME AI ニュース、Google DeepMind がオープンソースの実験モデル DiffusionGemma をリリース。このモデルはテキスト拡散技術を採用し、従来の自己回帰的トークン単位生成方式を突破し、毎回のフォワード処理で並列に 256 個のトークンを生成する。この 26B MoE モデルは推論時に 3.8B のパラメータのみを活性化し、量子化後は 18GB のVRAMを搭載した消費者向け GPU に最適化される。H100 では 1000+ トークン/秒、RTX 5090 では 700+ トークン/秒を実現し、速度が 4 倍向上。双方向注意機構と自己修正機能を備え、インライン編集やコード補完などのローカルインタラクティブワークフローに特化しており、Apache 2.0 ライセンスで公開されている。(出典:AiHot)
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。