Google DeepMind、Gemma 4マルチモーダルモデルファミリーをオープンソース化

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
Google DeepMindは、Gemma 4マルチモーダルモデルファミリーをオープンソース化しました。これは仮想通貨ニュース分野における重要なアップデートです。これらのモデルはテキスト、画像、音声の入力を処理し、出力はテキスト形式です。4つのサイズがあり、140以上の言語をサポートしています。高性能な推論とデバイスエンド最適化を目的として設計されており、開発者や研究者に最適です。このリリースは、仮想通貨ニュース分野におけるAIツールへの関心の高まりにさらに一層加わります。

MEニュース:4月3日(UTC+8)、Google DeepMindは、Gemma 4マルチモーダルモデルファミリーをオープンソース化しました。このモデルシリーズは、テキストと画像の入力(小規模モデルはオーディオも対応)を受け付け、テキスト出力を生成し、事前学習版と指令微調整版を含み、コンテキストウィンドウは最大256Kトークンまで対応し、140種類以上の言語をサポートしています。モデルは密結合(Dense)と混合エキスパート(MoE)の2つのアーキテクチャを採用しており、E2B、E4B、26B A4B、31Bの4つのサイズがあります。主な機能には、高性能推論、拡張マルチモーダル処理、デバイス端末最適化、コンテキストウィンドウの拡大、エンコーディングおよびエージェント機能の強化、ネイティブなシステムプロンプト対応が含まれます。技術的詳細では、モデルはハイブリッドアテンションメカニズムを採用し、グローバルレイヤーでは統一されたキー・バリュー対と比例RoPE(p-RoPE)を使用しています。E2BとE4Bモデルは逐層埋め込み(PLE)技術を採用しており、有効パラメータ数は総パラメータ数より少ないです。一方、26B A4B MoEモデルは推論時に3.8Bのパラメータのみを活性化し、実行速度は4Bパラメータモデルに近いです。(出典:InFoQ)

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。