MEニュース:5月19日(UTC+8)、Beating監視によると、字節跳動(ByteDance Research)が、ネイティブな統合マルチモーダル大規模モデル「Lance」を正式にオープンソース化しました。このモデルは、アクティブパラメータがわずか3Bの軽量モデルで、単一のフレームワーク内で画像と動画の理解、生成、編集を同時にサポートします。現在の主流な統合モデルは、パラメータ規模の拡大やテキストから画像を生成するアーキテクチャに依存していますが、Lanceは極めて低リソースでの協調アプローチを実現しました。開発チームはモデルをゼロから完全にトレーニングし、全体のトレーニング計算予算を128枚のA100 GPUに抑えました。異なるモダリティとタスク間の内部衝突を解決するため、Lanceはアーキテクチャ上で2つの厳格な分離を採用しています:- 共通の底層コンテキストを共有しながら、理解と生成の計算パスを分離するため、双方向混合エキスパート(MoE)アーキテクチャを採用。- 画像と動画の非同質なビジュアルトークン間の信号干渉を直接軽減するため、モダリティ感知型回転位置エンコーディングを導入。極端な計算リソース圧縮にもかかわらず、性能の上限は低下していません。アクティブパラメータが3Bという極小規模ながら、Lanceは画像および動画の生成・編集性能において、ほとんどのベンチマークテストで既存のオープンソース統合モデルを上回り、小パラメータで生成と意味的理解を両立する低コストの道筋を実証しました。(出典:BlockBeats)
ByteDance、128台のA100 GPUで学習させた3Bパラメーターのマルチモーダルモデル「Lance」をオープンソース化
KuCoinFlash共有






バイテンドは5月19日、128枚のA100 GPUを使用して訓練した30億パラメータのマルチモーダルモデル「Lance」をオープンソース化しました。このモデルは、画像と動画のタスクを1つのフレームワークで処理します。オンチェーンデータによると、AI駆動の暗号資産プロジェクトに対するオープンインターレストが増加しています。Lanceは、デュアルストリームMoE設計とモダリティ認識回転エンコーディングを採用し、性能を維持しながらコストを削減しています。今四半期、AI関連トークンのオープンインターレストは着実に増加しています。
出典:原文を表示
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。
デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。