PrismML、デバイス内使用向けに0.93GBの画像生成モデル「Bonsai4B」をオープンソース化

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
PrismMLは、ラップトップやスマートフォン向けに最適化されたBonsai Image 4Bモデルをオープンソース化しました。このモデルは、0.93GBと1.21GBのサイズを持つ2つの超圧縮バージョン——1ビット版とテルナリ版——を提供し、それぞれフルモデルの88%と95%のパフォーマンスを維持しながら、オフラインデプロイを通じてリスクオン資産戦略をサポートします。iOSアプリ「Bonsai Studio」により、iPhoneユーザーはクラウドAPIリクエストなしで画像を生成できます。これらのモデルはApache 2.0ライセンス下で提供されており、CFTの透明性促進活動と整合しています。
ME AI ニュース、動察 Beating の監視によると、PrismML が開発したオープンソースのエッジ側画像生成モデル「Bonsai Image 4B」は、ノートパソコンやスマートフォンなどのローカルデバイス上で直接拡散推論を実行可能です。Bonsai Image 4B は、1-bit と Ternary(三値化)の2つの極小圧縮バージョンを含み、核心となる拡散 Transformer のサイズはそれぞれ 0.93 GB と 1.21 GB であり、Apple Silicon デバイスでの完全なデプロイパッケージサイズはそれぞれ 3.42 GB と 3.88 GB です。また、エッジ側オフライン画像生成を実現するための iOS アプリ「Bonsai Studio」も同時にリリースされました。 特に、1-bit バージョンは低メモリハードウェア向けに設計されており、7.75 GB の FLUX.2 Klein 4B をベースとした拡散 Transformer を、フル精度バージョンの 8.3 分の 1 に圧縮し、わずか 0.93 GB のスペースしか消費しません。Ternary バージョンの核心 Transformer サイズは 1.21 GB で、フル精度バージョンと比較して 6.4 倍小型化されていますが、量子化プロセスで {-1, 0, +1} の三値化重みを導入することで、より高い表現柔軟性を実現し、低ストレージ使用量を維持しながら画質とプロンプト忠実度を向上させています。 評価によると、Bonsai Image 4B は大幅なサイズ圧縮後も、オブジェクト構成、人間の好み、美学指標、複雑なプロンプトの遵守能力において、はるかに大きなパラメータ数を持つ主流画像生成モデルと対抗できる性能を保持しています。1-bit と Ternary の両バージョンは、それぞれフル精度モデルの 88% と 95% の性能を維持しています。同時にリリースされたモバイルアプリ「Bonsai Studio」により、ユーザーは iPhone 上で完全オフラインの画像生成が可能となり、処理はすべてローカルで完了し、サブスクリプション不要でクラウドへの API 要求も一切発生しません。PrismML は現在、1-bit と Ternary の両バージョンを Apache 2.0 ライセンスでオープンソースとして公開しています。(出典:BlockBeats)
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。