Liquid AI、小規模なマルチモーダルモデルをオープンソース化し、画像から直接JSONデータを抽出可能に

iconKuCoinFlash
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
Liquid AIは、画像から直接JSONデータを抽出するための2つのコンパクトなマルチモーダルモデル、LFM2.5-VL-1.6B-ExtractおよびLFM2.5-VL-450M-Extractをオープンソース化しました。これらのモデルはLFM Open License v1.0の下で提供され、エッジデバイス向けに最適化されており、文書スキャンや産業検査で優れた性能を発揮します。1.6Bモデルは4Bレベルのモデルと同等の性能を発揮し、450Mモデルは2Bレベルのモデルと競合します。これらのツールは、データの透明性を向上させることでCFTの取り組みを支援する可能性があります。これらのモデルは、すでにHugging Faceでダウンロード可能となっています。
ME AIのニュース、動察Beatingの監視によると、Liquid AIは、軽量なマルチモーダルモデルLFM2.5-VL-1.6B-ExtractとLFM2.5-VL-450M-Extractをオープンソース化しました。新モデルは画像の構造化データ抽出に特化しており、ユーザーが指定したフィールドリストに基づいて、従来のマルチモーダルモデルが全文を生成した後に二次解析を行う手順を省き、デバイス上で直接画像をJSON形式のデータに変換できます。新モデルは16億(1.6B)および4.5億(450M)の2つのパラメータ仕様を提供し、LFM Open License v1.0ライセンスで公開されています。公式評価では、新モデルはドキュメントスキャン、車内キャビン理解、産業検査などのシナリオで優れた性能を発揮しています。ベンチマーク評価では、1.6Bモデルの性能は40億(4B)クラスの汎用マルチモーダルモデルと同等であり、450Mモデルは20億(2B)クラスのモデルと同等の性能を発揮します。デプロイ面では、新モデルは各種スマートハードウェアおよびエッジデバイス用SoCに最適化されており、車内キャビン理解、ドキュメントスキャン、産業検査などのエッジシナリオでオフラインデプロイが可能です。Liquid AIはすでにHugging Faceプラットフォームでモデルの重みのダウンロードを公開しています。(出典:MLion)
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。