OpenBMBは、MiniCPM5シリーズの最初のモデルであるMiniCPM5-1Bをリリースしました。このモデルは大規模モデルと直接競合することを目的とせず、ローカルのAIエージェントをスマートフォンなどの消費者向けデバイス上で実行できるようにすることを目的としています。このモデルのパラメータ数は10億で、MCPとネイティブツール呼び出しをサポートしており、クラウド接続に依存せずに軽量エージェントタスクを実行することに重点を置いています。
主にエッジデプロイと長いコンテキストを強調
製品の位置付けから見ると、MiniCPM5-1Bの強みは知識の広さではなく、「より小さなサイズでより多くのタスクを実行する」ことです。モデルのコンテキストウィンドウは128Kに達し、長文ドキュメント、継続的な対話、長いタスクチェーンを処理できます。10億パラメータのモデルとして、この仕様はエッジデバイスアプリケーションの実用的な範囲に近づいています。
記事によると、このモデルはノートの読み取り、PDFの要約、ドキュメントに関連する質問への回答に使用でき、ローカルでカレンダーやデータベース、外部研究サービスを呼び出すことも可能です。MCPサーバーと組み合わせれば、ウェブ検索などの機能をローカルワークフローに統合できます。
- パラメータ数:10億
- コンテキストウィンドウ:128K
- サポート機能:MCP、ネイティブツール呼び出し
トレーニング方法は効率を重視します
MiniCPM5-1BはMiniCPM4アーキテクチャを基盤としており、その核心技術の一つはInfLLM v2です。このメカニズムは、長文コンテキストの推論時に、各トークンが周囲の少数のトークンとしか相互作用しないことで、計算オーバーヘッドを削減しつつ、精度を可能な限り維持します。
データ処理において、チームはUltraCleanというフィルタリングプロセスを採用し、約8兆のトレーニングトークンでモデルが優れた性能を発揮したと述べています。後学習段階では、強化学習と蒸留手法を組み合わせ、数学、コード、指示の順守などのテストスコアを向上させると同時に、冗長な出力を削減しています。
ベンチマークでリードしていますが、推論は依然として制限されています
OpenBMBが提示した比較結果によると、MiniCPM5-1Bは一般知識、分野知識、コーディング、数学、論理、エージェントタスクなどの複数のテストで、同レベルの競合製品を上回る平均スコアを記録しており、特にエージェント能力と一般知識タスクで優位性が顕著です。
しかし、メディアによる実地テストでは、このモデルが基本的な論理問題で依然として誤りを犯すことが指摘されています。たとえば、明確な罠を含む婚姻法の問題に対して、モデルは問題自体の論理的矛盾を認識せず、一見完璧な法律的分析を提供しました。別のテストでは、モデルが二択の質問に対して直接的な回答をせず、代わりに折衷的な返答を好む傾向がありました。
これにより、MiniCPM5-1Bは軽量タスクやツール呼び出しのシナリオに適しており、単独で高精度な事実判断を担うには向いていません。報道によると、外部ツールや研究サーバーに接続すれば、このような小型モデルのマイナーな事実問題における幻覚発生率は大幅に低下する見込みです。
ダウンロードが可能になりました
現在、MiniCPM5-1B は Hugging Face で Apache 2.0 ライセンスのもと公開されており、vLLM、SGLang、Transformers の推論フレームワークと互換性があります。エッジAIにおいて、ローカルで実行可能でツールを呼び出せ、長文コンテキストを保持できるこのような小規模モデルは、研究プロジェクトから実用製品へと徐々に移行しつつあります。
