清华大学とMianbi、世界初のAIコーディング事前学習フレームワーク「ForgeTrain」をオープンソース化
KuCoinFlash清華大学とMianbiは、AI+暗号通貨ニュース用の世界初のAI生成プリトレーニングフレームワーク「ForgeTrain」をオープンソース化しました。このフレームワークはNVIDIAのMegatronを上回り、Huawei Ascend上で10%の速度向上を実現しました。また、トップクラスのコンパクトモデル「MiniCPM5-1B」も生成しました。このプロジェクトは、AIツールの進化に伴い、リアルワールド資産(RWA)ニュースの統合に向けた可能性を示しています。
ME AIのニュース、動察Beatingの監視によると、面壁智能と清华大学NLP実験室はOpenBMBコミュニティで、世界初のAIによって完全に作成された本番レベルの大規模モデル事前学習フレームワーク「ForgeTrain」をオープンソース化し、ForgeTrainで学習されたエッジデバイス用小規模モデル「MiniCPM5-1B」をリリースしました。これは「AIがAIを製造する」エンジニアリングサイクルを初めて実証した事例であり、同じハードウェア条件下でNVIDIAのMegatronを上回る性能を発揮し、華為昇騰での事前学習では10%の高速化を達成しました。また、MiniCPM5-1BはArtificial Analysisのオープンウェイト小規模モデルランキングで第1位にランクインしました。
AIが自ら基礎的な事前学習インフラを構築できるように、面壁智能は「代工エンジニアリング(Forge Engineering)」というソフトウェアプログラミングパラダイムを提唱し、あらゆるハードウェアとタスクに互換性を持つ汎用フレームワークを廃止し、AIの低コストコード生成能力を活用して特定のモデルとハードウェアに合わせて専用コードを即席で生成します。ForgeTrainの構築メカニズムは三段階で構成されています:まず既存の事前学習フレームワークから重要なデータを収集してテスト環境(Harness)を構築し、次に自動閉ループ内でバイナリ一貫性のあるフレームワークコードを反復生成し、最終的に制約を解除して参照実装を上回ります。この自動進化はAIがAIを製造するL3からL4段階に対応しています。
ForgeTrainの最初の成果モデルであるMiniCPM5-1Bは10.8億パラメータを有し、核心アーキテクチャは標準的なLlamaForCausalLMに基づいて設計されており、下流統合と推論デプロイのハードルを大幅に低減しました。Artificial Analysisの評価では、このモデルは20億パラメータ規模のQwen3.5-2B(16点)を上回る18点を獲得し、Qwen3.5-0.8B(11点)とLFM2.5-1.2B-Thinking(8点)を上回りました。モデルはMLX 4-bitおよびGGUF Q4_K_Mなどのデプロイ形式をサポートし、INT4量子化後は重みがわずか0.5GBとなり、原生で131,072トークンの長文コンテキストとenable_thinkingに基づくハイブリッド二重モード推論をサポートしています。極めて低いハードウェアオーバーヘッドを活かして、OpenBMBはオフライン専用のデスクトップフローティングアシスタントアプリ「MiniCPM Desk Pet」もオープンソース化し、Cursorなどの開発ツールにおけるコーディング活動のリアルタイム対応とLoRAによるキャラクター切り替えをサポートしています。
(出典:BlockBeats)免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。
デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。