リオデジャネイロ政府、強化された暗黙的推論機能を備えた3970億パラメータのAIモデルを公開

ME AI ニュース：動察 Beating の監視によると、ブラジル・リオデジャネイロ市が運営する市政情報・計画会社 IplanRIO が Hugging Face で Rio-3.5-Open-397B をオープンソース公開しました。このモデルは Qwen 3.5 397B をベースに後学習され、MoE アーキテクチャを採用しており、総パラメータ数は約3970億、1トークンあたりの活性化パラメータ数は約170億、約100万トークンのコンテキストをサポートし、MIT ライセンスで公開されています。モデルカードによると、Rio-3.5-Open-397B は SwiReasoning 推論フレームワークを統合しています。SwiReasoning はトレーニング不要な推論手法で、情報エントロピーの変化に基づいて、明示的な思考チェーンと暗黙的なベクトル空間推論の間で切り替えます。明示的推論は結論を自然言語トークンとして出力し、暗黙的推論は隠蔽空間内で複数のパスを探索することで、不要なテキスト出力を削減します。チームが公開したテスト結果では、暗黙的推論を有効にした場合、Rio-3.5-Open-397B の SWE-Bench Pro スコアは 58.1、IMOAnswerBench スコアは 89.5 でした。対照として、元の Qwen 3.5 397B はそれぞれ 50.9 と 80.9、後学習のみで暗黙的推論を無効にした場合は 54.8 と 84.5 でした。つまり、暗黙的推論によってモデルの絶対性能が2倍になったわけではありませんが、基盤モデルに対する相対的な改善幅はほぼ2倍に近づいています。互換性が主な制約です。Hugging Face のディスカッションボードでチームメンバーは、これらの公開スコアが SwiReasoning を有効にした状態で得られたことを確認しています。SwiReasoning は推論時に確率重み付きの連続「ソフト埋め込み」ベクトルを入力する必要があり、llama.cpp などの離散トークン ID の生成のみをサポートする推論エンジンでは現在のところ完全な実装が不可能です。チームは、暗黙的推論を無効にした場合でもモデルは依然として元の Qwen 3.5 397B よりも明確に優れていると述べていますが、完全な能力を発揮するには推論フレームワークがソフト埋め込み入力をサポートする必要があります。（出典：BlockBeats）