里約熱內盧政府開放了具有增強隱性推理能力的 397B 參數 AI 模型

ME AI 消息，根據動察 Beating 監測，巴西里約市政府旗下市政資訊與規劃公司 IplanRIO 在 Hugging Face 開源 Rio-3.5-Open-397B。該模型基於 Qwen 3.5 397B 後訓練，採用 MoE 架構，總參數約 3970 億，單 Token 激活約 170 億參數，支援約 100 萬 Token 上下文，並以 MIT 協議開放。模型卡顯示，Rio-3.5-Open-397B 集成了 SwiReasoning 推理框架。SwiReasoning 是一種免訓練推理方法，會根據資訊熵變化，在顯式思維鏈與隱式向量空間推理之間切換。顯式推理負責將結論寫成自然語言 Token，隱式推理則在隱藏空間中探索多條路徑，減少不必要的文字輸出。團隊披露的測試顯示，Rio-3.5-Open-397B 在啟用隱式推理後，SWE-Bench Pro 得分為 58.1，IMOAnswerBench 得分為 89.5。作為對照，Qwen 3.5 397B 原版分別為 50.9 和 80.9，僅後訓練且不啟用隱式推理時分別為 54.8 和 84.5。也就是說，隱式推理並未讓模型絕對性能翻倍，但讓相對於基座模型的提升幅度接近翻倍。相容性是主要限制。Hugging Face 討論區中，團隊成員確認這些公開分數是在啟用 SwiReasoning 後取得的。SwiReasoning 需要在推理時輸入機率加權的連續「軟嵌入」向量，而 llama.cpp 這類只支援離散 Token ID 生成的推理引擎暫時無法完整實現。團隊稱，不啟用隱式推理時模型仍明顯強於 Qwen 3.5 397B 原版，但完整能力需要推理框架適配軟嵌入輸入。（來源：BlockBeats）