里約熱內盧政府開放了具有增強隱性推理能力的 397B 參數 AI 模型

iconKuCoinFlash
分享
AI summary icon精華摘要
ME AI 消息,根據動察 Beating 監測,巴西里約市政府旗下市政資訊與規劃公司 IplanRIO 在 Hugging Face 開源 Rio-3.5-Open-397B。該模型基於 Qwen 3.5 397B 後訓練,採用 MoE 架構,總參數約 3970 億,單 Token 激活約 170 億參數,支援約 100 萬 Token 上下文,並以 MIT 協議開放。模型卡顯示,Rio-3.5-Open-397B 集成了 SwiReasoning 推理框架。SwiReasoning 是一種免訓練推理方法,會根據資訊熵變化,在顯式思維鏈與隱式向量空間推理之間切換。顯式推理負責將結論寫成自然語言 Token,隱式推理則在隱藏空間中探索多條路徑,減少不必要的文字輸出。團隊披露的測試顯示,Rio-3.5-Open-397B 在啟用隱式推理後,SWE-Bench Pro 得分為 58.1,IMOAnswerBench 得分為 89.5。作為對照,Qwen 3.5 397B 原版分別為 50.9 和 80.9,僅後訓練且不啟用隱式推理時分別為 54.8 和 84.5。也就是說,隱式推理並未讓模型絕對性能翻倍,但讓相對於基座模型的提升幅度接近翻倍。相容性是主要限制。Hugging Face 討論區中,團隊成員確認這些公開分數是在啟用 SwiReasoning 後取得的。SwiReasoning 需要在推理時輸入機率加權的連續「軟嵌入」向量,而 llama.cpp 這類只支援離散 Token ID 生成的推理引擎暫時無法完整實現。團隊稱,不啟用隱式推理時模型仍明顯強於 Qwen 3.5 397B 原版,但完整能力需要推理框架適配軟嵌入輸入。(來源:BlockBeats)
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露