NVIDIA 開源 550B Nemotron 3 Ultra 模型,採用 Mamba-Transformer 混合 MoE 架構

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
NVIDIA 於 2026 年 6 月 4 日開源了其 550B 的 Nemotron 3 Ultra 模型,採用 Mamba-Transformer 混合 MoE 架構。該模型在 Artificial Analysis 的智慧指數中獲得 48 分,在美國開源權重模型中排名第二。它支援 1 百萬 token 的上下文視窗,內存使用量低,吞吐量高出 5 倍。Agent Toolkit 包含 NemoClaw 和 OpenShell。鏈上分析顯示,AI 驅動的交易工具的未平倉量正在上升。該模型可在 Hugging Face、NVIDIA NIM 和 OpenRouter 上獲取。

根據動察 Beating 監測,英偉達於 6 月 4 日正式開源 5500 億參數、激活 550 億的旗艦大語言模型 Nemotron 3 Ultra,針對複雜規劃、推理和工具調用等長程智能體任務進行了優化。在第三方基準平台 Artificial Analysis 的智能指數中,Nemotron 3 Ultra 得分 48 分,是目前美國本土性能最強的開源權重模型,僅次於月之暗面得分 54 分的 Kimi K2.6。技術架構上,模型採用 Mamba-Transformer 混合專家架構 MoE,透過交替使用 Mamba-2 狀態空間模型層與 Transformer 自注意力層,規避了超長上下文下 KV 緩存呈二次方增長的記憶體瓶頸,在極低記憶體開銷下支援 100 萬 token 的上下文視窗。相比同規模 dense 模型,混合架構在智能體任務下提升了 5 倍吞吐量,並降低了 30% 的推理成本。生態配套上,英偉達同步發布了包含 NemoClaw 編排藍圖與 OpenShell 運行時的智能體工具包 Agent Toolkit。開源內容直接包含模型權重、資料集與訓練配方。模型已於 Hugging Face、NVIDIA NIM 及 OpenRouter 上線,企業級 AI 搜尋服務商 Glean 等已宣布接入,用作商業閉源大模型的替代方案。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露