Nvidia 的 GB300 NVL72 達到每兆瓦 61.4K 個 AI 代理，比 H200 提升 20 倍

Nvidia 剛剛公布了一組數字，應足以讓每位資料中心運營商驚訝不已。該公司新款的 GB300 NVL72 系統每消耗一兆瓦電力，可處理 61,400 個並行 AI 執行個體，而上一代 H200 僅能處理 2,600 個。

這代表每單位能源的代理密度提升了 20 倍。對於電力成本正迅速成為成長瓶頸的產業而言，這不僅是規格表上的炫耀，更是推理經濟結構的轉變。

架子裡有什麼

GB300 NVL72 基於 NVIDIA 的 Blackwell Ultra 架構，將 72 顆 Blackwell Ultra GPU 和 36 顆 Grace CPU 整合於單一液冷機櫃中。該系統整合了約 20 至 21 TB 的 HBM3e 記憶體，並提供 130 TB/s 的 NVLink 帶寬，這是一條內部資料高速公路，可確保所有 GPU 之間無瓶頸地相互通訊。

Nvidia 表示，該平台的 AI 工廠輸出量比其舊有的 Hopper 世代系統高出高達 50 倍。它還聲稱每用戶每秒的 token 數量提升 10 倍，每瓦特的吞吐量提升 5 倍。

該系統包含軟體層級的優化，例如 WideEP/DeepEP 和融合的專家混合（MoE）技術，旨在從每瓦電力和每個 GPU 周期中榨取更多有效運算。MoE 是一種路由系統，僅啟用與特定查詢相關的模型部分，而非每次均觸發所有神經元。

性能已使用由 Artificial Analysis 專為評估面向代理的 AI 表現而開發的基準測試 AgentPerf 進行驗證。該基準測試運行了 DeepSeek V4 Pro 模型（一種 MoE 架構），並為每個代理設定了每秒 20 或 60 個標記的服務級別目標。

誰正在部署它

GB300 NVL72 已獲得最重要雲端供應商的承諾。微軟 Azure 正在部署首個以該系統為核心的大規模叢集，這些機櫃預計將從 2025 年底開始為 OpenAI 的工作負載提供動力，並持續至 2026 年。

CoreWeave 已宣布推出首個 GB300 NVL72 生產实例，成為 GPU 雲端領域的早期先行者。Oracle Cloud Infrastructure 也已列入部署計劃中。

這對投資者意味著什麼

與 H200 相比，20 倍的效率提升為資料中心運營商帶來了直接的投資回報計算：在 GB300 硬體上，相同的電力範圍理論上可支援 20 倍更多的代理。

與 Hopper 平台相比，Nvidia 的輸出提升達 50 倍，且每瓦特的吞吐量高出五倍，這為其向注重 ESG 的機構投資者提供了可信的敘述。隨著監管機構和股東日益關注人工智慧基礎設施的能源消耗，每千瓦時能提供更高智能的系統將在採購決策中獲得期權費。