Nvidia 剛剛公布了一組數字,應足以讓每位資料中心運營商驚訝不已。該公司新款的 GB300 NVL72 系統每消耗一兆瓦電力,可處理 61,400 個並行 AI 執行個體,而上一代 H200 僅能處理 2,600 個。
這代表每單位能源的代理密度提升了 20 倍。對於電力成本正迅速成為成長瓶頸的產業而言,這不僅是規格表上的炫耀,更是推理經濟結構的轉變。
架子裡有什麼
GB300 NVL72 基於 NVIDIA 的 Blackwell Ultra 架構,將 72 顆 Blackwell Ultra GPU 和 36 顆 Grace CPU 整合於單一液冷機櫃中。該系統整合了約 20 至 21 TB 的 HBM3e 記憶體,並提供 130 TB/s 的 NVLink 帶寬,這是一條內部資料高速公路,可確保所有 GPU 之間無瓶頸地相互通訊。
Nvidia 表示,該平台的 AI 工廠輸出量比其舊有的 Hopper 世代系統高出高達 50 倍。它還聲稱每用戶每秒的 token 數量提升 10 倍,每瓦特的吞吐量提升 5 倍。
該系統包含軟體層級的優化,例如 WideEP/DeepEP 和融合的專家混合(MoE)技術,旨在從每瓦電力和每個 GPU 周期中榨取更多有效運算。MoE 是一種路由系統,僅啟用與特定查詢相關的模型部分,而非每次均觸發所有神經元。
性能已使用由 Artificial Analysis 專為評估面向代理的 AI 表現而開發的基準測試 AgentPerf 進行驗證。該基準測試運行了 DeepSeek V4 Pro 模型(一種 MoE 架構),並為每個代理設定了每秒 20 或 60 個標記的服務級別目標。
誰正在部署它
GB300 NVL72 已獲得最重要雲端供應商的承諾。微軟 Azure 正在部署首個以該系統為核心的大規模叢集,這些機櫃預計將從 2025 年底開始為 OpenAI 的工作負載提供動力,並持續至 2026 年。
CoreWeave 已宣布推出首個 GB300 NVL72 生產实例,成為 GPU 雲端領域的早期先行者。Oracle Cloud Infrastructure 也已列入部署計劃中。
這對投資者意味著什麼
與 H200 相比,20 倍的效率提升為資料中心運營商帶來了直接的投資回報計算:在 GB300 硬體上,相同的電力範圍理論上可支援 20 倍更多的代理。
與 Hopper 平台相比,Nvidia 的輸出提升達 50 倍,且每瓦特的吞吐量高出五倍,這為其向注重 ESG 的機構投資者提供了可信的敘述。隨著監管機構和股東日益關注人工智慧基礎設施的能源消耗,每千瓦時能提供更高智能的系統將在採購決策中獲得期權費。
