NvidiaのGB300 NVL72は、1メガワットあたり61.4KのAIエージェントを実現し、H200よりも20倍優れています

Nvidiaは、データセンター運用者全員が驚くような数値を発表しました。同社の新製品GB300 NVL72システムは、消費電力1メガワットあたり61,400個の同時AIエージェントを処理可能で、前世代のH200の2,600個と比較して大幅に向上しています。

これは単位エネルギーあたりのエージェント密度で20倍の改善です。電力コストが成長の制約要因として急速に浮上している業界において、これは仕様書の自慢ではなく、推論の経済構造における構造的変化です。

ラックの中には何がありますか

GB300 NVL72は、NVIDIAのBlackwell Ultraアーキテクチャを基盤とし、1つの液体冷却ラックに72個のBlackwell Ultra GPUと36個のGrace CPUを統合しています。このシステムは約20～21TBのHBM3eメモリを搭載し、130TB/sのNVLinkバンド幅を提供します。NVLinkは、これらのGPU同士がボトルネックなしで通信するための内部データハーバーです。

Nvidiaは、このプラットフォームが従来のHopper世代システムと比較してAIファクトリーの出力が最大50倍になると述べています。また、ユーザーあたりの秒間トークン数が10倍、ワットあたりのスループットが5倍になると主張しています。

システムには、WideEP/DeepEPや融合されたMixture of Experts（MoE）技術などのソフトウェアレベルの最適化が含まれており、これらは各ワットおよび各GPUサイクルからより多くの有用な計算を引き出すことを目的としています。MoEは、毎回すべてのニューロンを活性化するのではなく、与えられたクエリに関連するモデルの部分のみを活性化するルーティングシステムです。

パフォーマンスは、Artificial Analysisがエージェント指向AIのパフォーマンス評価のために開発したベンチマークAgentPerfを用いて検証されました。このベンチマークでは、MoEアーキテクチャであるDeepSeek V4 Proモデルを、エージェントあたり20トークンまたは60トークン每秒のサービスレベル目標で実行しました。

誰がそれを展開しているのか

GB300 NVL72は、最も重要なクラウドプロバイダーから既にコミットメントを獲得しています。Microsoft Azureは、このシステムを基盤とした初の大規模クラスターを導入しており、これらのラックは2025年末から2026年にかけてOpenAIのワークロードを駆動すると予想されています。

CoreWeaveは、GB300 NVL72の最初の本番インスタンスを発表し、GPUクラウド分野での早期参入者として位置づけました。Oracle Cloud Infrastructureも展開のパイプラインにあります。

これは投資家にとって何を意味するのか

H200と比較して20倍の効率向上により、データセンター運営者にとって直接的なROI計算が可能になります。同じ電力枠内で、GB300ハードウェアを用いれば理論上20倍のエージェントをサポートできます。

Hopperプラットフォームと比較して50倍の出力改善と、ワットあたりのスループットが5倍になることで、NvidiaはESGに配慮する機関投資家にとって説得力のある物語を提供します。規制当局や株主がAIインフラのエネルギー消費量をますます厳しく監視する中、キロワット時あたりより多くの知能を提供するシステムは、調達決定においてプレミアムを獲得します。