Bago lang ni Nvidia itinampok ang isang numero na dapat magpahinga sa bawat operator ng data center. Ang bagong sistema nilang GB300 NVL72 ay kayang tratuhin ang 61,400 na magkakasamang AI agent bawat megawatt ng konsyum na enerhiya, kumpara sa lang 2,600 sa nakaraang henerasyon na H200.
Ito ay isang 20x pagpapabuti sa densidad ng agent bawat yunit ng enerhiya. Para sa isang industriya kung saan ang gastos sa kuryente ay mabilis na naging pinakamalaking paghihigpit sa paglago, hindi ito isang pagpapakita ng mga spesipikasyon. Ito ay isang struktural na pagbabago sa ekonomiks ng inference.
Ano ang nasa loob ng rack
Ang GB300 NVL72 ay binuo sa Blackwell Ultra architecture ng Nvidia, na naglalaman ng 72 Blackwell Ultra GPUs at 36 Grace CPUs sa isang solong liquid-cooled rack. Ang sistema ay nagtatampok ng halos 20 hanggang 21 TB ng HBM3e memory at nag-aalok ng 130 TB/s na NVLink bandwidth, na ang mga ito ay ang loobang data highway na nagpapanatili sa pag-uugnay ng lahat ng mga GPU nang walang bottleneck.
Sabi ni Nvidia na ang platform ay nagdadala ng hanggang 50 beses ang output ng AI factory kumpara sa mga lumang sistema ng Hopper generation. Ayon din sa kanila, 10 beses ang mga token bawat segundo bawat user at limang beses ang throughput bawat watt.
Ang sistema ay naglalaman ng mga optimisasyon sa antas ng software tulad ng WideEP/DeepEP at mga pinagsama-samang Mixture of Experts (MoE) teknik, na parehong disenyo upang hikayatin ang mas maraming kapaki-pakinabang na computation mula sa bawat watt at bawat GPU cycle. Ang MoE ay isang routing system na nagpapagana lamang sa mga bahagi ng model na may kinalaman sa isang partikular na query, kesa sa pagpapagana ng lahat ng neuron bawat beses.
Napatunayan ang performance gamit ang benchmark na AgentPerf, na nilikha ng Artificial Analysis partikular para sa pag-e-evaluate ng performance ng agent-oriented AI. Ipinagana ng benchmark ang DeepSeek V4 Pro model, isang MoE architecture, na may service-level objectives na nakatakda sa 20 o 60 tokens per second bawat agent.
Sino ang nagde-deploy nito
Ang GB300 NVL72 ay nakakakuha na ng mga komitment mula sa mga cloud provider na pinakamahalaga. Ang Microsoft Azure ay nagde-deploy ng unang malaking cluster na binubuo ng sistema, at inaasahan na ang mga rack na ito ay magpapagana sa mga workload ng OpenAI simula sa huling bahagi ng 2025 at magpapatuloy hanggang 2026.
Kinumpirma ni CoreWeave ang mga unang production instances ng GB300 NVL72, nagpapakilala bilang isang maagang tagapaglalayong sa GPU cloud space. Ang Oracle Cloud Infrastructure ay nasa pipeline ng pag-deploy din.
Ano ang ibig sabihin nito para sa mga investor
Ang 20x na pagtaas ng efficiency kumpara sa H200 ay gumagawa ng direkta na kalkulasyon ng ROI para sa mga operator ng data center: ang parehong envelope ng kapangyarihan ay teoretikal na makakasuporta sa 20 beses na higit pang mga agent sa hardward na GB300.
Isang 50x pagpapabuti sa output kumpara sa mga platform na Hopper, kasama ang limang beses na mas mataas na throughput bawat watt, ay nagbibigay kay Nvidia ng kredibleng kuwento para sa mga institusyonal na investor na may pag-aalala sa ESG. Habang lalong pinagsusuri ng mga regulador at mga shareholder ang enerhiyang footprint ng AI infrastructure, ang mga sistema na nagtataglay ng higit na intelihensya bawat kilowatt-hour ay magiging may premium sa mga desisyon sa pagbili.
