Ang Azure cloud platform ng Microsoft ay nag-post ng pinakamabilis na mga resulta sa pag-train ng AI sa pinakamalaking nailapag na iskala, na pinapagana ng mas malalim na pagkakasundo sa Nvidia. Ang tagumpay, na inihayag noong Marso 18, 2025, ay nakatuon sa rekord na pagganap sa mga benchmark ng MLPerf Training v4.1, ang malawakang kilalang independiyenteng pamantayan para sa pagsukat ng pagganap ng hardware sa machine learning.
Ang konfigurasyon sa likod ng mga resulta: 512 Nvidia H200 GPUs na gumagawa nang magkakasama, nagdadala ng 28% pagpapabuti sa performance kumpara sa mga nakaraang setup na batay sa H100 GPUs.
Ano nga ba ang ipinapakita ng mga benchmark
Sa mga nakaraang benchmark noong 2023, ipinakita ng Azure na kaya nitong itrain ang isang GPT-3 model na may 175 bilyong parameter sa 10,752 H100 GPUs sa halos 4 minuto. Ang bagong konfigurasyon batay sa H200 ay bumubuo sa base na ito na may mas makabuluhang mas mahusay na performance bawat GPU, na nagpapababa ng kabuuang kailangang hardware upang makamit ang katumbas na bilis ng pagtrain.
Ang buong stack sa likod ng mga resultang ito ay higit pa sa pagpalit lamang ng mas bagong GPUs. Sinipi ng Microsoft ang mga integradong inobasyon sa hardware, networking, at software. Ang setup ay gumagamit ng Nvidia Quantum InfiniBand networking, na nag-aangkop sa malalaking pangangailangan sa pag-transfer ng data sa pagitan ng mga GPU habang nagpapatakbo ng distributed training. Kasama rin dito ang mga microservices ni Nvidia kasama ang sariling AI services ng Azure, kabilang ang kanilang AI Foundry platform.
Sino na ang gumagamit nito at ano ang susunod
Ang Black Forest Labs, ang kompanya sa AI na kilala sa mga generative image model nito, ay nagagamit na ang mga bagong virtual machine na GB200 ng Azure para sa mga proyekto nito.
Ang mga GPU na sumusuporta sa mga kakayahan na ito ay sumasaklaw sa maraming henerasyon. Kasalukuyang binibigyan ng Azure ang mga konpigurasyon na nakabatay sa mga GPU ng H200, H100, at GB200 series. Sa huli ng 2025, plano ni Microsoft na i-integrate ang Nvidia’s Blackwell Ultra GPUs, na partikular na disenyo upang palakasin ang performance sa reasoning at multimodal AI workloads.
