A plataforma de nuvem Azure da Microsoft acaba de registrar os resultados mais rápidos de treinamento de IA na maior escala relatada, impulsionada por uma colaboração aprofundada com a Nvidia. A conquista, anunciada em 18 de março de 2025, centra-se em desempenho recorde nos benchmarks MLPerf Training v4.1, o padrão independente amplamente reconhecido para medir o desempenho de hardware de aprendizado de máquina.
A configuração por trás dos resultados: 512 GPUs Nvidia H200 trabalhando em conjunto, oferecendo uma melhoria de desempenho de 28% em relação a configurações anteriores baseadas em GPUs H100.
O que os benchmarks realmente mostram
Nos benchmarks anteriores de 2023, o Azure demonstrou que conseguia treinar um modelo GPT-3 com 175 bilhões de parâmetros em 10.752 GPUs H100 em aproximadamente 4 minutos. A nova configuração baseada no H200 constrói sobre essa base, oferecendo desempenho significativamente melhor por GPU, reduzindo a quantidade total de hardware necessária para alcançar velocidades de treinamento comparáveis.
A pilha completa por trás desses resultados vai além de apenas substituir GPUs mais antigas por modelos mais recentes. A Microsoft citou inovações integradas em hardware, rede e software. A configuração utiliza a rede Nvidia Quantum InfiniBand, que atende às enormes demandas de transferência de dados entre GPUs durante o treinamento distribuído. Ela também incorpora os microserviços da Nvidia juntamente com os próprios serviços de IA da Azure, incluindo sua plataforma AI Foundry.
Quem já está usando isso e o que vem a seguir
A Black Forest Labs, empresa de IA conhecida por seus modelos gerativos de imagens, já está utilizando as novas máquinas virtuais GB200 da Azure para seus projetos.
A linha de GPUs que suporta essas capacidades abrange várias gerações. O Azure atualmente oferece configurações baseadas nas séries de GPUs H200, H100 e GB200. Mais tarde em 2025, a Microsoft planeja integrar as GPUs Blackwell Ultra da Nvidia, especificamente projetadas para melhorar o desempenho em cargas de trabalho de raciocínio e IA multimodal.
