Платформа облачных вычислений Microsoft Azure только что показала самые быстрые результаты обучения ИИ на крупнейшем из когда-либо зарегистрированных масштабах благодаря углубленному сотрудничеству с Nvidia. Достижение, объявленное 18 марта 2025 года, основано на рекордных результатах в тестах MLPerf Training v4.1 — широко признанном независимом стандарте для измерения производительности аппаратного обеспечения для машинного обучения.
Конфигурация, лежащая в основе результатов: 512 GPU Nvidia H200, работающих совместно, обеспечивающие повышение производительности на 28% по сравнению с предыдущими установками на базе GPU H100.
Что на самом деле показывают эталонные показатели
В предыдущих тестах 2023 года Azure показал, что может обучить модель GPT-3 с 175 миллиардами параметров на 10 752 GPU H100 за примерно 4 минуты. Новая конфигурация на базе H200 строится на этой основе и обеспечивает значительно лучшую производительность на каждом GPU, что снижает общее количество необходимого оборудования для достижения сопоставимой скорости обучения.
Полный стек, лежащий в основе этих результатов, выходит далеко за рамки простой замены на более новые GPU. Microsoft указала на интегрированные инновации в области аппаратного обеспечения, сетевых технологий и программного обеспечения. Данная конфигурация использует сетевые технологии Nvidia Quantum InfiniBand, которые справляются с огромными требованиями к передаче данных между GPU во время распределенного обучения. Также в нее входят микросервисы Nvidia наряду с собственными AI-сервисами Azure, включая платформу AI Foundry.
Кто уже использует это и что будет дальше
Black Forest Labs, компания в области ИИ, известная своими генеративными моделями изображений, уже использует новые виртуальные машины GB200 от Azure для своих проектов.
Линейка GPU, поддерживающих эти возможности, охватывает несколько поколений. В настоящее время Azure предлагает конфигурации на базе GPU серий H200, H100 и GB200. Во второй половине 2025 года Microsoft планирует интегрировать GPU Nvidia Blackwell Ultra, специально разработанные для повышения производительности при выполнении задач, связанных с рассуждением и мультимодальным ИИ.
