Платформа хмарних обчислень Microsoft Azure лише що показала найшвидші результати навчання ШІ на найбільшому звітному масштабі завдяки поглибленій співпраці з Nvidia. Досягнення, оголошене 18 березня 2025 року, стосується рекордних показників у тестах MLPerf Training v4.1 — загальноприйнятого незалежного стандарту для вимірювання продуктивності апаратного забезпечення машинного навчання.
Конфігурація, що лежить в основі результатів: 512 GPU Nvidia H200, що працюють разом, забезпечують покращення продуктивності на 28% порівняно з попередніми настановами на базі GPU H100.
Що насправді показують еталони
У попередніх тестах 2023 року Azure продемонстрував, що може навчати модель GPT-3 з 175 мільярдами параметрів на 10 752 GPU H100 приблизно за 4 хвилини. Нова конфігурація на основі H200 базується на цій основі зі значно кращою продуктивністю на одному GPU, що зменшує загальну кількість необхідного обладнання для досягнення порівнянних швидкостей навчання.
Повний стек, що лежить в основі цих результатів, виходить за межі простої заміни на більш сучасні GPU. Microsoft зазначила інтегровані інновації в апаратному забезпеченні, мережах та програмному забезпеченні. Ця конфігурація використовує мережу Nvidia Quantum InfiniBand, яка справляється з величезними вимогами до переказу даних між GPU під час розподіленого навчання. Вона також поєднує мікросервіси Nvidia разом із власними AI-сервісами Azure, включаючи платформу AI Foundry.
Хто вже використовує це і що буде далі
Black Forest Labs, компанія з штучним інтелектом, відома своїми генеративними моделями зображень, вже використовує нові віртуальні машини GB200 від Azure для своїх проектів.
Лінійка GPU, що підтримують ці можливості, охоплює кілька поколінь. Azure наразі пропонує конфігурації, побудовані навколо GPU серій H200, H100 та GB200. У другій половині 2025 року Microsoft планує інтегрувати GPU Nvidia Blackwell Ultra, які спеціально розроблені для підвищення продуктивності при виконанні завдань з міркуванням та мультимодальному штучному інтелекті.
