مائیکروسافٹ کا Azure کلاؤڈ پلیٹ فارم، نوڈیا کے ساتھ گہری تعاون کے ذریعے، سب سے بڑے اعلان شدہ سیل پر سب سے تیز AI ٹریننگ نتائج پیش کر چکا ہے۔ 18 مارچ، 2025 کو اعلان کیا گیا یہ کامیابی، MLPerf Training v4.1 بینچ مارکس میں ریکارڈ شدہ کارکردگی پر مرکوز ہے، جو مشین لرننگ ہارڈویئر کی کارکردگی کے لیے وسیع طور پر تسلیم شدہ مستقل معیار ہے۔
نتائج کے پیچھے کی ترتیب: 512 Nvidia H200 گپس جو مل کر کام کر رہی ہیں، جو H100 گپس پر بنائے گئے پچھلے سیٹ اپس کے مقابلے میں 28 فیصد کا کارکردگی میں بہتری فراہم کرتی ہیں۔
بنچ مارکس کیا ظاہر کرتے ہیں
پچھلے 2023 کے معیارات میں، ایزور نے دکھایا کہ وہ 175 ارب پیرامیٹرز والے GPT-3 ماڈل کو 10,752 H100 GPU پر تقریباً 4 منٹ میں تربیت دے سکتا ہے۔ نئی H200 بنیادی کنفیگریشن اس بنیاد پر مزید بہتر ہر GPU کی کارکردگی کے ساتھ تعمیر کی گئی ہے، جس سے comparable تربیتی رفتار حاصل کرنے کے لیے ضروری ہارڈویئر کی مقدار کم ہو جاتی ہے۔
ان نتائج کے پیچھے کا مکمل اسٹیک صرف نئے جی پی یو کا تبادلہ کرنا نہیں ہے۔ مائیکروسافٹ نے ہارڈویئر، نیٹ ورکنگ اور سافٹ ویئر میں ادھمیں نوآوریوں کا حوالہ دیا۔ یہ سیٹ اپ نوڈیا کوونٹم انفینی بینڈ نیٹ ورکنگ کا استعمال کرتا ہے، جو تقسیم شدہ تربیت کے دوران جی پی یوز کے درمیان بھاری ڈیٹا ٹرانسفر کی ضروریات کو پورا کرتا ہے۔ اس میں نوڈیا کے مائیکروسروسز کے ساتھ ساتھ ایزور کے اپنے اے آئی سروسز، جن میں اس کا اے آئی فاؤنڈری پلیٹ فارم بھی شامل ہے، شامل ہیں۔
یہ کون استعمال کر رہا ہے اور اگلا کیا ہے
بلاک فارسٹ لیبز، جو اپنے جنریٹو تصویری ماڈلز کے لیے مشہور ہے، اپنے منصوبوں کے لیے Azure کے نئے GB200 ورچوئل ماشینز کا استعمال کر رہی ہے۔
ان صلاحیتوں کو سپورٹ کرنے والی GPU لائن اپ متعدد نسلوں پر مشتمل ہے۔ Azure فی الحال H200، H100 اور GB200 سیریز GPU پر مبنی ترتیبات فراہم کرتا ہے۔ 2025 کے آخر میں، مائیکروسافٹ نکوڈا کے بلاک ویل اولٹرا GPU کو اندراج کرنے کی منصوبہ بندی کر رہا ہے، جو ترکیبی اور متعدد ماڈل AI کاموں میں کارکردگی کو بہتر بنانے کے لیے خصوصی طور پر ڈیزائن کیے گئے ہیں۔
