মাইক্রোসফট এজুর এনভিডিয়া H200 GPU ব্যবহার করে নতুন এআই ট্রেনিং রেকর্ড স্থাপন করেছে

মাইক্রোসফ্টের এজুর ক্লাউড প্ল্যাটফর্ম এখন পর্যন্ত সবচেয়ে বড় প্রতিবেদিত স্কেলে সবচেয়ে দ্রুত AI ট্রেনিং ফলাফল পোস্ট করেছে, যা নভিডিয়ার সাথে গভীর সহযোগিতার মাধ্যমে সম্ভব হয়েছে। ১৮ মার্চ, ২০২৫-এ ঘোষিত এই অর্জনটি MLPerf Training v4.1 বেঞ্চমার্কে রেকর্ড-সেটিং পারফরম্যান্সের উপর কেন্দ্রীভূত, যা মেশিন লার্নিং হার্ডওয়্যার পারফরম্যান্স পরিমাপের জনপ্রিয় স্বতন্ত্র মানদণ্ড।

ফলাফলের পিছনের কনফিগারেশন: আগের H100 GPU-এ ভিত্তিক সেটআপের তুলনায় 512টি Nvidia H200 GPU একসাথে কাজ করে 28% পারফরম্যান্স উন্নতি করেছে।

বিজ্ঞাপন

বেঞ্চমার্কগুলি বাস্তবে কী দেখায়

পূর্বের 2023 বেঞ্চমার্কগুলিতে, এজুর দেখিয়েছিল যে এটি 10,752 H100 GPU-এ প্রায় 4 মিনিটে 175 বিলিয়ন প্যারামিটার সহ একটি GPT-3 মডেল ট্রেন করতে পারে। নতুন H200-ভিত্তিক কনফিগারেশনটি সেই ভিত্তির উপর ভিত্তি করে প্রতি GPU-এর জন্য অর্থপূর্ণভাবে উন্নত পারফরম্যান্স দিয়েছে, যা তুলনামূলক ট্রেনিং গতি অর্জনের জন্য প্রয়োজনীয় হার্ডওয়্যারের পরিমাণ কমিয়েছে।

এই ফলাফলের পিছনের ফুল স্ট্যাক শুধু নতুনতম GPU ব্যবহার করার চেয়েও বেশি। মাইক্রোসফট হার্ডওয়্যার, নেটওয়ার্কিং এবং সফটওয়্যারের মধ্যে একীভূত উদ্ভাবনের কথা উল্লেখ করেছে। এই সেটআপ Nvidia Quantum InfiniBand নেটওয়ার্কিং ব্যবহার করে, যা বিতরিত ট্রেনিংয়ের সময় GPU-এর মধ্যে বিশাল ডেটা ট্রান্সফারের চাহিদা পূরণ করে। এটি Nvidia-এর মাইক্রোসার্ভিসগুলি Azure-এর নিজস্ব AI সার্ভিসগুলির সাথে একীভূত করে, যার মধ্যে রয়েছে এর AI Foundry প্ল্যাটফর্ম।

এটি ব্যবহার করছেন কে এবং পরবর্তীতে কী আসছে

জেনারেটিভ ইমেজ মডেলের জন্য পরিচিত এআই কোম্পানি ব্ল্যাক ফরেস্ট ল্যাবস ইতিমধ্যেই তাদের প্রকল্পগুলির জন্য এজুরের নতুন GB200 ভার্চুয়াল মেশিনগুলি ব্যবহার করছে।

এই ক্ষমতাগুলি সমর্থন করার জন্য জিপিইউ লাইনআপ বিভিন্ন প্রজন্মকে কভার করে। এজুর বর্তমানে এইচ২০০, এইচ১০০ এবং জিবি২০০ সিরিজের জিপিইউ-এর উপর ভিত্তি করে কনফিগারেশন প্রদান করে। ২০২৫ সালের শেষের দিকে, মাইক্রোসফট নভিডিয়ার ব্ল্যাকওয়েল আলট্রা জিপিইউগুলি একীভূত করার পরিকল্পনা করছে, যা যুক্তি এবং মাল্টিমোডাল এআই কাজের ক্ষেত্রে পারফরম্যান্স বাড়ানোর জন্য বিশেষভাবে ডিজাইন করা হয়েছে।