PyTorch H100 এবং B200 GPU-এ LayerNorm এবং RMSNorm-এর পারফরম্যান্স অপ্টিমাইজ করেছে

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
PyTorch একটি প্রকল্প ঘোষণা করেছে যা NVIDIA H100 এবং B200 GPU-এ LayerNorm এবং RMSNorm-এর কার্যক্ষমতা অপ্টিমাইজ করে। torch.compile ব্যবহার করে, দলটি প্রতিটি কার্নেলের দক্ষতা উন্নত করেছে এবং অটোমেটিক ফিউশন সক্ষম করেছে। এই আপডেটটি ডিপ লার্নিং সম্প্রদায়ের চলমান অন-চেইন খবরের অংশ। আরও বিস্তারিত জানতে অফিসিয়াল ব্লগটি দেখুন।

ME সংবাদ, ৮ এপ্রিল (UTC+8), পাইটর্চ অফিসিয়াল সাম্প্রতিক যাচাই ও উন্নতি করেছেন LayerNorm এবং RMSNorm এই দুটি মৌলিক নরমালাইজেশন পদ্ধতির পারফরম্যান্স, যা NVIDIA H100 এবং B200 GPU-এ torch.compile ব্যবহার করে। লক্ষ্য হলো এই অপারেশনগুলিকে প্রতিটি কার্নেলের ভিত্তিতে সর্বোত্তম পারফরম্যান্সের কাছাকাছি পৌঁছানো, একসাথে অটোমেটিক ফিউশন সুবিধা প্রদান করে। অফিসিয়াল ঘোষণায় একটি বিস্তারিত তথ্যের লিঙ্ক রয়েছে। (উৎস: InFoQ)

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।