ME সংবাদ, ৮ এপ্রিল (UTC+8), পাইটর্চ অফিসিয়াল সাম্প্রতিক যাচাই ও উন্নতি করেছেন LayerNorm এবং RMSNorm এই দুটি মৌলিক নরমালাইজেশন পদ্ধতির পারফরম্যান্স, যা NVIDIA H100 এবং B200 GPU-এ torch.compile ব্যবহার করে। লক্ষ্য হলো এই অপারেশনগুলিকে প্রতিটি কার্নেলের ভিত্তিতে সর্বোত্তম পারফরম্যান্সের কাছাকাছি পৌঁছানো, একসাথে অটোমেটিক ফিউশন সুবিধা প্রদান করে। অফিসিয়াল ঘোষণায় একটি বিস্তারিত তথ্যের লিঙ্ক রয়েছে। (উৎস: InFoQ)
PyTorch H100 এবং B200 GPU-এ LayerNorm এবং RMSNorm-এর পারফরম্যান্স অপ্টিমাইজ করেছে
KuCoinFlashশেয়ার






PyTorch একটি প্রকল্প ঘোষণা করেছে যা NVIDIA H100 এবং B200 GPU-এ LayerNorm এবং RMSNorm-এর কার্যক্ষমতা অপ্টিমাইজ করে। torch.compile ব্যবহার করে, দলটি প্রতিটি কার্নেলের দক্ষতা উন্নত করেছে এবং অটোমেটিক ফিউশন সক্ষম করেছে। এই আপডেটটি ডিপ লার্নিং সম্প্রদায়ের চলমান অন-চেইন খবরের অংশ। আরও বিস্তারিত জানতে অফিসিয়াল ব্লগটি দেখুন।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।