PyTorch, H100 ve B200 GPU'larında LayerNorm ve RMSNorm performansını optimize ediyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
PyTorch, NVIDIA H100 ve B200 GPU'larında LayerNorm ve RMSNorm performansını optimize eden bir proje duyurusu yayınladı. torch.compile kullanarak ekip, her çekirdek verimliliğini artırdı ve otomatik birleştirme sağladı. Bu güncelleme, derin öğrenme topluluğundan devam eden zincir üstü haberlerin bir parçasıdır. Daha fazla bilgi resmi blogda mevcuttur.

ME Haberleri, 8 Nisan (UTC+8), PyTorch resmi, недавно LayerNorm ve RMSNorm gibi iki temel normalleştirme yöntemini NVIDIA H100 ve B200 GPU’larda torch.compile kullanırken performansını değerlendirdi ve geliştirdi. Hedefi, bu işlemlerin her bir çekirdek bazında neredeyse en ileri seviyede performans sağlaması ve otomatik birleştirme işlevi sunmasıdır. Resmi duyuruda, daha ayrıntılı içerik için bir bağlantı yer alıyor. (Kaynak: InFoQ)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.