Hugging Face เปิดตัว Kernels Hub สำหรับตัวดำเนินการ GPU ที่ถูกรวมไว้ล่วงหน้า

iconKuCoinFlash
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ซีอีโอของ Hugging Face ซีลีม เดลังก์ ยืนยันการเปิดตัวอย่างเป็นทางการของ Kernels บน Hub เมื่อวันที่ 15 เมษายน (UTC+8) ซึ่งถือเป็นเหตุการณ์ข่าวบนโซ่ที่สำคัญสำหรับนักพัฒนา Kernels นำเสนอโอเปอเรเตอร์ GPU ที่ถูกคอมไพล์ล่วงหน้า ช่วยเพิ่มความเร็วในการอนุมานและการฝึกอบรมได้ 1.7 ถึง 2.5 เท่า นักพัฒนาสามารถติดตั้งโอเปอเรเตอร์เหล่านี้ได้ด้วยรหัสเพียงหนึ่งบรรทัด โดยการคอมไพล์บนคลาวด์จะถูกจัดการโดย Hugging Face Hub จะจับคู่ฮาร์ดแวร์อัตโนมัติและส่งไฟล์ภายในไม่กี่วินาที ตอนนี้ Kernels เป็นประเภทรีโพสิทอรีระดับสูงสุด ซึ่งรวมถึงโอเปอเรเตอร์ 61 ตัวสำหรับงานทั่วไป รองรับ NVIDIA CUDA, AMD ROCm, Apple Metal และ Intel XPU ข่าวการเปิดตัวโทเค็นนี้เกิดขึ้นหลังจากช่วงเบต้าในเดือนมิถุนายน 2025

ข่าวจาก ME News เมื่อวันที่ 15 เมษายน (UTC+8) ตามการติดตามของ 1M AI News ซีอีโอของ Hugging Face อย่าง Clem Delangue ประกาศเปิดตัว Kernels อย่างเป็นทางการบน Hub GPU kernels คือโค้ดการปรับแต่งระดับพื้นฐานที่ช่วยให้การ์ดจอทำงานด้วยความเร็วสูงสุด สามารถเร่งความเร็วการอนุมานและการฝึกอบรมได้ 1.7 ถึง 2.5 เท่า แต่การติดตั้งเคยเป็นเรื่องยากลำบาก: โดยยกตัวอย่าง FlashAttention ซึ่งเป็นที่นิยมมากที่สุด การคอมไพล์แบบท้องถิ่นต้องใช้หน่วยความจำประมาณ 96GB และใช้เวลาหลายชั่วโมง หากเวอร์ชันของ PyTorch หรือ CUDA ไม่ตรงกันจะเกิดข้อผิดพลาด นักพัฒนาส่วนใหญ่ติดขัดที่ขั้นตอนการติดตั้งนี้ Kernels Hub ย้ายกระบวนการคอมไพล์ไปยังคลาวด์ Hugging Face ได้คอมไพล์ kernels เหล่านี้ล่วงหน้าไว้แล้วในสภาพแวดล้อมการ์ดจอและระบบต่างๆ เมื่อนักพัฒนาเขียนโค้ดเพียงหนึ่งบรรทัด Hub จะจับคู่อุปกรณ์อัตโนมัติและดาวน์โหลดไฟล์ที่ถูกคอมไพล์ล่วงหน้าให้ใช้งานได้ทันทีภายในไม่กี่วินาที กระบวนการเดียวกันสามารถโหลด kernels หลายเวอร์ชันพร้อมกัน และรองรับ torch.compile Kernels เริ่มทดสอบเปิดตัวเมื่อเดือนมิถุนายนปีที่แล้ว และในเดือนนี้ได้รับการอัปเกรดให้เป็นประเภทคลังหลักบน Hub ร่วมกับ Models, Datasets และ Spaces ขณะนี้มี kernels ที่ถูกคอมไพล์ล่วงหน้าแล้ว 61 ตัว ครอบคลุมสถานการณ์ใช้งานทั่วไป เช่น กลไกการให้ความสำคัญ การทำให้เป็นมาตรฐาน การจัดเส้นทางผู้เชี่ยวชาญแบบผสม การลดความละเอียด และรองรับแพลตฟอร์มเร่งความเร็วฮาร์ดแวร์สี่ประเภท ได้แก่ NVIDIA CUDA, AMD ROCm, Apple Metal และ Intel XPU โดยได้รวมเข้ากับเฟรมเวิร์กการอนุมาน TGI และไลบรารี Transformers ของ Hugging Face (แหล่งที่มา: BlockBeats)

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา