Cerebras ทดสอบโมเดล Kimi K2.6 ด้วยความเร็วเพิ่มขึ้น 29 เท่าในงานข้อความยาว

iconKuCoinFlash
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
Cerebras เปิดเผยเมื่อวันที่ 20 พฤษภาคม (UTC+8) ว่าได้ทดสอบโมเดล Kimi K2.6 ที่มีพารามิเตอร์ล้านล้านโดยใช้ชิปขนาดวเฟอร์ ด้วยการติดตั้งชิปโดยตรงบนวเฟอร์ขนาด 12 นิ้วเต็ม บริษัทจึงลดระยะเวลาระหว่างการสื่อสาร ตามรายงานของ Artificial Analysis โมเดลดังกล่าวสร้างข้อความได้ที่อัตรา 981 โทเค็น/วินาที เร็วกว่าบริการ GPU ทั่วไปถึง 6.7 เท่า ในการทดสอบข้อความยาวด้วยอินพุต 10,000 โทเค็นและเอาต์พุต 500 โทเค็น เวลาในการตอบกลับลดลงจาก 163.7 วินาทีเหลือเพียง 5.6 วินาที หรือเพิ่มขึ้น 29 เท่า ข้อมูลบนบล็อกเชนยังคงเน้นย้ำถึงความก้าวหน้าด้านประสิทธิภาพของโครงสร้างพื้นฐาน AI

ข่าวจาก ME News เมื่อวันที่ 20 พฤษภาคม (UTC+8) ตามข้อมูลจาก Beating บริษัทชิปขนาดวัสดุซิลิคอนระดับวเฟอร์ Cerebras ประกาศเปิดใช้งานโมเดลขนาดใหญ่ที่มีพารามิเตอร์ล้านล้านตัวชื่อ Kimi K2.6 ในการทดสอบเชิงธุรกิจ โดยการรวมชิปอย่างสมบูรณ์บนวเฟอร์ซิลิคอนขนาด 12 นิ้ว ซึ่งช่วยขจัดความล่าช้าจากการเชื่อมต่อแบบบอร์ดแบบดั้งเดิมอย่างสิ้นเชิง ผลการทดสอบจากหน่วยงานภายนอก Artificial Analysis แสดงให้เห็นว่าความเร็วในการสร้างข้อมูลอยู่ที่ 981 tokens/s รวดเร็วกว่าบริการคลาวด์ GPU ทั่วไปถึง 6.7 เท่า ในงานข้อความยาวที่มีอินพุต 10,000 token และเอาต์พุต 500 token เวลาตอบสนองรวมลดลงจาก 163.7 วินาทีของอินเทอร์เฟซทางการของ Kimi เหลือเพียง 5.6 วินาที เพิ่มความเร็วขึ้นถึง 29 เท่า เนื่องจากน้ำหนักโมเดลถูกกระจายไปยังวเฟอร์หลายชิ้นเพื่อส่งค่าการกระตุ้นแบบสตรีมมิ่ง การสื่อสารระหว่างชั้นทำงานอย่างสมบูรณ์บนเครือข่ายผ้าทอภายในวเฟอร์ ทำให้แบนด์วิดธ์การสื่อสารทางกายภาพสูงกว่า NVLink ในสถาปัตยกรรม NVL72 ของ NVIDIA มากกว่า 200 เท่า ร่วมกับการปรับแต่งการคำนวณแบบกระจาย Kimi K2.6 ใช้การจัดเก็บน้ำหนักแบบดั้งเดิม 4-bit (4 บิต) โดยไม่สูญเสียข้อมูล และใช้เลขทศนิยมแบบจุดลอยตัว 16-bit (16 บิต) เพื่อรักษาความแม่นยำขณะคำนวณ โดยใช้เคอร์เนลโอเปอเรเตอร์แบบกำหนดเองและการถอดรหัสแบบคาดการณ์เพื่อให้สามารถทำงานแบบเรียลไทม์ได้ (ที่มา: BlockBeats)

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา