NVIDIA เปิดเผยรายละเอียดต้นทุนของ Blackwell: ราคา GPU เพิ่มเป็นสองเท่า ต้นทุนโทเค็นลดลง 35 เท่า

iconKuCoinFlash
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ราคา GPU Blackwell ของ NVIDIA สูงเกือบสองเท่าของรุ่น Hopper แต่ต้นทุนต่อโทเค็นลดลง 35 เท่า ในอัตราคลาวด์ที่ $2.65 ต่อชั่วโมง Blackwell สามารถส่งโทเค็นได้ 6,000 โทเค็นต่อวินาที เมื่อเทียบกับ 90 โทเค็นของ Hopper ซึ่งลดต้นทุนต่อล้านโทเค็นเหลือ $0.12 จาก $4.20 การวิเคราะห์ราคาแสดงให้เห็นว่าการปรับปรุงซอฟต์แวร์เช่น FP4 และ MTP ขับเคลื่อนประสิทธิภาพ แนวโน้มราคาคริปโตอาจสะท้อนการเปลี่ยนแปลงฮาร์ดแวร์ดังกล่าว

ข้อความจาก AIMPACT เมื่อวันที่ 30 เมษายน (UTC+8) ตามการติดตามของ Beating นิเวศน์ได้โพสต์บล็อกวิเคราะห์การเลือกฮาร์ดแวร์สำหรับการประมวลผลแบบอนุมาน โดยสรุปใจความสำคัญหนึ่งประโยค: การประเมินโครงสร้างพื้นฐานสำหรับการอนุมานควรพิจารณาจาก “ต้นทุนต่อโทเค็น” ไม่ใช่ “ต้นทุนต่อ GPU ต่อชั่วโมง” เมื่อเปรียบเทียบด้วยราคา GPU แบบเดียว Blackwell แพงกว่า แต่เมื่อเปรียบเทียบด้วยต้นทุนต่อโทเค็น Blackwell โดดเด่นกว่ารุ่นก่อนหน้าอย่างมาก บล็อกนี้ใช้ DeepSeek-R1 (โมเดลอนุมานแบบ MoE) เป็นตัวทดสอบ โดยเปรียบเทียบ Blackwell (GB300 NVL72) กับรุ่นก่อนหน้า Hopper (HGX H200) โดยอ้างอิงราคาเช่าในตลาดคลาวด์ Blackwell มีต้นทุน 2.65 ดอลลาร์สหรัฐต่อ GPU ต่อชั่วโมง แพงกว่า Hopper ที่ 1.41 ดอลลาร์สหรัฐเกือบสองเท่า แต่ปริมาณโทเค็นที่ผลิตได้ต่อวินาทีต่อ GPU เพิ่มจาก 90 เป็น 6,000 เพิ่มขึ้น 65 เท่า ส่งผลให้ต้นทุนต่อหนึ่งล้านโทเค็นลดลงจาก 4.20 ดอลลาร์สหรัฐเหลือเพียง 0.12 ดอลลาร์สหรัฐ และปริมาณโทเค็นที่ผลิตได้ต่อหนึ่งเมกะวัตต์เพิ่มขึ้น 50 เท่า สิ่งที่ควรสังเกตคือ ตัวเลข 0.12 ดอลลาร์สหรัฐนี้ถูกคำนวณภายใต้เงื่อนไขที่เปิดใช้งานการอนุมานแบบความแม่นยำต่ำ FP4 และ MTP (การคาดการณ์หลายโทเค็นพร้อมกัน เพื่อเร่งความเร็วการสร้างโทเค็นหลายตัวในครั้งเดียว) และการปรับปรุงซอฟต์แวร์อื่นๆ อีกหลายอย่าง ข้อมูลดิบจาก SemiAnalysis InferenceX v2 แสดงว่า หากใช้ GB300 NVL72 เดียวกันในการรัน DeepSeek-R1 โดยไม่เปิด MTP ต้นทุนต่อหนึ่งล้านโทเค็นจะอยู่ที่ประมาณ 2.35 ดอลลาร์สหรัฐ เมื่อเปิด MTP จะลดลงเหลือประมาณ 0.11 ดอลลาร์สหรัฐ การปรับปรุงเพียงอย่างเดียวนี้สร้างความแตกต่างถึง 21 เท่า ผลลัพธ์ทั้งหมดนี้เป็นผลจากการทดสอบโมเดลเดียวคือ DeepSeek-R1 เลขเหล่านี้อาจแตกต่างกันไปตามสถาปัตยกรรมและขนาดของโมเดลอื่นๆ (ที่มา: BlockBeats)

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา