NVIDIA Mengungkap Butiran Kos Blackwell: Harga GPU Ganda, Kos Token Turun 35x

iconKuCoinFlash
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Harga GPU Blackwell NVIDIA hampir dua kali ganda berbanding model Hopper, tetapi kos token turun 35 kali. Dengan kadar awan $2.65 sejam, Blackwell menghantar 6,000 token per saat, berbanding 90 untuk Hopper. Ini menurunkan kos per juta token kepada $0.12 daripada $4.20. Analisis harga menunjukkan peningkatan perisian seperti FP4 dan MTP mendorong kecekapan. Trend harga kripto mungkin mencerminkan perubahan peranti keras seperti ini.

Pesan AIMPACT, 30 April (UTC+8), menurut pemantauan Beating, NVIDIA menerbitkan blog yang menguraikan pemilihan perangkat keras inferensi, dengan argumen utama: menilai infrastruktur inferensi harus melihat "biaya per token" bukan "biaya per GPU per jam". Dalam perbandingan harga GPU, Blackwell lebih mahal; tetapi dalam perbandingan biaya per token, Blackwell mengungguli generasi sebelumnya. Blog ini menggunakan DeepSeek-R1 (model inferensi MoE) sebagai objek uji, membandingkan Blackwell (GB300 NVL72) dengan generasi sebelumnya Hopper (HGX H200). Berdasarkan harga sewa pasar cloud, Blackwell berharga $2.65 per GPU per jam, hampir dua kali lebih mahal daripada Hopper yang berharga $1.41, tetapi output token per GPU per detik meningkat dari 90 menjadi 6000, meningkatkan throughput sebesar 65 kali, sehingga biaya per juta token turun dari $4.20 menjadi $0.12. Output token per megawatt meningkat 50 kali. Perlu diperhatikan: angka $0.12 ini didasarkan pada semua optimasi perangkat lunak yang diaktifkan, termasuk inferensi presisi rendah FP4 dan MTP (multi-token prediction, yang memungkinkan model menghasilkan beberapa token sekaligus untuk mempercepat proses). Data asli SemiAnalysis InferenceX v2 menunjukkan bahwa pada GB300 NVL72 yang sama menjalankan DeepSeek-R1, tanpa MTP, biaya per juta token sekitar $2.35, sedangkan dengan MTP aktif turun menjadi sekitar $0.11—optimasi tunggal ini saja menciptakan perbedaan 21 kali lipat. Semua hasil di atas adalah hasil uji coba untuk model tunggal DeepSeek-R1; angka-angka ini akan berbeda tergantung pada arsitektur dan ukuran model yang berbeda. (Sumber: BlockBeats)

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.