NVIDIA Blackwell Mengungguli H200 sebesar 20x dalam Benchmark Perangkat Agent

iconKuCoinFlash
Bagikan
AI summary iconRingkasan
ME AI Berita, menurut pemantauan Beating, lembaga evaluasi Artificial Analysis merilis benchmark perangkat keras agen (Agent) pertama di industri, AA-AgentPerf. Evaluasi tradisional seperti "lari cepat" satu kali jawaban, hanya melihat kecepatan respons; tugas agen seperti "lari estafet", di mana AI harus secara mandiri memecah tujuan, berulang kali berpindah dalam membaca dan menulis file, menulis ulang kode, serta menjalankan pengujian. Interaksi yang sering menimbulkan tantangan tinggi terhadap kapasitas memori server dan efisiensi penjadwalan. Benchmark ini mereproduksi jejak pemrograman nyata, dengan menggunakan "jumlah agen paralel yang didukung per megawatt daya" sebagai indikator efisiensi energi utama, langsung menangani hambatan listrik dan keuangan di pusat data. Uji coba tahap pertama menjalankan model open-source dengan 1,6 triliun parameter, DeepSeek V4 Pro. Hasilnya menunjukkan bahwa sistem rack cairan dingin NVIDIA Blackwell GB300 NVL72 dapat menampung 61.400 agen paralel per megawatt daya, sementara generasi sebelumnya Hopper HGX H200 hanya mampu mendukung 2.600, meningkatkan efisiensi energi lebih dari 20 kali. Kapasitas paralel per kartu grafis juga meningkat 41 kali. Hal ini memungkinkan pusat data untuk menampung 20 kali lebih banyak agen paralel dengan anggaran listrik yang sama, secara signifikan menurunkan biaya penerapan aplikasi seperti pemrograman otomatis dan layanan pelanggan. Dalam hasil awal, AMD Instinct MI355X sementara tertinggal. Lembaga evaluasi menunjukkan bahwa konfigurasi AMD dan H200 keduanya menggunakan kerangka kerja open-source vLLM umum tanpa optimasi mendalam; dengan perkembangan penyesuaian kerangka layanan dan kernel inti, kinerja AMD masih memiliki ruang untuk peningkatan. Saat ini, penyedia inferensi seperti Together AI telah lebih dulu menerapkan DeepSeek V4 Pro di platform Blackwell untuk menyediakan dukungan inferensi real-time bagi alat pemrograman agen Cursor. (Sumber: BlockBeats)
Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.