NVIDIA Blackwell mengatasi H200 sebanyak 20 kali dalam ujian peranti keras Agen

iconKuCoinFlash
Kongsi
AI summary iconRingkasan
ME AI mesej, menurut pemantauan Beating, agensi penilaian Artificial Analysis telah mengeluarkan piawaian peranti keras agen (Agent) pertama dalam industri, AA-AgentPerf. Penilaian tradisional seperti siri 'lari pantas' sekali sahaja, hanya memperhatikan kelajuan respons; tugas agen pula seperti 'lari estafet', di mana AI perlu menguraikan matlamat secara automatik, berpindah berulang-ulang antara membaca dan menulis fail, menulis semula kod, serta menjalankan ujian. Interaksi yang kerap mencabar kapasiti ingatan pelayan dan kecekapan pengagihan. Piawaian ini menggunakan pemutaran jejak pengaturcaraan sebenar, dengan 'bilangan agen serentak yang disokong setiap megawatt kuasa' sebagai ukuran kecekapan tenaga utama, secara langsung menangani halangan kuasa dan kewangan pusat data. Ujian pertama dijalankan dengan model sumber terbuka 1.6 trilion parameter, DeepSeek V4 Pro. Keputusan menunjukkan, sistem penuh cairan sejuk NVIDIA Blackwell GB300 NVL72 mampu menyokong 61,400 agen serentak setiap megawatt kuasa, manakala generasi sebelumnya Hopper HGX H200 hanya mampu menyokong 2,600 agen — peningkatan kecekapan lebih 20 kali ganda. Kapasiti serentak setiap kad grafik juga meningkat 41 kali ganda. Ini membolehkan pusat data membawa 20 kali ganda lebih banyak agen serentak dengan bajet kuasa yang sama, secara signifikan mengurangkan kos pelaksanaan aplikasi seperti pengaturcaraan automatik dan perkhidmatan pelanggan. Dalam hasil pertama, AMD Instinct MI355X sementara tertinggal. Agensi penilaian menunjukkan bahawa konfigurasi AMD dan H200 kedua-duanya menggunakan kerangka sumber terbuka vLLM yang biasa tanpa pengoptimuman mendalam; dengan perkembangan kerangka perkhidmatan dan penyesuaian kernel dalaman, prestasi AMD masih mempunyai ruang untuk peningkatan. Semasa ini, penyedia inferens seperti Together AI telah terlebih dahulu melaksanakan DeepSeek V4 Pro di atas Blackwell untuk menyokong inferens secara masa nyata bagi alat pengaturcaraan agen Cursor. (Sumber: BlockBeats)
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.