Mesej AIMPACT, 13 Mei (UTC+8), agensi penilaian antarabangsa terkemuka, Artificial Analysis, telah mengumumkan indeks Coding Agent baharu—Artificial Analysis Coding Agent Index—yang digunakan untuk mengukur prestasi kombinasi Agent harnesses dan model dalam tiga indeks utama: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2, dan SWE-Atlas-QnA. Dalam penilaian ini, model tertutup Opus 4.7 (berjalan di Cursor CLI) mendapat tempat pertama secara global, manakala GLM-5.1 (berjalan di Claude Code) mendapat tempat pertama dalam kategori terbuka. Indeks ini merangkumi tugas pemrograman sebenar, tugas terminal Agentic, dan soalan jawapan teknikal, dengan tujuan mencerminkan prestasi sebenar dalam skenario pemrograman Agent. Pandangan dalam artikel tersebut menyatakan bahawa GLM-5.1 mewakili kemampuan SOTA model besar buatan tempatan dalam skenario ini. (Sumber: InFoQ)
GLM-5.1 menduduki tempat pertama di kalangan model sumber terbuka dalam Penilaian Agen Pengekodan Analisis Buatan
KuCoinFlashKongsi






Firma analisis on-chain Artificial Analysis mengeluarkan Coding Agent Index pada 13 Mei (UTC+8), menilai model-model berdasarkan SWE-Bench-Pro-Hard-AA, Terminal-Bench v2, dan SWE-Atlas-QnA. GLM-5.1 (berjalan di Claude Code) memimpin model sumber terbuka, manakala Opus 4.7 (Cursor CLI) memimpin secara keseluruhan. Ujian tolok ini menguji kod dunia nyata, tugas terminal, dan soal jawab teknikal. GLM-5.1 menunjukkan prestasi teratas dalam model sumber terbuka, dengan minat terbuka terhadap model tempatan meningkat.
Sumber:Tunjukkan artikel asal
Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini.
Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.