source avatarFitzgerald

分享

GLM-5.2 gembar-gembor “juara long-horizon coding agent” SWE-Marathon 只有 13%。Opus 4.8 26%。 在開源模型和 FrontierSWE 上還算不錯。 但他們的 long-horizon 確實特別,只在簡報亮點中表現出色。 行銷依舊是冠軍 😆

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露