AIMPACT বার্তা, 13 মে (UTC+8), বিশ্বপ্রসিদ্ধ মূল্যায়ন প্রতিষ্ঠান Artificial Analysis একটি নতুন Coding Agent সূচক—Artificial Analysis Coding Agent Index প্রকাশ করেছে, যা Agent harnesses এবং মডেল কম্বিনেশনের SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 এবং SWE-Atlas-QnA তিনটি প্রধান বেঞ্চমার্কে পারফরম্যান্স পরিমাপ করে। এই মূল্যায়নে, বন্ধ সোর্স মডেল Opus 4.7 (Cursor CLI-এ চলমান) বিশ্বের প্রথম স্থান অধিকার করেছে, এবং GLM-5.1 (Claude Code-এ চলমান) ওপেন-সোর্সের মধ্যে প্রথম স্থান অর্জন করেছে। এই বেঞ্চমার্কটি বাস্তব প্রোগ্রামিং টাস্ক, Agentic টার্মিনাল টাস্ক এবং প্রযুক্তিগত প্রশ্নোত্তরকে কভার করে, যা বাস্তব প্রোগ্রামিং Agent সিনেরিওতে প্রকৃত পারফরম্যান্সকে প্রতিফলিত করার উদ্দেশ্যে। লেখাটিতে মনে করা হয়েছে, GLM-5.1 এই সিনেরিওতে চীনা বড় মডেলগুলির SOTA ক্ষমতা প্রতিনিধিত্ব করে। (উৎস: InFoQ)
GLM-5.1 কৃত্রিম বিশ্লেষণ কোডিং এজেন্ট বেঞ্চমার্কে ওপেন-সোর্স মডেলগুলির মধ্যে প্রথম স্থান অধিকার করেছে
KuCoinFlashশেয়ার






অন-চেইন বিশ্লেষণ প্রতিষ্ঠান আর্টিফিশিয়াল অ্যানালিসিস ১৩ মে (UTC+8) কোডিং এজেন্ট সূচক প্রকাশ করে, যা SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 এবং SWE-Atlas-QnA-এর উপর ভিত্তি করে মডেলগুলির মূল্যায়ন করে। GLM-5.1 (Claude Code-এ চলমান) ওপেন-সোর্স মডেলগুলির মধ্যে শীর্ষে রয়েছে, যখন Opus 4.7 (Cursor CLI) সামগ্রিকভাবে শীর্ষে রয়েছে। বেঞ্চমার্কটি বাস্তব-বিশ্বের কোডিং, টার্মিনাল কাজ এবং প্রযুক্তিগত Q&A-কে পরীক্ষা করে। GLM-5.1 শীর্ষ ওপেন-সোর্স পারফরম্যান্স দেখায়, যেখানে স্থানীয় মডেলগুলির প্রতি খোলা ব্যাজের আগ্রহ বাড়ছে।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।