GLM-5.1 কৃত্রিম বিশ্লেষণ কোডিং এজেন্ট বেঞ্চমার্কে ওপেন-সোর্স মডেলগুলির মধ্যে প্রথম স্থান অধিকার করেছে

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
অন-চেইন বিশ্লেষণ প্রতিষ্ঠান আর্টিফিশিয়াল অ্যানালিসিস ১৩ মে (UTC+8) কোডিং এজেন্ট সূচক প্রকাশ করে, যা SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 এবং SWE-Atlas-QnA-এর উপর ভিত্তি করে মডেলগুলির মূল্যায়ন করে। GLM-5.1 (Claude Code-এ চলমান) ওপেন-সোর্স মডেলগুলির মধ্যে শীর্ষে রয়েছে, যখন Opus 4.7 (Cursor CLI) সামগ্রিকভাবে শীর্ষে রয়েছে। বেঞ্চমার্কটি বাস্তব-বিশ্বের কোডিং, টার্মিনাল কাজ এবং প্রযুক্তিগত Q&A-কে পরীক্ষা করে। GLM-5.1 শীর্ষ ওপেন-সোর্স পারফরম্যান্স দেখায়, যেখানে স্থানীয় মডেলগুলির প্রতি খোলা ব্যাজের আগ্রহ বাড়ছে।

AIMPACT বার্তা, 13 মে (UTC+8), বিশ্বপ্রসিদ্ধ মূল্যায়ন প্রতিষ্ঠান Artificial Analysis একটি নতুন Coding Agent সূচক—Artificial Analysis Coding Agent Index প্রকাশ করেছে, যা Agent harnesses এবং মডেল কম্বিনেশনের SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 এবং SWE-Atlas-QnA তিনটি প্রধান বেঞ্চমার্কে পারফরম্যান্স পরিমাপ করে। এই মূল্যায়নে, বন্ধ সোর্স মডেল Opus 4.7 (Cursor CLI-এ চলমান) বিশ্বের প্রথম স্থান অধিকার করেছে, এবং GLM-5.1 (Claude Code-এ চলমান) ওপেন-সোর্সের মধ্যে প্রথম স্থান অর্জন করেছে। এই বেঞ্চমার্কটি বাস্তব প্রোগ্রামিং টাস্ক, Agentic টার্মিনাল টাস্ক এবং প্রযুক্তিগত প্রশ্নোত্তরকে কভার করে, যা বাস্তব প্রোগ্রামিং Agent সিনেরিওতে প্রকৃত পারফরম্যান্সকে প্রতিফলিত করার উদ্দেশ্যে। লেখাটিতে মনে করা হয়েছে, GLM-5.1 এই সিনেরিওতে চীনা বড় মডেলগুলির SOTA ক্ষমতা প্রতিনিধিত্ব করে। (উৎস: InFoQ)

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।