1M AI News-এর অনুসারে, ওপেনক্লসের প্রতিষ্ঠাতা পিটার স্টেইনবার্গার তৃতীয় পক্ষের প্রতিষ্ঠান পিঞ্চবেঞ্চের বেঞ্চমার্ক পরীক্ষার ফলাফল শেয়ার করেছেন, যা ওপেনক্লস এজেন্ট কাজের মধ্যে এআই বড় ভাষা মডেলগুলির পারফরম্যান্স মূল্যায়ন করে।
ফলাফল দেখায় যে জেমিনি 3 ফ্ল্যাশ ওপেনক্লক টাস্ক সফলতার হার 95.1% দিয়ে শীর্ষে রয়েছে, মিনিম্যাক্স-এম2.1 এবং কিমি-কে2.5 যথাক্রমে 93.6% এবং 93.4% দিয়ে ২য় এবং ৩য় স্থানে রয়েছে। ক্লড সনেট 4.5 হল 92.7%, এবং GPT-4o হল 85.2%।
