مُعيار PinchBench: يتصدر Gemini 3 Flash نماذج الذكاء الاصطناعي بمستوى نجاح 95.1% في مهام OpenClaw

KuCoinFlash

وقت الإصدار:

ملخص

شهدت سيولة الأسواق الرقمية معيارًا جديدًا مع تصدر Gemini 3 Flash اختبار PinchBench بنسبة نجاح 95.1% في مهام OpenClaw. وحل Minimax-m2.1 وKimi-k2.5 في المرتبة الثانية بنسبة 93.6% و93.4% على التوالي. وحصل Claude Sonnet 4.5 وGPT-4o على درجات 92.7% و85.2%. ركز الاختبار على أداء الوكلاء في البيئات الواقعية. قد تتبع الجهات التنظيمية التي تراقب الامتثال لـ CFT هذه المؤشرات من أجل الشفافية.

أوديليي يواني ريبورت: كشف سيسو 23pads من سلو موغ، في منشور على منصة X، أن اختبار معيار PinchBench قيّم أداء نماذج اللغة الكبيرة للذكاء الاصطناعي في مهام وكيل OpenClaw، وأظهرت النتائج أن Gemini 3 Flash حقق نجاحًا بنسبة 95.1% في معالجة مهام OpenClaw، متقدمًا على minimax-m2.1 و kimi-k2.5 اللذين حصلا على 93.6% و93.4% على التوالي في المرتبتين الثانية والثالثة. أما Claude Sonnet 4.5 فكان بنسبة 92.7%، وGPT-4o بنسبة 85.2%.

المصدر:عرض النسخة الأصلية

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.