PinchBench बेंचमार्क: जेमिनी 3 फ्लैश ओपनक्लॉ टास्क्स में 95.1% सफलता दर के साथ AI मॉडल्स का नेतृत्व करता है

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
लिक्विडिटी और क्रिप्टो बाजारों ने एक नया मानक स्थापित किया, जिसमें Gemini 3 Flash ने OpenClaw कार्यों में 95.1% सफलता दर के साथ PinchBench परीक्षण को टॉप किया। Minimax-m2.1 और Kimi-k2.5 क्रमशः 93.6% और 93.4% पर आए। Claude Sonnet 4.5 और GPT-4o ने 92.7% और 85.2% स्कोर किया। यह परीक्षण वास्तविक दुनिया के एजेंट प्रदर्शन पर केंद्रित था। CFT पालन की निगरानी करने वाले नियामक इन मापदंडों को पारदर्शिता के लिए ट्रैक कर सकते हैं।

Odaily स्टार डेली की रिपोर्ट के अनुसार, मैग्मा के CISO 23pads ने X प्लेटफॉर्म पर एक पोस्ट में कहा कि PinchBench बेंचमार्क ने OpenClaw एजेंट कार्यों में AI बड़े भाषा मॉडल के प्रदर्शन का मूल्यांकन किया, जिसमें Gemini 3 Flash ने 95.1% सफलता के साथ शीर्ष स्थान प्राप्त किया, जबकि minimax-m2.1 और kimi-k2.5 क्रमशः 93.6% और 93.4% सफलता के साथ दूसरे और तीसरे स्थान पर हैं। Claude Sonnet 4.5 की सफलता 92.7% है और GPT-4o की 85.2% है।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।