Ayon sa 1M AI News, ang tagapagtatag ng OpenClaw, si Peter Steinberger, ay nag-repost ng mga resulta ng benchmark mula sa third-party na PinchBench, na nagtataya sa pagganap ng mga malaking AI language model sa mga gawain ng OpenClaw agent.
Ang resulta ay nagpapakita na ang Gemini 3 Flash ay nangunguna sa pagkakaroon ng 95.1% na tagumpay sa pagpapatupad ng mga gawain ng OpenClaw, habang ang minimax-m2.1 at kimi-k2.5 ay nagsikat naman sa 93.6% at 93.4% bilang ikalawa at ikatlo. Ang Claude Sonnet 4.5 ay may 92.7%, habang ang GPT-4o ay may 85.2%.
