Menurut berita 1M AI, pendiri OpenClaw, Peter Steinberger, membagikan hasil ujian rujukan pihak ketiga PinchBench, yang menilai prestasi model bahasa besar AI dalam tugas agen OpenClaw.
Hasil menunjukkan Gemini 3 Flash memimpin dengan kejayaan 95.1% dalam tugas OpenClaw, manakala minimax-m2.1 dan kimi-k2.5 masing-masing berada di tempat ke-2 dan ke-3 dengan 93.6% dan 93.4%. Claude Sonnet 4.5 berada pada 92.7%, manakala GPT-4o berada pada 85.2%.
