ตามข่าวจาก 1M AI News ผู้ก่อตั้ง OpenClaw Peter Steinberger ได้แชร์ผลการทดสอบมาตรฐานจากหน่วยงานภายนอก PinchBench ซึ่งประเมินประสิทธิภาพของโมเดลภาษาขนาดใหญ่ของ AI ในการทำงานของตัวแทน OpenClaw
ผลการทดสอบแสดงว่า Gemini 3 Flash มีอัตราความสำเร็จในการจัดการงาน OpenClaw สูงสุดที่ 95.1% ตามด้วย minimax-m2.1 และ kimi-k2.5 ที่ตามมาที่ลำดับที่ 2 และ 3 ด้วยอัตราความสำเร็จตามลำดับคือ 93.6% และ 93.4% ส่วน Claude Sonnet 4.5 อยู่ที่ 92.7% และ GPT-4o อยู่ที่ 85.2%
