За даними 1M AI News, засновник OpenClaw Пітер Штейнбергер опублікував результати тестування від сторонньої організації PinchBench, яке оцінює продуктивність великих мовних моделей ШІ у завданнях OpenClaw.
Результати показують, що Gemini 3 Flash має найвищий рівень успішності виконання завдань OpenClaw — 95,1%, minimax-m2.1 та kimi-k2.5 посідають друге та третє місця з результатами 93,6% та 93,4% відповідно. Claude Sonnet 4.5 має 92,7%, а GPT-4o — 85,2%.
