Según noticias de 1M AI, el fundador de OpenClaw, Peter Steinberger, compartió los resultados de la prueba de referencia de la institución externa PinchBench, que evalúa el rendimiento de los modelos de lenguaje grande de IA en las tareas del agente OpenClaw.
Los resultados muestran que Gemini 3 Flash lidera con una tasa de éxito del 95,1% en las tareas de OpenClaw, mientras que minimax-m2.1 y kimi-k2.5 ocupan el segundo y tercer puesto con 93,6% y 93,4%, respectivamente. Claude Sonnet 4.5 alcanza el 92,7% y GPT-4o el 85,2%.
