Odaily Planet Daily informa que 23pads, CISO de SlowMist, publicó en la plataforma X que la evaluación de referencia PinchBench midió el rendimiento de modelos de lenguaje grande de IA en tareas del agente OpenClaw, mostrando que Gemini 3 Flash logró un éxito del 95,1% en tareas de OpenClaw, liderando la clasificación; minimax-m2.1 y kimi-k2.5 ocuparon el segundo y tercer puesto con 93,6% y 93,4% respectivamente. Claude Sonnet 4.5 obtuvo un 92,7% y GPT-4o un 85,2%.
PinchBench Benchmark: Gemini 3 Flash lidera los modelos de IA con una tasa de éxito del 95,1% en tareas OpenClaw
KuCoinFlashCompartir






La liquidez y los mercados de criptomonedas vieron un nuevo récord cuando Gemini 3 Flash superó la prueba PinchBench con una tasa de éxito del 95,1% en tareas de OpenClaw. Minimax-m2.1 y Kimi-k2.5 siguieron con 93,6% y 93,4%. Claude Sonnet 4.5 y GPT-4o obtuvieron 92,7% y 85,2%. La prueba se centró en el rendimiento de agentes en escenarios del mundo real. Los reguladores que monitorean el cumplimiento de la CFT pueden rastrear estas métricas para garantizar transparencia.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.