PinchBench Benchmark: Gemini 3 Flash lidera los modelos de IA con una tasa de éxito del 95,1% en tareas OpenClaw

KuCoinFlash

Momento del lanzamiento:

Resumen

La liquidez y los mercados de criptomonedas vieron un nuevo récord cuando Gemini 3 Flash superó la prueba PinchBench con una tasa de éxito del 95,1% en tareas de OpenClaw. Minimax-m2.1 y Kimi-k2.5 siguieron con 93,6% y 93,4%. Claude Sonnet 4.5 y GPT-4o obtuvieron 92,7% y 85,2%. La prueba se centró en el rendimiento de agentes en escenarios del mundo real. Los reguladores que monitorean el cumplimiento de la CFT pueden rastrear estas métricas para garantizar transparencia.

Odaily Planet Daily informa que 23pads, CISO de SlowMist, publicó en la plataforma X que la evaluación de referencia PinchBench midió el rendimiento de modelos de lenguaje grande de IA en tareas del agente OpenClaw, mostrando que Gemini 3 Flash logró un éxito del 95,1% en tareas de OpenClaw, liderando la clasificación; minimax-m2.1 y kimi-k2.5 ocuparon el segundo y tercer puesto con 93,6% y 93,4% respectivamente. Claude Sonnet 4.5 obtuvo un 92,7% y GPT-4o un 85,2%.

Fuente:Mostrar original

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.