PinchBench Benchmark: Gemini 3 Flash lidera los modelos de IA con una tasa de éxito del 95,1% en tareas OpenClaw

iconKuCoinFlash
Compartir
AI summary iconResumen

Odaily Planet Daily informa que 23pads, CISO de SlowMist, publicó en la plataforma X que la evaluación de referencia PinchBench midió el rendimiento de modelos de lenguaje grande de IA en tareas del agente OpenClaw, mostrando que Gemini 3 Flash logró un éxito del 95,1% en tareas de OpenClaw, liderando la clasificación; minimax-m2.1 y kimi-k2.5 ocuparon el segundo y tercer puesto con 93,6% y 93,4% respectivamente. Claude Sonnet 4.5 obtuvo un 92,7% y GPT-4o un 85,2%.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.