Benchmark PinchBench: Gemini 3 Flash lidera modelos de IA com taxa de sucesso de 95,1% nas tarefas OpenClaw

KuCoinFlash

Data de lançamento:

Resumo

A liquidez e os mercados de criptomoedas viram um novo marco, pois o Gemini 3 Flash superou o teste PinchBench com uma taxa de sucesso de 95,1% nas tarefas OpenClaw. Minimax-m2.1 e Kimi-k2.5 seguiram com 93,6% e 93,4%. Claude Sonnet 4.5 e GPT-4o obtiveram 92,7% e 85,2%. O teste focou no desempenho de agentes no mundo real. Reguladores monitorando a conformidade com a CFT podem rastrear essas métricas para transparência.

Odaily Planet Daily News: O CISO da SlowMist, 23pads, publicou em X que o benchmark PinchBench avaliou o desempenho de grandes modelos de linguagem de IA nas tarefas do agente OpenClaw, mostrando que o Gemini 3 Flash liderou com uma taxa de sucesso de 95,1% nas tarefas do OpenClaw, seguido pelo minimax-m2.1 e kimi-k2.5, com 93,6% e 93,4%, respectivamente. O Claude Sonnet 4.5 obteve 92,7% e o GPT-4o, 85,2%.

Fonte:Mostrar original

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.