Проверка PinchBench: Gemini 3 Flash лидирует среди ИИ-моделей с показателем успешности 95,1% в задачах OpenClaw

iconKuCoinFlash
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Ликвидность и крипторынки достигли нового стандарта: Gemini 3 Flash показала лучший результат в тесте PinchBench с коэффициентом успешности 95,1% в задачах OpenClaw. Minimax-m2.1 и Kimi-k2.5 заняли второе и третье места с результатами 93,6% и 93,4%. Claude Sonnet 4.5 и GPT-4o набрали 92,7% и 85,2%. Тест оценивал реальную производительность агентов. Регуляторы, отслеживающие соответствие CFT, могут использовать такие метрики для повышения прозрачности.

Odaily Planet Daily сообщение: CISO SlowMist 23pads опубликовал пост на платформе X, в котором отметил, что тестирование PinchBench оценивает производительность крупных языковых моделей ИИ в задачах агента OpenClaw. Результаты показали, что Gemini 3 Flash достиг успеха в 95,1% при выполнении задач OpenClaw и занимает первое место; minimax-m2.1 и kimi-k2.5 заняли второе и третье места с результатами 93,6% и 93,4% соответственно. Claude Sonnet 4.5 показал результат 92,7%, а GPT-4o — 85,2%.

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.