Бенчмарк PinchBench: Gemini 3 Flash лідирує серед моделей ШІ з показником успішності 95,1% у завданнях OpenClaw

KuCoinFlash

Час випуску:

Поділитися

Короткий зміст

Ринки ліквідності та криптовалют встановили новий рекорд: Gemini 3 Flash показав 95,1% успішності у завданнях OpenClaw у тесті PinchBench. Minimax-m2.1 та Kimi-k2.5 поступилися з результатами 93,6% та 93,4%. Claude Sonnet 4.5 та GPT-4o набрали 92,7% та 85,2%. Тест зосереджувався на реальній продуктивності агентів. Регулятори, що контролюють відповідність CFT, можуть стежити за такими показниками для прозорості.

Odaily Planet Daily: CISO慢霧 23pads на платформі X опублікував повідомлення, що тестування PinchBench оцінило продуктивність великих мовних моделей ШІ у завданнях OpenClaw. Результати показали, що Gemini 3 Flash досяг успішності 95,1% у виконанні завдань OpenClaw, посівши перше місце; minimax-m2.1 та kimi-k2.5 зайняли друге та третє місця з успішністю 93,6% та 93,4% відповідно. Claude Sonnet 4.5 показав результат 92,7%, а GPT-4o — 85,2%.

Джерело:Показати оригінал

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.