PinchBench Benchmark: Nagtataglay ang Gemini 3 Flash ng 95.1% na rate ng tagumpay sa mga gawain ng OpenClaw

iconKuCoinFlash
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Nakita ng liquidity at mga cryptocurrency market ang isang bagong benchmark nang makamit ng Gemini 3 Flash ang 95.1% na rate ng tagumpay sa PinchBench test sa mga OpenClaw task. Sumunod ang Minimax-m2.1 at Kimi-k2.5 na may 93.6% at 93.4%. Ang Claude Sonnet 4.5 at GPT-4o ay nakakuha ng 92.7% at 85.2%. Ang pagsubok ay nakatuon sa pagganap ng agent sa totoong mundo. Maaaring suriin ng mga regulador na nagmamasid sa CFT compliance ang mga metrikang ito para sa transparensya.

Odaily Planet Daily News: Ang CISO ng SlowMist, 23pads, ay nag-post sa platform na X na ang PinchBench benchmark ay nagtataya sa pagganap ng mga malaking AI language model sa OpenClaw agent tasks, kung saan ang Gemini 3 Flash ay nangunguna sa pagkakaroon ng 95.1% na tagumpay sa pagpapatupad ng OpenClaw tasks, habang ang minimax-m2.1 at kimi-k2.5 ay naka-iskwalipikasyon sa ikalawa at ikatlong lugar na may 93.6% at 93.4% ayon sa pagkakasunod-sunod. Ang Claude Sonnet 4.5 ay may 92.7%, samantalang ang GPT-4o ay may 85.2%.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.