PinchBenchベンチマーク：Gemini 3 FlashがOpenClawタスクで95.1%の成功率でAIモデルをリード

KuCoinFlash

公開時期：

概要

流動性と暗号資産市場では、Gemini 3 FlashがOpenClawタスクで95.1％の成功率を記録し、PinchBenchテストで新たなベンチマークを樹立しました。Minimax-m2.1とKimi-k2.5はそれぞれ93.6％、93.4％で続きました。Claude Sonnet 4.5とGPT-4oは92.7％、85.2％を獲得しました。このテストは、現実世界におけるエージェントのパフォーマンスに焦点を当てています。CFT準拠を監視する規制当局は、透明性のためにこのような指標を追跡する可能性があります。

Odaily星球日報によると、慢霧のCISOである23padsがXプラットフォームで投稿し、PinchBenchベンチマークテストによりAI大規模言語モデルのOpenClawエージェントタスクにおけるパフォーマンスが評価された。その結果、Gemini 3 Flashは95.1%の成功率で首位を独走し、minimax-m2.1とkimi-k2.5はそれぞれ93.6%、93.4%で2位と3位となった。Claude Sonnet 4.5は92.7%、GPT-4oは85.2%であった。

出典:原文を表示

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。