PinchBenchベンチマーク:Gemini 3 FlashがOpenClawタスクで95.1%の成功率でAIモデルをリード

iconKuCoinFlash
共有
AI summary icon概要

Odaily星球日報によると、慢霧のCISOである23padsがXプラットフォームで投稿し、PinchBenchベンチマークテストによりAI大規模言語モデルのOpenClawエージェントタスクにおけるパフォーマンスが評価された。その結果、Gemini 3 Flashは95.1%の成功率で首位を独走し、minimax-m2.1とkimi-k2.5はそれぞれ93.6%、93.4%で2位と3位となった。Claude Sonnet 4.5は92.7%、GPT-4oは85.2%であった。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。