MEニュース、4月5日(UTC+8):最近、Grok 4.20 Beta版がτ²-Bench評価で97%の正確率を達成し、2位となりました。τ²-BenchはSierraのオリジナルτ-benchフレームワークに基づいて構築された評価で、その厳しさで知られています。この評価は、AIが質問に答えるだけでなく、エージェントがナビゲーションタスクを成功させるかをテストします。(出典:InFoQ)
Grok 4.20 Beta、τ²-Benchで97%の精度を達成し、2位にランクイン
KuCoinFlash共有






Grok 4.20 Betaはτ²-Benchで97%の精度を達成し、2位となりました。このテストはSierraのτ-benchを基にしており、質問回答能力とナビゲーション能力を評価します。AIの進展により、リスクオン資産への関心が再び高まりました。技術の進歩に伴い、CFT規制が引き続き重要な焦点となっています。(出典:InFoQ)
出典:原文を表示
免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。
デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。