ARC-AGI-3 — 真の知性を試す新しいテスト 2026年3月に開始され、ビデオゲームの形をとる——AIは指示なしに、自ら環境のルールを解明しなければならない。 人間:約100% >GPT-5.5:0.43% >Claude Opus 4.7:0.18% >トップ特殊エージェント:12.58% 特定された3つの失敗パターン: >正しく認識するが、誤った理論を構築し、適応できない >未知の状況を訓練データのテンプレートに当てはめる >偶然正解するが、不適切な戦略を有効な戦略として強化する ARC賞財団は、2026年11月2日までに100%の正確さを達成した最初の人物に70万ドルを提供する。 結論 この差は知識の問題ではなく、現在のモデルがその場で新しいことを学べないという点にある。 AGIとして販売されているのは思考ではなく、パターンマッチングである。 2026年のAGIに対する過剰な期待にとって、悪質なサインである。


