ARC-AGI-3 — 一項測試真正智慧的新測驗 於2026年3月推出,以電子遊戲形式呈現——AI必須在無任何指示的情況下,自行推斷環境規則 人類:~100% >GPT-5.5:0.43% >Claude Opus 4.7:0.18% >頂尖特工:12.58% 已識別出三種失敗模式: >正確觀察——但建立錯誤理論,無法適應 >將不熟悉的情境套用至訓練模板 >憑運氣猜對——並強化一個有缺陷的策略為有效策略 ARC獎金基金會提供70萬美元,獎勵首位在2026年11月2日前達成100%準確率的人 結論 差距不在於知識,而在於目前的模型無法在當下學習新事物 被宣稱為AGI的,只是模式匹配,而非思考 這是2026年AGI炒作的一個糟糕信號


