スタンフォード大学HAI(人間および人工知能センター)が、AI分野で最も権威のある年次レポートである2026年AIインデックス報告書を発表しました。過去1年間、スタンフォードの研究者たちはさまざまな観察を通じて、AIがPCやインターネットを上回る速度で世界中に採用されているが、人間社会の制度、雇用市場、測定ツールは全体的に遅れているという核心的な結論を導き出しました。
AIは駆け抜けているが、人間はまだ靴を探している。10枚の画像で、AIが人間より速く進んでいる場所を確認しよう。
1
AIを評価する試験自体、意味がない

「AIが人間を超越」などのタイトルは、ベンチマークの信頼性に基づいている。しかし、スタンフォード大学の報告によると、広く使用されている数学ベンチマークGSM8Kの問題の約42%が無効である。他のテストでも「問題集の暗記」の疑いがあり、モデルがテストデータで訓練された後、高得点を獲得できるが、それが必ずしも知能が向上したことを意味しない。多くの企業が関連するベンチマーク成績を公開することを拒否している。報告の著者之一のGilは、「成績を公開しないこと自体が、何らかの意味を示している可能性がある」と述べている。
2
米中差異は実質的に消滅し、わずか2.7%

2026年3月時点では、米国最強モデルClaude Opus 4.6のEloスコアは1503であり、中国最強モデルはこれに続き、差はわずか2.7%である。過去1年間、両国モデルは複数回リードを交代し、2025年2月にはDeepSeek R1が米国最強モデルとスコアを並べた。
しかし、両国のAIの優位性はまったく異なります。米国はより強力なモデル、より多くの資本を持ち、5427か所のデータセンターを保有しており、これは他のどの国よりも10倍以上です。一方、中国はAI論文、特許、ロボットの導入でリードしています。簡単に言えば、米国は計算力と資金で勝ち、中国は研究と製造で勝っています。
3
最先端のモデルが収束し、知能レベルは互角です

2026年3月現在、Anthropic(1503)、xAI(1495)、Google(1494)、OpenAI(1481)は極めて狭い範囲に押し込められている。これは、「どのモデルがより強力か」が競争の焦点ではなくなっていることを意味する。競争の焦点は、コスト、信頼性、特定分野への最適化へと移りつつあり、これがAnthropicがAdvisor Tool(コスト削減)に取り組み、GoogleがWiz(クラウドセキュリティ)を買収し、OpenAIがさまざまなアプリケーション層企業を買収している理由でもある。モデル自体の知的性能が次第に同質化する中で、他の領域で差別化を図る必要がある。
4
22~25歳の開発者の就職が約20%減少

生成型AIは3年以内に人口の53%以上に採用され、88%の組織がAIを導入している。しかし、雇用への影響は均一ではない。スタンフォード大学の経済学者による2025年の研究では、22〜25歳のソフトウェア開発者の雇用数が2022年以降約20%減少したのに対し、年齢層の高いグループは依然として増加している。マッキンゼーの2025年調査によると、3分の1の組織が今後1年以内にAIによって従業員を削減すると予想しており、削減はサービス運用、サプライチェーン、ソフトウェアエンジニアリングに集中している。
全体のデータには大規模な失業はまだ見られていないが、これは雇用市場が徐々に悪化していることを示しており、危機は静かに進行している。
5
採用速度はPCやインターネットを上回り、米国は第24位にとどまる

生成AIは3年以内に人口比53%の採用率に達し、その速度はパーソナルコンピュータやインターネットを上回った。しかし、最も直感に反するデータは、AIへの投資とモデル開発で世界をリードする米国が、人口採用率は28.3%にとどまり、世界で24位である点だ。アラブ首長国連邦は64%、シンガポールは60.9%。最もお金をかける国が、最も少ない利用をしている。
6
世界的AI投資は5817億ドルで、米国は中国の23倍だが……

2025年、世界のAI企業への投資総額は5,817億ドルに達し、前年比129.9%増加した。米国の民間AI投資額は2,859億ドルで、中国の23倍、英国の48.5倍である。カリフォルニア州単独で米国の75%以上を占めている。大規模な資金調達も活発で、OpenAIは400億ドルを調達し、評価額は3,000億ドルとなった。Anthropicは130億ドルを調達し、評価額は1,830億ドル。Cursorは293億ドルの評価額で23億ドルを調達した。
ただし、ここには隠された情報があります。中国国内では、2000年から2023年までの間に国営ファンドがAI企業に約1840億ドルを投入しており、この資金は民間投資の統計に含まれていません。この部分を加えると、米中間の資金差は帳簿上の数字よりもはるかに小さい可能性があります。
7
AIエージェント:会話から行動まで可能だが、失敗率は依然として3分の1

2025年はAIエージェントの元年である。OSWorld(オペレーティングシステム上でタスクを完了するAIの能力をテスト)の正確率は12%から66.3%へ急上昇し、人間のパフォーマンスとわずか6ポイントの差となった。WebArenaは74.3%に達し、Cybench(サイバーセキュリティタスク)は15%から93%へ急騰した。
しかし全体的に見ると、エージェントの失敗率は依然として約3分の1です。また、企業での実際の導入はまだ一桁にとどまっており、ほとんどのビジネスシナリオで、回答者の3分の2以上がAIエージェントをまったく使用していないと回答しています。ベンチマーク上の進歩と実際の導入の間には、まだ大きなギャップがあります。
8
89%のボットが実験室で生きている

AIは仮想世界ではすでに強力だが、物理世界では依然として弱い。ソフトウェアシミュレーション環境でのロボット操作の成功率は89.4%であるが、実際の家庭タスクでは成功率がわずか12.4%にとどまる。清潔な実験室と散らかった家庭という二つの環境の違いにより、後者の現実的な環境におけるロボットの関与はまだごくわずかである。
ただし、自動運転は例外です:Waymoは週に約45万回の移動を、Apollo Goは2025年に約1100万回の完全無人移動を達成しました。
9
専門家 vs 一般ユーザー:73%対23%の認知ギャップ

引用されたPew調査は、驚異的な対立を明らかにした:AI専門家の73%がAIが仕事にポジティブな影響を与えると信じているのに対し、米国一般市民ではその割合は23%に過ぎず、完全に二極化している。
もう一つ興味深いデータ:調査対象国すべてにおいて、アメリカ人は政府によるAIの規制に対する信頼度が最も低い。専門家はAIが教育や医療分野で示す可能性に対してより楽観的だが、双方ともAIが選挙や人間関係に悪影響を及ぼすと認識している。
10
GPT-4oは1年で1200万人以上の水を使用し、電力消費はニューヨーク州全体を支えることができる

AIの進歩の背後には、環境が代償を支払っている。現在、世界のAIデータセンターは29.6GWの電力を消費しており、この規模は電力需要のピーク時にニューヨーク州全体を支えるのに十分である。OpenAIのGPT-4oという1つのモデルだけで、年間の水使用量は1,200万人以上の飲料水需要を上回る可能性がある。
これらの膨大な消費は、次々とモデルのトレーニングに注ぎ込まれているが、同時に、モデルの背後にあるチップサプライチェーンは極めて脆弱である。米国は世界の大多数のAIデータセンターを保有しているが、ほぼすべての最先端AIチップは台湾のTSMC一社によって製造されている。すべての計算能力、すべての投資、すべてのモデルの進歩は、この物理的基盤の上に築かれている。
以上は報告の氷山の一角に過ぎないが、我々がまだ完全に理解していない技術を、歴史上最快の速度で「受け入れ」ていることが十分にわかる。
完全なレポートは、AIセキュリティ、規制動向、研究トレンドなど、さらに多くの側面をカバーしています。関心のある方は、オリジナルレポート全文をお読みいただくことを強く推奨します。→👉🏻:https://hai.stanford.edu/ai-index
本文は微信公众号「APPSO」より、明日の製品を発見するAPPSOが執筆しました。
