AI業界は間もなく転換点に差し掛かります。AIのトレンドを追跡する非営利団体Epoch AIによると、2030年までに、AIモデルの実行に割り当てられる計算能力が、それらを構築するために使用される計算能力を上回る見込みです。
シフトの背後にある数字
Epoch AIの予測によると、今後、展開の経済性が開発の経済性を上回る業界が形成されます。同組織は、今後10年以内に、推論用コンピューティングのほぼ半分がASIC(アプリケーション特化型集積回路)に移行すると推定しています。ASICは、現在のAIワークロードを支える汎用GPUとは異なり、特定のタスクに特化して設計されたチップです。
一方で、AI全体の操作におけるトレーニング計算資源の割合は、約5%で安定すると予測されています。フロンティアAIモデルのトレーニング計算資源は、現在年率4〜5倍のペースで成長しています。総インストールされたAI計算資源ベースも同様のペースで拡大しています。
歴史的に、推論は実際のデプロイメントにおいてすでに60%から80%の計算リソースを占めてきました。
2030年までに、最先端のトレーニング実行は約2e29 FLOPに達すると予想されています。この進展は、1000億ドル以上かかるリソースによって支えられたGPT-2からGPT-4への飛躍と比較できます。これらの最先端のトレーニング実行には、それぞれ4〜16ギガワットの計算パワーが必要となる可能性があります。
Epoch AIは、2030年までに米国のAI電力容量が50GWを超える可能性があり、世界全体の容量は100GWを超えると予測しています。
なぜASICが推論を席巻しているのか
Googleは数年前にTensor Processing Unitsでこれを実現しました。AmazonはInferentiaチップを持っています。Epoch AIが予測するこのトレンドは、ニッチな戦略ではなく、2030年までに推論市場の約半分が向かう方向であることを示しています。
この成長軌道における制約は軽微なものではありません。電力需要、チップ生産能力、データ転送の制限はすべて実際の課題を呈しています。Epoch AIの評価では、これらのボトルネックは、現在の成長前提のもとで管理可能であるとされています。
これは投資家にとって何を意味するのか
推論コンピューティングが成長の方向性であるなら、半導体セクターへの投資理論は大きく変化する。トレーニングには依然としてGPUが必要であり、トレーニング予算は年間4〜5倍のペースで拡大し続けている。しかし、より高ボリュームで継続的な収益機会は、推論にますます集中している。
米国だけで50GWのAI電力容量について話す場合、これはデータセンター、発電設備、冷却システムの大幅な拡張を意味します。
注目すべきリスクは、コンピューティングの年間4〜5倍の成長率が持続可能かどうかです。Epoch AIの予測は現在のトレンドが継続すると仮定していますが、エネルギー制約や地政学的なチップ供給の動向がすべて摩擦を引き起こす可能性があります。
