偽名で活動する研究者であるZeitgeistは、人工知能向けメモリの需要が、現在の世界の生産能力をはるかに上回っていると述べた。彼の見解では、メモリメーカーの株価が過去の最高値ではなく、実際の計算リソース需要に基づいて評価されれば、現在の水準から10倍に上昇する可能性がある。
Zeitgeistは、昨年9月にマイクロンの株式に5万ドルを投資した場合、現在では約48万9千ドルの価値があるという鮮やかな例を挙げました。彼によると、一部の投資家はすでにこの動きを見逃したと恐れている一方で、他の投資家は「大手プレーヤーが保有資産を退出させるための流動性」となることを恐れています。アナリストは、記憶需要の算術的観点からこの機会を異なる視点で見ることを提案しています。
なぜメモリがボトルネックとなったのか
各アクセラレーターは、拡張できない固定数量の高スピードメモリ、いわゆるHBMを搭載しています。アナリストによると、標準的なH100チップは80 GBのみを搭載し、より新しい世代では最大192 GBまで提供され、将来のB300は288 GBを搭載する予定です。この上限が、単一のアクセラレーターが処理できるリクエストの数を決定します。
主な負荷はモデルの重み自体ではなく、いわゆるKVキャッシュ、つまり生成される単語ごとに増加するセッションメモリから生じます。Zeitgeistの計算によると、128,000トークンのコンテキストを持つ1セッションには約20GBのメモリが必要です。このようなセッションを4つだけでも、1台のH100のリソースを完全に消費します。
コンテキストウィンドウのサイズとH100アクセラレーターあたりのセッション数に応じた1セッションあたりのメモリ使用量。出典:Zeitgeist
Claude Opus 4.8やGPT-5.5のような高度なモデルでは、要件はさらに高くなり、1回の長時間リクエストで40GBから100GBが必要になります。アナリストによると、これが1ギガバイトのメモリが金と同等の価値を持つ理由であり、マイクロンやSKハニックスなどのメーカーは生産を物理的に十分な速さで拡大できないのです。
AIエージェント効果と需要ギャップ
Zeitgeistによると、重要な変化はシンプルなチャットボットからAIエージェントへの移行です。通常の質問はメモリにほとんど負荷をかけませんが、ツールを独立して呼び出し、コンテキストを蓄積するエージェントは簡単に10万トークン以上に達します。1人の知識労働者がこのようなエージェントを10個並列で実行すると、約152GBのメモリが必要になります。
並列チャットおよびエージェントセッション中の知識労働者1人あたりの最大メモリ使用量。出典:Zeitgeist
アナリストは、世界中に約2億5千万人の知識労働者がいると指摘した。この数に同時実行されるエージェントセッションの数を掛けると、メモリ需要は単に増加するだけでなく「爆発的」に拡大する。彼の推計によれば、1人あたり1日100セッションのエージェントセッションが実行された場合、世界は2026年に生産されるメモリの約60倍が必要になる。
Zeitgeistは、アルゴリズムが時間とともにメモリ使用量を削減すると認識しており、新しい「注意メカニズム」は負荷を4〜8倍削減できる可能性があると述べた。しかし彼の見解では、需要ははるかに速く増加している:エージェントが単純なチャットに置き換わっており、コンテキストウィンドウは128,000トークンから1,000万トークンへ拡大しており、従業員1人あたりのAI利用はゼロから数百セッションへと移行している。
アナリストによると、言語モデルが「日常のあらゆる側面に織り込まれる」世界では、メモリが重要なリソースとなる。彼の予測では、メモリを生産する企業は前例のない収益を生み出すだろう。
AIメモリ需要の急増によりSKハイニックスがサムスンを上回る
AIメモリーブームの規模はすでに半導体市場を再構築しています。韓国のメモリーメーカーSKハイニックスは、AIワークロードに使用される高帯域幅メモリーチップで強力な保有資産を有し、韓国で最も価値のある上場企業としてサムスンを上回りました。
Zeitgeistにとって、この変化は、メモリ生産者がAIインフラ競争の最大の恩恵受給者となりつつあるというより広範な仮説を裏付けている。HBMへの需要が供給を上回る速さで拡大する中、先進的なメモリチップを生産できる企業は、収益と評価額が急激に上昇する可能性がある。
