AI時代の駆動力は、モデルからトークンへと変わった

過去2年間、AI業界の前半戦の物語は、各大手企業が展開した「大モデル戦争」を中心に展開されてきた。パラメータ数は数千億から兆単位へ、トレーニングコストは数千万ドルから数億ドルへ、GPUクラスタは数千枚から数万枚へと拡大した。誰のモデルがより強力で、誰がAGIに最も近づいているかが議論の中心となり、AI競争の到達点は大モデル自体の性能に示されると考えられているかのようだった。

そして2026年には、AI業界の駆動ロジックは変わった。JPMorganの最新レポートによると、今後AIインフラの持続的な拡大を牽引するのは、モデルのトレーニングではなく、膨大なAI推論（Inference）需要である。今後、最も計算リソースを消費するのは、大規模モデルのトレーニングではなく、世界中に展開されるAIエージェントとなる。一度の呼び出し、一度のインタラクション、一度のタスク実行のすべてが本質的にトークンを消費する。AI産業は「モデル時代」から「トークン工業時代」へと移行している。

将来、AI世界を実際に駆動するのは、モデルそのものではなく、トークンを巡る生産・配布・スケジューリング・消費のシステムである。特にAIエージェントが大規模に登場した後、トークンがどのようにリアルタイムで生成され、地域を越えて配布され、動的にスケジューリングされ、効率的に消費されるかが、AI産業における最も核心的な新たな課題となる。

黄仁勲が最近提唱したように、AIは単なるソフトウェア業界ではなく、電力やインターネットと同じようなインフラ体系である。彼の「五層ケーキ」アーキテクチャでは、AI産業はエネルギー、チップ、インフラ、モデル、アプリケーションの五層に分類されている。AI産業が「トレーニング時代」から徐々に「推論時代」へ移行する中、GoodVision AIは、AI経済の全体的な産業チェーンをトークンを巡る「七層ケーキ構造」として捉える傾向にある：

第1層：電力——AI時代のエネルギー基盤
第2層：AIDC——トークン工場
第3層：GPU——トークンの生産設備
第4層：LLM——トークンの生成エンジン
第5層：トークン配分——AI時代の「電力網」
第6階層：トークン最適化とインテリジェントスケジューリング——AI時代の脳
第七階：AI Agent——トークン消費端末

エネルギー、GPUからAIDC、エッジノード、さらにモデル推論とインテリジェントスケジューリングに至るまで、AI産業は前例のない「トークン産業体系」を形成している。

しかし、現在の段階では、このシステムはまだ未熟です。

最先端のGPUを保有しながら電力に制約される者、大規模なAIDCを構築しながら効率的なスケジューリングに欠ける者、強力なAIエージェントを開発しながら高額な推論コストと遅延に直面する者、エッジノードを掌握しながら統一された協調ネットワークを構築できない者。産業全体は急速に発展しているが、各層間には依然として多くの分断、重複、効率のボトルネックが存在する。

そして、この7層のインフラが真正に連携し、接続されたとき、AI産業は今日の「ツール時代」から、知的ワールドに属する「大規模採用時代」へと真正に移行する。

最初のケーキの層：電力——AI時代のエネルギー

産業革命では石炭と石油が争われ、インターネット時代ではトラフィックとサーバーが争われたが、AI時代には、最も基本的な戦いが再びエネルギーに戻っている。

AI は最終的に電力を消費するからだ。大規模なAIデータセンターの電力消費量は、すでに中規模都市に匹敵している。世界中で新設されるAIDC（AIデータセンター）は、同じ問題に直面している：GPUは購入でき、土地は建設できるが、電力供給が追いつかず、電力網の調整も追いついていない。

これが、ますます多くのAI企業がエネルギーインフラに再び注目し始めている理由です。GTC 2026で、ジェンスン・ホアンは、将来のデータセンターを「トークン工場」と定義しました。その工場の最上流には、超大型エネルギー産業が生まれるでしょう。

中国市場では、長江電力、中国原子力発電、中国広核、三峡エネルギー、龍源電力、華電新エネルギーなどの企業が、水力、原子力、風力、太陽光などの主要なエネルギー分野を代表している。その中で、原子力と水力は安定した電力供給能力により、AIDCにとって最も重要な基盤エネルギーとなっている。一方、風力と太陽光は、AI業界におけるグリーン電力とESG需要の拡大により恩恵を受けている。「東数西算」や大規模AIデータセンターの建設が進むにつれ、新エネルギー基地と計算能力センターとの連携関係は急速に強化されている。

米国市場では、NextEra Energy、Dominion Energy、Duke Energy、Southern Co.、Exelon などの従来のエネルギー大手も、AIデータセンターの拡大によって恩恵を受けています。その中で、NextEraは北米の再生可能電力のリーダーであり、Dominionは北バージニアの「データセンター回廊」の核心的な送電リソースを掌握しており、Exelonは原子力発電による安定した電力供給能力を活かし、AI時代における「24時間安定電力」需要の主要な受益者となっています。全体として、世界の電力業界は従来の公共事業から、AIインフラ時代のコアリソース層へと徐々に進化しています。

AIデータセンター

全体として、この層の競争構図は、従来のエネルギー企業間の「電力価格競争」から、下流のAIデータセンター、クラウド事業者とエネルギー企業間の「電力の確保権競争」へと移行しつつある。長期的で安定し、低コストなエネルギーを確保できる者が、トークン生産の最初のドラゴンボールを手にするのだ。

第二層のケーキ：AIDC——トークン原料工場

単一のGPUには意味がなく、真正に重要なのはスケーリングされたクラスタである。そのため、AIDCが登場した。

それは工業時代の製鉄所、発電所、生産ライン工場のように、数万枚のGPUを集中させ、安定したToken生産能力を構築する。しかし、工場の問題も生じ始めた：従来のAIDCの建設サイクルは通常18〜36ヶ月に及び、電力網の拡張にはさらに時間がかかる。AI需要が指数関数的に増加する中で、旧時代のIDCの建設速度では、新たなToken経済を満たすことができなくなっている。

米国株式市場において、Equinixは30カ国以上にまたがる240以上のデータセンターを運営する、世界をリードするデータセンターオペレーターの一つです。その核心的な強みはデータセンターの数だけでなく、グローバルな接続能力と低遅延ネットワークリソースであり、そのためAI計算能力の展開における重要なインフラノードとなっています。

Digital Realtyは、PlatformDIGITALプラットフォームを通じてAIインフラに参入し、大手クラウドサービスプロバイダーおよび金融機関を対象としています。

中国市場において、潤沢科技はA株式市場で最も典型的なAIDCオペレーターの1つである。同社の主要事業は、従来のIDCからAI計算能力センターへと徐々に昇格しており、その核心的競争力は大規模データセンター、電力資源、およびAIDCの運用保守能力にあります。奥飛データや首都オンラインなどの企業は、それぞれ地域データセンター、クラウドインフラ、AI計算能力のアウトソーシング分野で継続的に拡大しています。中科曙光はAIDC事業において、政府・企業および科学研究分野との協力を重視しています。

一方のプレイヤーは「鉱山からの転換」に由来する。CoreWeave、IREN、Applied Digital、Cipher Mining などの企業は、もともと暗号通貨マイニングに関連していたが、AI GPU の需要が急増したことで、急速にAI計算インフラへとシフトした。IRENは「再生可能エネルギー＋AI計算」モデルを打ち出し、再生可能エネルギーを活用して高密度GPUデータセンターを構築している。Applied DigitalとCipher Miningも、従来の鉱山からAI高性能計算インフラへの転換を進めている。

AIデータセンター

また、エッジ化、小型化、モジュール化されたAI Factoryが新たなトレンドとなり始めています。インターネット時代が大型コンピュータからクラウドコンピューティングへと移行したように、AIの計算能力も超大規模な中央ノードから地域的なエッジノードへと徐々に拡散していく必要があります。

そのため、GoodVision AI は、より軽量でモジュール化され、迅速に複製可能な AI Factory の構築という別の道を選択しました。従来の大型 AIDC と比較して、GoodVision AI は地域展開能力、高密度 GPU クラスタの効率、およびエネルギーと計算能力の統合的協調を重視しています。

その核心ロジックは、単一の超大型データセンターを建設することではなく、世界中の人口密集地域に2〜4MWの小型推論計算施設としてAI Factoryノードを迅速に展開することです。このモデルは、地域のエネルギー資源への迅速な接続を可能にするだけでなく、今後のAI推論需要がエッジ側に拡散するトレンドにも適しています。

従来のAIDCが工業時代の大規模な製鉄所に例えられるなら、GoodVision AIが構築したものは、AI時代の「地域化トークン工場」に似ている——軽量で柔軟性があり、ユーザーに近いだけでなく、今後のグローバル分散型推論ネットワークの発展方向にも適している。

第3層のケーキ：GPU——トークンの生産設備

電力がエネルギーであるなら、GPUは生産設備である。AIの爆発的成長の初期段階では、GPUは主にトレーニングに使用されていたが、今後はより大きな需要が推論から生まれる。トレーニングは一部のトップ企業に限定される一方、推論はあらゆるアプリケーション、デバイス、エンドポイントに浸透する。ロボットは推論を必要とし、自動運転は推論を必要とし、AIグラスも推論を必要とする。さらには、将来のあらゆるAIエージェント間の協力も、リアルタイムでトークンを消費する。

NVIDIAは現在もグローバルなAIチップ産業における絶対的な中心的存在である。そのH100、B200、BlackwellなどのGPU製品は、現在のグローバルなAIトレーニングと推論の基準をほぼ定義している。さらに重要なのは、NVIDIAがチップを販売するだけでなく、CUDA、TensorRT、DGX、HGXなどのソフトウェア・ハードウェアエコシステムを通じて完全なエコシステムを構築している点である。そのため、NVIDIAの競合他社はGPUの性能だけでなく、全体のAIソフトウェアエコシステムにも挑戦しなければならない。

AMDは現在最も主要なGPUの競合企業であり、主力製品にはMI300XなどのAI GPUが含まれます。NVIDIAと比較して、AMDはオープンなエコシステムとROCmソフトウェアプラットフォームをより重視し、よりオープンなアプローチでAI開発者と企業顧客を引きつけようとしています。

BroadcomとMarvellは、ASICと高速インターコネクトという別の道を示しています。AI推論シナリオがますます複雑になるにつれ、より高いエネルギー効率と低コストを実現するために、多くの企業がカスタムASICチップの開発を試みています。

インテルはサーバーCPUとGaudi AIアクセラレーターカードを通じてAI市場に参入し、自社のCPUエコシステムを活用してAIインフラ競争に再参戦することを目指している。

中国市場において、寒武紀は国産AIチップの代表的な企業の一つであり、思元シリーズのAIチップを主力とし、自社開発のAIフレームワークNeuwareを構築している。海光情報はAMDのZenアーキテクチャのライセンスを保有し、DCUおよびAI推論市場に重点を置いている。

モールテクノロジー、スイユアンテクノロジー、ムーチー株式会社、ビレンテクノロジーなどの中国製GPU企業は、中国AIチップの「国産代替」の方向性を代表している。これらはすべてCUDAエコシステムとの互換性を強調し、国産GPUクラスターの構築を試みている。

AIデータセンター

CUDAエコシステムからHBMメモリ、さらにTensor Coreまで、AI産業全体の核心は、単位時間あたりのToken生成効率を継続的に向上させることである。同時に、GPUおよびその背後にあるサーバー、光モジュール、液体冷却、スイッチング装置などのインフラも、Token生成効率と密接に関連している。

これらは NVIDIA や OpenAI といった AI アプリケーション企業のように目立たないが、AI 世界全体が実際に機能するかどうかを決定づけている。産業革命が蒸気機関だけでなく、鉄道、電力網、港湾を必要としたように、AI 革命も単なるソフトウェアの革命ではない。エネルギー、チップ、ネットワーク、クラウドコンピューティング、インフラに至るまで、グローバルなサプライチェーン全体のアップグレードである。

AIデータセンター

Vertivは、データセンターのUPSおよび電力管理の世界的リーダーであり、データセンターの電力供給、ラック配電、精密空調システムを提供しています。

英维克はA株式市場における液体冷却および温度制御システムのリーディングカンパニーで、BATなどの大手インターネット企業を顧客に持つ。GPUの電力がますます高まる中、液体冷却はAIDCにとって重要な標準装備となりつつある。

中恒電気、科華データ、科士達などの企業は、UPS、電源システム、IDC電力供給分野で重要な地位を占めています。

ネットワークおよび光モジュール分野では、中際旭創、新易盛、天孚通信などの企業が、AIクラスター内の高速通信需要の急増の恩恵を受けています。

サーバー全体の面では、Dell、HPE、Supermicro、Lenovo、Inspurなどの企業がAIサーバーの大規模組立と納品を担っています。

この層は直接エンドユーザーに向けられているわけではないが、AIインフラが安定して動作するかどうかを決定づける。液体冷却、UPS、光モジュール、スイッチ、蓄電、サーバー全体が、産業時代の鉄道、電力網、港湾のように、AIの世界における真の「鍬を売る」ビジネスとなっている。

第4層のケーキ：LLM——トークンの生成エンジン

LLM（大言語モデル）は、トークンがどのように理解され、生成され、組織されるかを決定します。過去2年間、OpenAI、Anthropic、Google、Meta、xAI、DeepSeekなどの企業が世界的な「大モデル競争」を巻き起こしました。パラメータ数は千億から兆へと拡大し、モデルの能力はテキスト生成からマルチモーダル、推論、コード、エージェント協力、長期記憶へと徐々に拡張されてきました。

しかし、業界が徐々に発展するにつれて、市場は次第に認識し始めている：今後の真に重要なのは、「誰が最大のモデルを所有しているか」ではなく、誰がより低コストで、より高効率にモデルを継続的に運用できるかであるということを。モデルそのものは直接価値を生み出さず、価値を生み出すのは、モデルが継続的に呼び出された後の推論プロセスである。

これはまた、LLMが過去の「モデル能力のデモンストレーション」から、AI世界における「トークン生成エンジン」へと徐々に進化していることを意味します。

OpenAI、Anthropic、Google Gemini、Meta Llama などの閉源およびオープンソースモデルが、未来のAIエコシステムの入口を巡って競争している一方で、DeepSeek などの新興プレイヤーは、より低コストでより高い推論効率を実現することで、業界の競争格局を再構築し始めている。現在、LLM層の競争はもはや単にパラメータ数の競争ではなく、評価基準は複数の次元に拡大しつつある。

トークンコスト
推論効率
コンテキスト能力
マルチエージェント協働
長期記憶
モデルとインフラストラクチャの連携能力

AIデータセンター

AI時代において真に重要なのは、大規模モデルが「賢い」ことではなく、そのモデルを世界規模で持続的かつ大規模、低コストで運用できるかどうかです。GoodVision AIもこの層面で独自の最適化ソリューションを備えています：大規模モデルベンダーと提携し、大規模モデルをAI Factoryデータセンターにデプロイすることで、従来の計算リソース賃貸事業から直接トークンサービスを提供へと転換しています。これにより、事業の粗利が向上するだけでなく、ユーザーの利用体験もさらに向上します。

第5層のケーキ：トークン配布——AI時代の「電力網」

AIDCが完成した後、次の問題が生じた：これらの計算能力を世界中でどのように利用するか？

その結果、算力レンタルプラットフォームが登場しました。これらはAI時代の「電力網システム」のように、従来の集中型GPUリソースを分割・配分し、開発者、企業、AIアプリケーションに必要な分だけレンタルします。

AWS、Azure、Google Cloud、阿里云、騰訊雲は依然としてこの層で最も強力なプレイヤーである。それらは世界最大のクラウドインフラを保有しており、AI GPUリソースを次第に自社のIaaS体系に統合している。

一方で、「AIネイティブクラウド」と呼ばれる新興企業が急速に台頭しています。CoreWeave、Nebius、Nscaleなどの企業は、AIトレーニングと推論のニーズに特化してGPUクラウドプラットフォームを構築しています。従来のクラウドプロバイダーと比較して、これらはより柔軟でAIタスクに特化しており、GPUクラスタの最適化にも優れています。

CoreWeaveは、現在NeoCloudで最も代表的な企業の一つです。同社は当初イーサリアムのマイニングに特化していましたが、その後AI GPUクラウドサービスに全面的にシフトし、現在ではNVIDIAが重点的に支援するAIインフラ企業となっています。

DigitalOceanやVultrなどの軽量クラウドプラットフォームは、中小開発者やスタートアップを対象に、迅速なデプロイと低コストのGPUサービスを強調しています。

中国市場では、大手企業以外にも、優刻得、金山雲、首都オンラインなどの企業が、GPUクラウドおよびAI計算能力レンタル市場の主要サプライヤーです。この層の競争構造は、初期の電力網に非常に似ています。分散した計算能力をいかに効率的に配分するかが課題です。

AIデータセンター

第6層のケーキ：トークン最適化とスマートスケジューリング——AI時代の脳

これはおそらく最も見過ごされがちだが、最も重要な「ケーキ」の層である。AI Agentの利用が爆発的に増加した後、すべてのタスクが最も高価な大規模モデルを呼び出す価値があるわけではないことが明らかになった。多くの単純なタスクはローカルモデルで十分処理でき、多くのリアルタイムタスクはエッジ推論に適しており、多くのプライバシーに関わるタスクはクラウドにアップロードすることすらできない。「計算リソースがあるかどうか」という問題に加え、「どのようにより賢く計算リソースを使用するか」という新たな問題が生じた。

トークン需要の指数的増加に伴い、「適切なモデルを、適切な計算リソースで、適切なタスクに適用する」ことが、トークンを適切かつ効率的に使用する鍵です。GoodVision AI は、AIトークン工場の展開に加え、この方向性にも力を入れています。

今日の電力システムと同じです：一部の需要は大規模電網から来ており、一部の需要は屋根上の太陽光発電から来ています。そして、本当に重要なのは、その中間にある「スマートな調整システム」です。

将来のAIも同様の構造となる：単純なタスクはローカルの小型モデルが処理し、複雑なタスクはクラウド上の大型モデルを呼び出し、高セキュリティ要件のタスクはエッジ側で処理され、高並列タスクはハイブリッドクラウドによって動的にスケジューリングされる。

Goodvision AI に加え、青雲科技、Lambda、OpenRouter、Fireworks AI などの企業も、トークン最適化とインテリジェントスケジューリングの分野で優れています。

この「ケーキ」の層は、前2つの「ケーキ」の層——AIDCと算力レンタル——と高度に重複するプレイヤーを抱えている。GPUリソース、リージョナルノード、推論タスクの規模が拡大するにつれ、単に「算力を所有する」だけでは長期的な競争優位を築けなくなっている。ますます多くのAIDC運営者とGPUクラウドプラットフォームが、今後の効率と利益率を決定する要因はGPUの数だけでなく、モデル・算力・トークントラフィックを動的にスケジューリングする方法であることに気づき始めている。

そのため、AIDCとGPUクラウドに当初注力していた多くのプラットフォームが、「スマートスケジューリング層」へと拡張を始めている。例えば中国市場のUCloud、Capital Online、Sugonなどの企業は、自社のGPUクラウドインフラ、マルチクラウドリソース、推論スケジューリング機能を統合し、徐々に「計算能力の販売」から「計算能力の最適化」へと移行している。

AIデータセンター

第7層のケーキ：モデルとエージェント——トークンの消費者

この層はユーザーに最も近く、流量を得やすい一方で、競争も最も激しい。GTC 2026で、ジェンセン・ホアンは、今後すべての企業が「トークン生産者かつトークン消費者」になると述べた。

AIエージェントは、複数のモデル、複数のツール、複数のAPIを同時に呼び出し、継続的に推論、計画、実行を行います。これは、将来AIが消費するトークン量が、現在の人類とAIの対話規模をはるかに上回ることを意味します。現在、一部のAI重度ユーザーは、複数のエージェントを自前で構築し、並列で相互に呼び出すシステムを運用しており、毎日10億トークンを消費することも珍しくありません。

未来は10億人がAIを使用するのではなく、100億、さらには1000億のAIエージェントが同時に働き、互いに呼び出し合う世界である。そして、真のボトルネックは「モデル能力」から「トークンスケジューリング効率」へと移るだろう。

テクノロジー大手は言うまでもなく、Microsoft、Google、Meta、Amazon などが、オフィスシステム、検索、ソーシャルネットワーク、クラウドサービスを通じて、AI機能を次第にすべての製品に組み込んでいる。

Adobe、Salesforce、ServiceNow、Palantir などのエンタープライズソフトウェア企業は、エンタープライズ級のAIエージェントと自動化ワークフローの分野で急速に進展しています。一方で、Hugging Face はAI時代の「GitHub」となっています。これは単なるモデルコミュニティではなく、グローバルなAI開発エコシステムの重要なインフラです。

中国市場では、科大訊飛、崑崙萬維、三六零、金山辦公、商湯科技などの企業が、AIアシスタント、AIオフィス、AIエージェントの分野に取り組んでいます。

「七層ケーキ」が真正に形になったとき、AIの世界は真正に始まる。

今日のAI産業は、まだ完全に成熟していないインフラストラクチャ体系の中にあります。

最先端のGPUを所有しているが電力に制約される者、大規模なAIDCを構築したが効率的なスケジューリングに欠ける者、強力なモデルとエージェントを開発したが推論コストと遅延が高すぎる者、エッジノードを掌握しているが統一された協調ネットワークを構築できない者。

電力、AIDC、GPUからLLM、トークン配布、スマートスケジューリング、AIエージェントに至るまで、AI産業チェーンは急速に発展しているが、各層間には依然として多くの分断、重複、効率のボトルネックが存在している。

そして、この「7層のケーキ」が真正に完成し、効率的に協調して動作し始めるまで、AI産業は今日の「ツール時代」から、知的ワールドに属する「大規模採用時代」へと真正に移行することはない。

未来のAI世界では、少数のテクノロジー大手が大規模モデルを訓練するだけではなく、数十億のAIエージェントが継続的にオンラインで協力し、計算リソースとトークンを継続的に呼び出すようになる。毎回の会話、毎回の推論、毎回のツール呼び出し、毎回の自動タスク実行の背後には、エネルギー、GPU、ネットワーク、スケジューリングシステム、推論ノードの協調的な動作が存在する。

これはまた、AI業界が過去の「ソフトウェアロジック」から、エネルギー、チップ、クラウドコンピューティング、エッジネットワーク、スマートスケジューリングをカバーするスーパーインダストリーへと徐々に進化していることを意味する。

産業革命が蒸気機関だけでなく、鉄道、電力網、港湾を必要としたように、インターネット革命がPCだけでなく、光ファイバー、データセンター、クラウドコンピューティングを必要としたように、AI革命が真正に成熟する兆しは、ある1つのヒットアプリケーションではなく、世界中で継続的にトークンを生産・配布・スケジューリング・消費する「スマートインフラストラクチャネットワーク」が形成され始める点にある。

そして、この7つのインフラが最終的に真正に接続されたとき、AI業界の競争ロジックは根本的に再構築されるだろう。未来で最も重要な企業は、最も大きなモデルを保有する企業ではなく、エネルギー、計算能力、ネットワーク、モデル、トークンの流れを結びつける企業になるかもしれない。

AI業界が7層インフラで「トークン時代」へ

AI時代の駆動力は、モデルからトークンへと変わった

最初のケーキの層：電力——AI時代のエネルギー

第二層のケーキ：AIDC——トークン原料工場

第3層のケーキ：GPU——トークンの生産設備

第4層のケーキ：LLM——トークンの生成エンジン

第5層のケーキ：トークン配布——AI時代の「電力網」

第6層のケーキ：トークン最適化とスマートスケジューリング——AI時代の脳

第7層のケーキ：モデルとエージェント——トークンの消費者

「七層ケーキ」が真正に形になったとき、AIの世界は真正に始まる。