AIトークンのコスト急騰を受け、クラウド巨人がPTUモデルに移行

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
新規トークン上場が注目を集める中、AIトークンコストの急騰を受け、クラウド大手がPTUモデルへ移行しています。トークン上場のニュースでは、マイクロソフト、アマゾン、グーグルの2026年における5兆ドルの支出計画が強調されています。2年間で1,000倍に増加したトークンの利用により、コスト管理のためトークン価格からPTUへの移行が促されています。マイクロソフトはエコシステムの強みを活用し、AWSは効率性に焦点を当て、グーグルはパフォーマンスを重視しています。この変化は、半導体メーカーとアプリ開発者に影響を与えるAIバリューチェーンを再構築します。

2026年の春、北米のクラウドコンピューティング大手の決算期が一斉の「苦難の日」になった。

マイクロソフトのインテリジェントクラウド部門の四半期収益が初めて500億ドルを突破し、Azureは前年比39%増となったが、決算発表後株価は約10%下落した。アマゾンのAWSは13四半期ぶりの最速成長率を記録し、翌日株価は11%急落した。グーグルクラウドの収益は48%急増したが、株価は依然として取引終了後には上昇から下落に転じた。

理由は一つだけ:お金。あるいは、制御不能になっているAIの請求書。

大手企業の決算書を確認すると、マイクロソフトは1四半期の資本支出を375億ドルとし、前年同期比66%増加した。年間の見通しは示していないが、分析によれば、この四半期の資本支出の傾向が継続すれば、年間支出は1000億ドルを超える見込みである。アマゾンは2026年の支出を2000億ドルと発表し、グーグルは1750億~1850億ドルを投資する計画で、これは2025年の約2倍である。

三大巨头の合計支出が5000億ドルを突破し、これはノルウェーの2024年全年GDPに相当する。

資本市場はどのようなことに不安を抱えているのか?クラウド事業の成長が十分でないからか?明らかにそうではない。大口顧客がより多く利用するほど、クラウドベンダーの請求書は逆に「爆発」しやすくなる。「どのように料金を徴収するか」を巡る暗闘が、シリコンバレーで静かに繰り広げられている。その勝敗は、AI産業全体の価値分配を再構築するだろう。

01 Tokenモードがディープユーザーにペナルティを課し始めました?

無視できない事実として、トークン課金モデルはAIの普及に最も貢献した要因の一つとなっている。

2024年初、中国の1日あたりのトークン呼び出し量は1,000億であったが、2025年末には100兆まで急増し、今年3月には140兆を突破した。2年間で1,000倍以上成長した。

同時に、「小龙虾」が話題となる中で、AIは「おもちゃ」から「生産ツール」へと変化し、トークンモデルの欠点が顕在化し始めた。

AIエージェントの例を挙げると、従来のチャットボットは1つの質問に数百〜数千のトークンを消費するが、タスクを自立して完了できるAIエージェントは、複数回の推論を繰り返し、ツールを何度も呼び出し、大量のコンテキストを読み取る必要がある。業界関係者の推計によると、エージェントのトークン消費量は数十倍に膨らむことがあり、複雑なタスクでは通常の会話の100倍から1000倍にもなる。

OpenAIは2026年3月、视频生成ツールSoraをサービス終了した。その理由の1つは収支の不均衡だった。新京報は分析機関SemiAnalysisの推計を引用し、Soraの1日あたりの運用コストは約1500万ドル、年間コストは540億ドルに達すると報じた。

OpenAIのプロジェクトリーダーは明言した。「現在の経済モデルは完全に持続不可能である。」ビデオ生成に必要な計算リソースは、テキストや画像生成をはるかに上回り、1回のビデオ生成に必要なGPUリソースは、ChatGPTが数十の質問に回答するのに十分であるため、コアビジネスのリソースを深刻に圧迫している。

トークンモードでは、AIを多く使用するほど請求額が制御できなくなります。NVIDIAのCEO、ジェンセン・ホアンは、今後NVIDIAのエンジニア全員に「年間トークン予算」が与えられ、高給のエンジニアが1年でほとんどトークンを消費しなければ、かえって不思議だと述べています。

業界が「利用量が増えるほど恐れる」という段階に至ったことは、課金モデルに根本的な問題があることを示している。

使えば使うほど、私が儲かるのは素晴らしいように聞こえる。しかし、大口顧客はAIの請求額の大幅な変動に直面し、CFOはスケールアップの予算を承認することができない。トークンモデルは、最も使用量が大きく、利用シーンが深いトップ顧客を逆に罰している。これは、クラウドベンダーが長期的に市場を拡大するという利益に反している。

この背景之下、北米のクラウドプロバイダーが次々と導入した新ツールはPTU、つまり予約済みスループットユニットです。

簡単に言えば、顧客は事前に一定量の計算能力を購入し、月額、四半期ごと、または年額で固定料金を支払います。これは実際のトークン消費量とは無関係です。トークンモデルは「使った分だけ支払う」方式ですが、PTUは「月額すべて食べ放題」です。顧客はコストの安定性を得られ、クラウドプロバイダーは顧客のロイヤルティを確保できます。

その背後にある駆け引きのロジックは完全に変わった。

トークンモードでは、両者は「ゼロサムゲーム」であり、顧客が費用を抑えることはクラウド事業者の収益減少を意味し、顧客が更多の費用を支払うことはクラウド事業者の収益増加を意味する。しかし、大口顧客はコストがコントロール不能になることを恐れて使用量を削減した結果、クラウド事業者の収益成長が予想を下回った。

PTUモードでは、ゲームが「正和」に変化し、顧客が予算を固定した後、AI利用量を拡大しやすくなります。クラウドベンダーの収益成長はより持続可能になります。本質的には、リスクを顧客側からクラウドベンダー側に移転し、顧客との深い関係構築を実現しています。

国信証券は、中国のモバイルインターネット料金の変遷を類似させた。

2G時代には、データ使用量がKB単位で課金され、0.01元/KBと高額だったため、ユーザーはデータ使用をためらうほどだった。3G時代には課金単位がMBに移行し、150元で3GBのパックが登場し、ユーザーはようやく自由にデータを使い始められた。4G時代には「速度向上と料金引き下げ」の政策により、無制限データプランが爆発的に広がり、2016年には腾讯の「大王カード」が月額19元で腾讯系アプリのデータ使用を無料にするサービスを提供し、ユーザーは「データを購入する」から「サービスを購入する」へと完全に転換した。5G時代には、課金方式はさらに「速度レベル別」に進化し、データ使用量そのものは価格決定の中心不再是。

料金モデルの変更は、産業チェーンにおける発言権の再分配を意味する。通信事業者が「1KBあたりの課金」という高利益モデルを放棄した結果、ユーザーの月間平均データ利用量は30MBから10GB以上へと急増し、全体の市場規模は数百倍に拡大した。

今日のクラウドプロバイダーの選択は、当時の通信事業者と全く同じである。彼らは短期的な粗利益率を犠牲にしても、長期契約の安定性を獲得しようとしている。国信証券の研究レポートによると、PTUの転換により、クラウド事業の粗利益率構造は「高弾力性の変動」から「高耐久性」へと変化し、短期的には圧力を受けながらも、長期的にはより健全で安定した状態になる。

02 三大巨头的差异化策略

マイクロソフト、AWS、グーグルの3大企業は、表面上はすべてPTUを推進しているが、その本質的な戦略はまったく異なる。

マイクロソフトはエコシステムの束縛に頼っている。マイクロソフトの武器は、Windows、Office 365、GitHubで構成される巨大なエコシステムである。同社は「Azure AIコミットメントプログラム」を導入し、企業顧客に1〜3年の消費コミットメント契約を締結するよう促している。今四半期、マイクロソフトの商業未履行義務は6250億ドルに急増し、前年同期比で2倍以上となった。そのうち45%はOpenAIとの新規契約2500億ドルによるものである。

マイクロソフトの計算は精緻で、最高レベルの価格決定権とは、顧客がAIのコストを個別に計算できなくすることである。AIがWord内の一つのボタンになれば、予算は自然とソフトウェアのサブスクリプション料に統合される。しかし、単一の顧客への過度な依存は市場の懸念を招き、OpenAIの経営が圧迫された場合、連鎖反応がマイクロソフトに直撃する。

AWSはコスト優位性に依存しています。AWSの強みは、自社開発のTrainiumおよびInferentiaチップ、そして世界最大のクラウドインフラ規模です。AWSは、顧客にオンデマンド料金よりも大幅に優れた価格を提供する「AI/ML節約プラン」を積極的に推進しています。

アマゾンのCEO、アンディ・ジャシーは決算会議で次のように強硬に述べた。「1420億ドルの年間売上高を基に24%の年間成長を達成することは、競合他社がはるかに小さな基準値からより高い割合の成長を達成することとは全く異なる。」

AWSは、極限のサプライチェーン効率により競争優位を築き、単位計算能力コストが業界最低であるため、価格戦争を恐れていない。決算説明会で経営陣は繰り返し「新規計算能力は迅速に収益化できる」と強調しており、これは規模の経済が最終的にすべてを圧倒すると賭けていることを意味する。

一方、グーグルはパフォーマンスプレミアムによって利益を上げている。グーグルはAI技術の蓄積が最も深く、自社開発のTPUは第7世代まで進化しており、Geminiモデルの月間アクティブユーザーは7.5億人に達している。第4四半期のグーグルクラウドの売上高は48%増加し、競合他社を大きく上回る成長率を記録した。

Googleは、AIプラットフォームに「割引利用の約束」を拡大し、パフォーマンスに極めて高い要求を持つ顧客を引き付けている。同社は、顧客数を最大化するのではなく、最も収益性の高い高級顧客を自社に縛りつける技術的ラグジュアリー路線を採っている。

Appleとの協力はさらに重要な一歩です。GoogleはAppleの選ばれたクラウドサービスプロバイダーとなっており、両社は基礎モデルの開発を共同で進めています。これにより、GoogleのAI技術がAppleデバイスを通じて世界中のユーザーに届けられます。

3つの戦略は、それぞれ異なる経済的バリアを表している:マイクロソフトは移行コスト、AWSはスケール効果、グーグルは技術的優位性によるものだ。PTUの移行から最も恩恵を受けるのはどの企業かを判断するには、そのバリアが長期契約のロックイン期間中に持続的に有効であるかどうかを評価することが核心である。

しかし、PTUの転換の影響はクラウドプロバイダーと大手顧客の間で止まらず、上流のチップメーカーから下流のアプリケーション企業にまで波及します。

上流のチップメーカーが最初に恩恵を受ける。トークンモデルでは、クラウドプロバイダーの計算リソース調達は「パルス状」である——トラフィックが急増した際に緊急に注文を増やし、低谷期にはリソースが闲置する。PTUモデルでは、長期契約によりクラウドプロバイダーが上流により滑らかで予測可能な注文を出すことができる。

マイクロソフトは2026年までにAI計算能力を80%以上向上させる計画であり、今後2年でデータセンターの規模を倍増させる。NVIDIAなどのチップメーカーの生産計画はより余裕を持ち、サプライチェーンの効率が大幅に向上する。

下流のAIアプリケーションプロバイダーはさらに洗練され、PTUモデルでは大手顧客がリソースを確保することで、中小顧客のリソースプールが圧縮される可能性がある。AIアプリケーションの起業门槛は高まっており、過去はトークンによるオンデマンド課金で開始できたプロジェクトも、今後はより高い初期コストが求められるだろう。一方で、PTUの利用率を最適化するためのツール層企業——AI負荷スケジューリング、コスト管理SaaS——には構造的な機会が訪れる。

国信証券の研究レポートによると、価格設定モデルの変革は転換点にあり、今後1年以内に変革の影響が消化された後、注文の長期契約化のトレンドにより、収益と利益の成長の確実性が大幅に向上すると予想される。

03 結語

トークンからPTUへの移行は、AI産業が「無秩序な成長」の実験段階から「精緻な運用」の商業的成熟段階へと進んだことを示している。

モバイルインターネットがKB単位の課金から無制限データプランへと移行してきた歴史を振り返れば、正是料金モデルの成熟が、短视频、ライブ配信、クラウドゲームなどの兆円規模の市場を生み出した。今日のAI課金に伴う苦痛は、次の「抖音級」AIネイティブアプリケーションへの道を切り開いている。

もちろん、PTUは終点ではありません。モデル即サービス(MaaS)の台頭に伴い、AIの課金はさらに「ビジネス結果に基づく課金」へと進化する可能性があります。価格決定権の駆け引きは、AI産業の進化を観察するための核心的な手がかりです。

このプロセスにおいて、真の勝者は「顧客を固定する」から「顧客にサービスを提供する」へと転換したプレイヤーとなる。価格決定権がゼロサムゲームからウィンウィンの協力へと移行したとき、AIの商業化における成人式は真正に完了する。

本文は微信公众号「市值榜」(ID:shizhibang2021)より、著者:市值榜チーム

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。