企業がAIツールを大規模に導入した後、新たな問題が一斉に浮上し始めた:モデルの性能が十分でないのではなく、請求額が急速に上昇していることだ。複数のテクノロジーおよびインターネット企業は、単一のトークン価格が下落しているにもかかわらず、AIコーディング、自動化アシスタント、エージェントツールの普及により、総消費量が急速に増加していることを発見した。
複数の企業が予算を前倒しで使い切った
TechCrunchは、いくつかの企業が2026年のAI予算を年初早々に使い果たしたと報じている。Uberは4月までに全年のAIコーディング予算を消費し、マイクロソフトは数か月後に一部の開発者のClaude Code利用権を取り消した。Pricelineの従業員によると、Cursorの通常の更新提案価格は以前より4〜5倍に上昇している。
この変化は、過去数ヶ月にわたって発表されたより強力なモデルに関連しています。Anthropic、OpenAI、Googleは昨年11月以降、エージェントシナリオに適した新しいモデルを次々とリリースし、呼び出し量をさらに拡大させました。ある企業は従業員の使用上限を設定しなかったため、Claudeの請求額が5億ドルに達しました。
生産性の向上がコストを必ずしもカバーするとは限らない
OpenAIの企業業務責任者であるAlexander Embrは、半年前は顧客がモデルの能力が十分かどうかを気にしていたが、現在の議論の焦点は支出の可視性、監査機能、トークン制御、モデルの効率に移っていると述べた。企業がAIを購入する際の課題は、「何ができるか」から「どれだけ費用がかかり、価値があるか」へと移っている。
AIコーディングツールのリターン・オン・インベストメントを巡り、業界内でも再計算が進み始めている。Faros AIが3月に2万名の開発者を対象に行った調査では、開発生産性は向上している一方で、バグや再作業も増加している。エンジニアリング管理プラットフォームのJellyfishの研究によると、AIを重度に利用するエンジニアの生産性は、低利用者と比較して約2倍だが、トークン消費量は10倍高い。
- AIを頻繁に使用するユーザーの生産性は、低頻度使用ユーザーの約2倍である
- 対応するトークンの消費量は約10倍高くなります
- 1人の開発者が9か月で消費量が約18.6倍に増加
コスト管理ツールの整備が加速しています
帳簿問題が拡大する中、AIコスト管理ツールの市場も活発化している。Linux財団は今週、Tokenomics Foundationの設立を発表し、クラウドコスト管理分野のFinOpsのように、AIトークン支出のための統一された言語と管理基準を確立することを目指している。
この組織は、トークンの使用と課金のオープンスタンダード、統一された指標、および「単位あたりのスマートコスト」や「ワットあたりのトークン数」などのコスト効率に関する新しい指標を策定する予定です。正式な開始時期は7月を予定しており、来週開催されるFinOps Xカンファレンスでさらに多くのメンバーが発表されます。
同時に、スタートアップ企業と成熟したメーカーがいずれも展開を加速しています。Pay-iやPaidなどの企業はAIによるコスト追跡、計測、最適化を主軸にしています。Jellyfish、Waydev、Faros AIはAIエージェントのモニタリングサービスを提供しています。Ramp、Datadog、New RelicもAI支出管理、トークンレベルの可観測性、GPUモニタリング機能を強化しています。
モデルルーティングがコスト削減の方向となる
一部の投資家や企業経営者は、こうした能力が今後、アプリケーション層またはモデルルーティング層でより多く見られるようになると判断している。例えば、企業向けAIスタートアップのFactoryは今週、タスクに応じてより適切なモデルを自動的に選択して呼び出しコストを削減するモデルルーターを発表した。一部の企業の請求書には、高機能モデルを呼び出した場合でも、一部のリクエストをより安価なモデルに割り当てるような実装が既に見られる。
補足情報:ゴールドマン・サックスは、2030年までにグローバルなトークン使用量が24倍に増加すると予測しています。すでに高投入段階に入った企業にとって、AIの利用拡大とコスト管理の両立は、次の段階の導入における現実的な課題となっています。
