海外メディア『Fortune』は、企業内ではかつて流行した「tokenmaxxing」が冷え込んでいると評している。tokenmaxxingとは、従業員やチームがAIモデルを呼び出すトークン数を、イノベーションの度合いや効率の指標として扱うことを意味するが、請求額の増加と無効な呼び出しが増えるにつれ、この手法は次第に多くの企業で見直され始めている。
記事によると、Meta、Amazon、OpenAIなどの企業は以前、正式または非公式なトークン使用ランキングを導入し、エンジニアがモデルの呼び出し量を競うように促していた。しかし、指標自体が評価目標になると、本来の目的から逸脱しやすくなる。英国フィナンシャル・タイムズは以前、Amazonの一部の従業員が、使用データの成績を維持するために実質的な意味のないタスクをAIエージェントに実行させたと報じている。
コスト圧力が顕在化し始めています
生成型AIが企業内に大規模に導入されるにつれ、モデルの利用料も急増している。記事によると、一部の企業は、特に高機能モデルに依存するツールの使用を従業員に制限し始めた。Metaは従業員が自主的に作成したトークンランキングを削除した。The Vergeは、Microsoftが複数の主要製品部門の従業員のClaude Codeのサブスクリプションをキャンセルしたと報じている。
ウーバーは、2026年上半期のトークン予算をすでに全額使用したことを明らかにし、その一部はClaude Codeの高頻度利用によるものである。セールスフォースのCEO、マーク・ベニオフは、同社が今年Anthropicに支払った費用が約3億ドルであり、今後はより賢明なルーティングシステムを導入して、異なるリクエストをコストに適したモデルに割り当てたいと述べた。
企業は業務成果を重視します。
記事は、企業がトークン指標を引き締める核心的な理由が単なる支出削減ではなく、投入とリターンのギャップにあると指摘している。Uberの首席運営責任者であるアンドリュー・マクドナルドは、最近、一部の従業員の効率向上を、ユーザー向けの新機能の提供や全体的な経営成果に直接結びつけるのが難しいと述べた。明確なビジネス成果が得られない限り、モデルのコストを継続的に正当化するのは難しくなる。
そのため、トークンの消費量を単に追跡するだけでは、ますます有効な管理ツールとは見なされなくなっています。これは呼び出しの規模を反映できますが、その呼び出しが実際に製品、プロセス、または収益を改善したかどうかを示すことはできません。
真の報酬はプロセスの再構築から生まれる
Exponential Viewの著者Azeem Azharの見解を引用すると、現在のAI投資と生産性のずれは、新しい一般技術の初期段階でよく見られる「生産性Jカーブ」に似ている。企業は試行錯誤の段階で実験コストを増加させるが、短期的には明確な収益を得られず、業務プロセスが再設計された後にのみ、効率の向上が集中して現れる。
電力改造工場を例に挙げると、企業は当初、照明や動力源の交換にとどまっていたが、真に生産性の大幅な向上は、工場のレイアウトや個々の機械が新技術に基づいて再構築された後に実現した。AIにおいても、多くの企業はまだ部分的な試用やツールの積み重ねの段階にとどまっており、より深層的なプロセスの再構築には至っていない。
コメントによると、トークン使用量の競争が下火になった根本的な理由は、それが「どれだけ使ったか」を解決するものであり、「何を生み出したか」を解決するものではないからである。企業にとって、AIの価値は最終的にモデル呼び出しランキングではなく、製品の提供、ビジネスモデル、収益の実績に帰着するべきである。
