外媒《Fortune》評論指出,企業內部曾風靡一時的「tokenmaxxing」正在降溫。所謂 tokenmaxxing,是將員工或團隊調用 AI 模型的 Token 數量,作為創新程度與工作效率的近似指標。但隨著帳單上升與無效調用增多,這種做法正被越來越多公司收緊。
文章提到,Meta、Amazon、OpenAI 等公司此前都曾出現正式或非正式的 Token 排行做法,鼓勵工程師比拼模型調用量。問題在於,一旦指標本身變成考核目標,就容易偏離原本目的。英國《金融時報》此前報導稱,Amazon 部分員工曾讓 AI 代理執行缺乏實際意義的任務,只為維持使用數據表現。
成本壓力開始顯現
隨著生成式 AI 在企業內部大規模鋪開,模型調用費用也快速上升。文章稱,部分公司已經開始限制員工使用第三方 AI 代理,尤其是依賴高端模型的工具。Meta 已撤下員工自發建立的 Token 排行榜;The Verge 報導稱,Microsoft 取消了多個關鍵產品部門員工的 Claude Code 訂閱。
Uber 也披露,公司在 2026 年前四個月就已用完全年 Token 預算,其中一部分支出來自 Claude Code 的高頻使用。Salesforce 首席执行官 Marc Benioff 則表示,公司今年向 Anthropic 支付的費用約為 3 億美元,並希望未來能有更智能的路由系統,將不同請求分配給成本更合適的模型。
企業更看重業務成果
文章認為,企業收緊 Token 指標,核心原因並不只是節流,更在於投入與回報之間的落差。Uber 首席運營官 Andrew Macdonald 近期表示,公司很難將部分員工效率的提升,直接對應到面向用戶的新功能交付或整體經營結果上。如果無法形成清晰的業務結果,模型成本就更難被持續證明合理。
這也是為什麼單純追蹤 Token 消耗,越來越難被視為有效的管理工具。它可以反映調用規模,卻不能說明這些調用是否真正改善了產品、流程或收入。
真正的回報來自流程重構
文章援引 Exponential View 作者 Azeem Azhar 的觀點稱,當前 AI 投入與生產率之間的錯位,更像一種新通用技術早期常見的「生產率 J 曲線」。企業在摸索階段往往先增加實驗成本,短期內卻看不到明顯收益,只有在業務流程被重新設計後,效率提升才會集中體現。
以電力改造工廠為例,企業最初僅僅更換照明或動力來源,但真正的生產率顯著提升,發生在工廠佈局和單台設備均圍繞新技術重新構建之後。對應到 AI,許多公司目前仍停留在局部試用或工具疊加階段,尚未進入更深入的流程改造。
評論認為,Token 使用量競賽之所以退潮,根本原因在於它解決的是「用了多少」,而不是「創造了什麼」。對企業而言,AI 的價值最終仍要落實到產品交付、業務模式和收入表現上,而非模型調用排行榜。
