高通首席執行官克里斯坦·阿蒙(Cristiano Amon)剛剛公布了 AI 引擎加速的速度。在台北舉行的 COMPUTEX 2026 主題演講中,阿蒙預測,到 2030 年,AI 令牌生成速度將達到每 10 秒 1.27 兆個令牌,較目前每 10 秒約 317 億個令牌的速率增加約 40 倍。
請明確:這些並非加密貨幣代幣,而是 AI 推理代幣,即大型語言模型每次回應查詢時所產生的文本、代碼和推理的基本單位。這一區別至關重要,因為處理此類海量數據所需的基礎設施,對晶片製造商、雲端服務提供商以及任何依賴 AI 建立產品的人士,都具有重大影響。
從回答到自主性
今日的 AI 模型主要生成答案。你提出一個問題,就會得到回應,可能長達幾百個 token。即將到來的則有所不同。代理式 AI——不僅僅是回答,更能自主做出決策並採取行動的系統——將對 token 吞吐量提出極大的需求。
阿蒙將此問題定位為半導體產業現今必須解決的基礎設施挑戰,而非遙遠的可能性。
高通對邊緣運算的押注
如果每 10 秒生成 1.27 兆個代幣,將所有這些數據通過中心化的雲端數據中心處理將會極其昂貴且異常緩慢。Amon 的解決方案:盡可能將 AI 處理移至設備本身。高通的 Snapdragon 平台專為在手機、電腦、穿戴設備和車輛上本地處理推論工作負載而設計,而非將每個請求發送到伺服器集群。
在示範中,高通展示混合邊緣與雲端策略可將代幣使用量減少高達 60%,並降低成本達 4 倍。如果大部分的 AI 推理發生在您的手機或筆電上,系統僅需在面對真正困難的任務時才呼叫雲端。
這對投資者意味著什麼
邊緣 AI 處理是一個不同的市場,擁有不同的領先者。高通在行動系統單晶片設計領域佔據主導地位。如果未來每個手機、每台電腦、每輛汽車和每件穿戴裝置都需要進行 AI 推理,這將為該公司在多條產品線的核心業務帶來長期利好。
投資者也應注意 Amon 未提及的內容。他的主題演講完全未提及區塊鏈技術或加密貨幣,儘管「代幣」這一術語無可避免地引發混淆。1.27 萬億這個數字完全指的是 AI 計算代幣,而非數碼資產。
