人工智能產業即將迎來一個轉折點。根據追蹤人工智慧趨勢的非營利組織 Epoch AI 的說法,到 2030 年,用於運行人工智慧模型的計算能力將比用於構建它們的計算能力增長得更快。
轉移後的數字
Epoch AI 的預測描繪出一幅圖景:在該行業中,部署的經濟效益將日益超越開發的經濟效益。該組織估計,到本十年末,近一半的推論運算將遷移至 ASIC(專用集成電路)。這些晶片專為極高效能地執行單一任務而設計,與目前驅動大多數 AI 工作負載的通用 GPU 不同。
同時,訓練運算在總體 AI 運算中的占比預計將穩定在約 5%。前沿 AI 模型的訓練運算目前正以每年 4 至 5 倍的速度增長,而總安裝的 AI 運算基礎也以類似速度擴張。
歷史上,推論已佔實際部署中計算量的 60% 至 80%。
到 2030 年,前沿訓練運行預計將達到約 2e29 FLOP。這一進展與從 GPT-2 到 GPT-4 的躍升相當,並由成本超過 1000 億美元的資源支持。這些前沿訓練運行每一項可能需要 4 至 16 吉瓦的計算能力。
Epoch 預計,到 2030 年,美國的 AI 專案總 AI 算力容量可能超過 50 GW,全球容量將超過 100 GW。
為何 ASIC 正在吞噬推理
谷歌多年前已透過其張量處理單元實現了這一點。亞馬遜擁有其 Inferentia 芯片。Epoch AI 所預測的趨勢表明,這並非一種小眾策略,而是到本十年末,約一半推理市場將採取的方向。
這段成長軌跡的限制並非微不足道。電力需求、晶片生產能力與資料傳輸限制均構成實際挑戰。Epoch AI 評估認為,在現有的成長假設下,這些瓶頸是可管理的。
這對投資者意味著什麼
如果推理運算代表了未來的增長方向,半導體行業的投資論點將發生顯著變化。訓練仍需依賴 GPU,且訓練預算仍以每年 4 至 5 倍的速度增長。但更高容量、重複性收入的機會正日益集中在推理領域。
僅在美國,談到 50 GW 的 AI 計算能力時,這意味著數據中心、發電和冷卻系統的龐大建設。
需要關注的風險在於,計算能力每年 4 至 5 倍的增長率是否可持續。Epoch AI 的預測假設當前趨勢保持不變,但能源限制和地緣政治晶片供應動態都可能帶來阻力。
