OpenAI 已結束向 Nvidia 租賃其未來。该公司宣布與博通合作,開發專為大型語言模型優化的定制 AI 加速器,部署目標時間為 2026 年下半年至 2029 年底。
規模令人驚嘆:10 吉瓦的定制 AI 加速器。
這項合作實際上是什麼樣子
這裡的分工清晰明確。OpenAI 負責加速器設計,將其對 LLM 工作負載的深入理解直接融入晶片架構中;Broadcom 則負責這些系統的開發、製造與部署,並將其與自身的乙太網路技術整合。
這並非 OpenAI 首次涉足定制晶片。2025 年 9 月有報導稱,該公司正與博通合作開發一款命名為「XPU」的加速晶片,預計於 2026 年投入生產。10 月 13 日的公告確認並大幅擴展了這一計劃。
「開發我們自己的加速器有助於更廣泛的生態,」OpenAI 執行長 Sam Altman 說。
博通執行長陳福陽更直接地闡述了這一願景,將目標描述為「共同開發並部署 10 吉瓦的下一代加速器」。
安裝將於 OpenAI 自有的設施和附屬數據中心逐步展開。
為何 OpenAI 需要自己的晶片
據報導,OpenAI 擁有超過 8 億名每週活躍用戶使用其基於雲端的 AI 服務。在如此規模下運行大型語言模型成本極高,而定制加速器可讓 OpenAI 將其架構洞察直接融入硬體中——與其編寫繞過晶片限制的軟體,不如根據軟體的精確需求來設計晶片。
這與 Google 運用其 TPU(Tensor Processing Unit)晶片的策略相同。Amazon 隨後為 AWS 推出了 Trainium 和 Inferentia 晶片。Microsoft 則有其 Maia 加速器。
這對競爭格局意味著什麼
博通的乙太網路整合是一項重要細節。大規模 AI 推理不僅僅依賴高速晶片,更在於高效地在晶片之間傳輸資料。通過將其網路技術與 OpenAI 的加速器設計相結合,博通能夠提供端到端的解決方案。
2026-2029 年的部署時間表對任何建模 OpenAI 財務狀況的人來說都至關重要。定制晶片需要時間才能帶來回報,但一旦投入運營,便可能大幅降低 OpenAI 每次查詢的計算成本。在每周 8 億活躍用戶且持續增長的情況下,即使每次推理的效率僅有小幅提升,也能每年節省數十億美元。
