CPO 技術正因人工智慧推動資料中心連接需求而加速發展

iconMetaEra
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
CPO 技術正日益受到關注,因為鏈上數據需求推動數據中心採用更高速的連接技術。CPO 將光子元件直接整合至晶片中,提升頻寬與熱效率。隨著 AI 工作負載不斷上升,傳統基礎設施已顯落後,使 CPO 成為實現代理式 AI 的關鍵技術。NVIDIA 與 Broadcom 正在推進基於 CPO 的交換機,但封裝與標準化仍面臨挑戰。通膨數據的波幅增加了基礎設施成本的壓力,進一步凸顯了高效解決方案的必要性。
CPO(協同封裝光學)是一種將光引擎與晶片直接整合在同一封裝基板上的光電傳輸技術,可同時應用於機櫃間與機櫃內互聯,解決傳統數據中心面臨的頻寬瓶頸、訊號衰減和散熱問題。隨著AI對算力需求爆發,傳統網路基礎設施已無法匹配Agentic AI時代對頻寬的傳輸需求,CPO成為突破方向。英偉達、博通等巨頭正積極推動CPO交換機方案,目前主要面臨先進封裝工藝、熱管理、檢修維護和標準化等瓶頸。與NPO、OIO、CPC、LPO、OCS等技術路線相比,CPO是未來必須突破的下一代方案,產業價值將向交換晶片廠商和先進封裝廠集中。

文章作者、來源:海豚投研

自2022年底ChatGPT橫空出世以來,從算力(GPU)、存力(存儲)、指揮調度力(CPU)……AI已帶動了一個又一個半導體超級產業機遇、一個又一個萬億美元市值的公司。

如果說在 AI 基建中,還有一個板塊尚待出現一個萬億市值的「待爆帝」,海豚君接下來最為看好的就是 AI 時代的超級連接。如果說算力解決了 AI 的「智商」問題,存力解決了 AI 的「記憶力」問題,那麼運力要解決的就是如何將長期與短期記憶以火箭般的速度高速出入腦力中心。

或者借用 AI 教皇黃仁勳的說法,隨著算力和記憶體瓶頸逐步緩解,能源又是一個第十級的持續難度,下一個核心卡點是 AI 時代網絡的高速互聯,因為傳統雲時代的網絡基礎設施完全無法匹配 Agentic AI 時代下,數萬億模型參數、混合專家(MoE)、局部激活下對網絡頻寬的傳輸需求。

本篇將繼續探討AI時代的網路傳輸,聚焦於AI網路傳輸速度逐步切換的光電傳輸技術方向——CPO。海豚君對CPO的研究分為:

一、什麼是 CPO,它真的能替代傳統的銅連接嗎?

二、它能否完全取代當前主流的可插拔光模組?

三、在此趨勢下,產業內上下游公司的競爭格局又將如何變化?

在本篇文章中,我們首先對產業鏈的基本問題做一個梳理。

以下是詳細分析

01 什麼是 CPO?

在傳統數據中心架構中,有一個重要的部件稱為「光模組」,其作用是將光纖傳輸過來的光信號轉化為電信號並傳遞至數據中心,或將數據中心內產生的電信號轉化為光信號並傳遞至光纖,在數據傳輸中發揮「橋樑」和「翻譯」的作用。

從作用上講,CPO(即共封裝光學)架構當中,包含了傳統光模組的功能,但有以下兩個明顯差異:

1、結構不同

傳統的光模組是可插拔的,外觀看起來就像家裡網線端口上的水晶頭,但 CPO 完全不同,它將負責光電轉換的光引擎與晶片(這裡主要是交換機的 ASIC 晶片)直接集成在同一封裝基板或中介層上。

2、應用場景不同

光模組通常應用於機櫃間(即 Scale-out);而 CPO 既可應用於機櫃間,也可應用於機櫃內(Scale-up)。應用於機櫃間時,CPO 替代傳統光模組;應用於機櫃內時,則替代目前主流的銅連接。

圖:傳統可插拔模式與 CPO 方案示意

資料來源:GTC 2025,Dolphin Research

我們可以看到,近期無論是 NVIDIA 還是 Broadcom,都在積極推動他們的 CPO 交換機方案。

那麼 CPO 技術為何會受到如此重視呢?因為數據中心對算力的需求持續提升,數據中心對數據傳輸的頻寬需求也呈爆發式增長,且數據中心正朝超大規模算力集群的方向發展,那麼在此過程中,舊有的傳統數據傳輸技術會形成諸多阻礙:

1、帶寬瓶頸

在機櫃間場景中,由於傳統交換機面板空間有限,而傳統可插拔光模組尺寸又難以縮小,導致單台交換機所能提供的端口受限,無法支援日益增長的頻寬需求。

目前可插拔模組最高可支援 1.6Tbps 單模組頻寬,單個交換機面板最多可支援 51.2Tbps 頻寬,未來可能推出 3.2Tbps 模組,交換機最高支援 102.4Tbps,這幾乎已達到可插拔光模組的極限。

2. 信號完整性瓶頸

在機櫃內場景中,隨著傳輸速率提升,如果使用傳統的銅纜,那麼電信號在長距離傳輸時會面臨嚴重信號衰減和失真,並且傳輸距離也會越來越受限。

目前銅纜最高可支援 1.8TB/s 帶寬(如英偉達的 NVLink 銅纜),且距離被嚴格限制在 2 米以內,但單 GPU 對帶寬需求正向 3.6TB/s 前進。

3、散熱和功耗瓶頸

隨著傳輸速率提高,傳統通訊鏈路的功耗大幅上升,同時散熱也越來越面臨困難。我們知道目前美國數據中心建設面臨極大的能源障礙,因此功耗問題會帶來顯著的成本壓力。

CPO 理論上可較好地解決上述幾項問題,根據英偉達,應用 CPO 後功率效率可提升 3.5 倍。

02 具體而言,數據中心的數據傳輸場景有哪些?

這裡我們將數據中心在不同場景和不同環節中的數據傳輸技術路線進行拆分:

圖:Scale-out 和 Scale-up 示例

資料來源:NADDOD,Dolphin Research

1、Scale-up,主要涉及機櫃內互聯

主要涉及機櫃內,尤其是伺服器內的硬體互連,包括但不限於 CPU、GPU、網卡、DDR 記憶體以及硬碟之間的互連。

目前這部分連接主要以銅為主要連接介質,包括用於連接 CPU、GPU 以及網卡的 PCIe 插槽和記憶體插槽(PCB 銅走線)、SATA 線等各類銅纜等。而 CPO 有可能顛覆目前的主流方案。

2、擴展,主要涉及機櫃間互聯

主要涉及機櫃、伺服器與交換機之間的互連。

這部分連接就需要以光作為連接介質了,目前主要以光纖和可插拔光模組為主要方案。同樣,CPO 是重要發展趨勢,且比機櫃內場景進展更快。

3、此外,還有數據中心之間以及數據中心與外部的互聯,這部分並非本文的討論重點。

From the perspective of major players' layouts, CPO is currently primarily targeted at inter-rack scenarios, but may extend to intra-rack scenarios in the future.

03 CPO 目前仍處於初步推廣階段,面臨的主要瓶頸是什麼?

1. 先進封裝技術的成熟

從底層技術來看,CPO 與可插拔光模組等傳統方案完全不同。傳統光電子零部件在生產技術上與廣義的光電子元件及模組差異不大,但 CPO 需要將光引擎封裝到基板或中介層,主要依賴的卻是 CoWoS 等先進封裝技術。

與此同時,與我們通常所理解的先進封裝相比,CPO 也有所不同,因為它不僅需要整合電子積體電路,還需要整合光子積體電路,這種異質整合需透過如台積電 COUPE 技術進行混合鍵合。

問題在於,一方面,上述先進封裝技術的工藝難度極高,無論是英偉達還是博通,都依賴台積電的產能,但產能是有限的;此外,所需的光耦與設備、混合鍵合設備、測試設備,以及 ABF 基板等材料的供應也可能存在障礙;

此外,目前上述先進封裝技術,尤其是異質整合的生產良率仍有很大提升空間,導致成本遠高於可插拔方案。目前台積電正努力提升先進封裝良率,但仍需一定時間。

2、檢修和維護問題

對於傳統可插拔方案而言,由於它們是「可插拔」的,因此檢修和維護十分方便。但 CPO 完全不同,它的光電模組與基板、中介層甚至晶片直接封裝在一起,因此檢修和維護的難度會顯著高於傳統方案。

但以上問題也是可以解決的,例如從設計上提高一定的容錯率,或在運營層面佈局一定的冗餘等等。

3、熱管理問題

光引擎與晶片進行高密度封裝,在運行時會導致局部升溫明顯,甚至超過雷射器的耐受極限,因此熱管理也是一個大問題。為了解決以上問題,需要引入更高效的散熱方案,但這同樣會涉及成本。

4、標準化問題

目前,英偉達、博通等公司為搶佔市場先機,積極推出自己完整且獨立的 CPO 交換機方案。但與此同時,行業標準(介面標準、封裝標準等)尚未形成,導致上下游難以基於統一標準進行研發、生產和配置,這也是商業化推廣的難點所在。

總之,可以看見,上述問題均有解決方案,但需依賴技術的成熟與標準的制定等,而這些都需要時間。

另一方面,從根本上講,CPO 技術需在綜合成本上形成優勢。

這就引出了一個問題:無論採用何種方案,成本始終是核心考量因素,但除了 CPO 之外,還有其他更先進或更保守的技術路線正在推進中,它們之間呈現出怎樣的關係呢?在此,我們先區分不同技術路線的差異。

04 技術路線比較

1、CPO

我們所討論的 CPO,即共封裝光學(Co-Packaged Optics),如上文所述,是指將光引擎與晶片封裝在同一基板上,此處的晶片可以是交換晶片(ASIC),也可以是 GPU 等計算晶片,但通常指的是交換晶片。

2、NPO

NPO 是近封裝光學(Near-Packaged Optics),比 CPO 初級一點,尚未達到將元件封裝在同一基板甚至中介層的規模,僅是封裝在同一塊 PCB 母板上。

中國國內包括阿里、華為等都在推動 NPO 方案,這更多可看作是缺乏先進封裝產能下的一種妥協方案,但可能在一段時間內成為中國市場的主流方案,這一定程度上會影響到英偉達方案在中國市場的滲透。

圖:不同整合方式展示:(從上到下分別為可插拔方式、NPO、CPO(整合在封裝基板)、CPO(整合在中介層),以及下面將提到的 OIO)

資料來源:ASE,Dolphin Research

3、OIO

OIO(Optical I/O)可視為 CPO 的進階版本,此處不再涉及交換晶片,主要與計算晶片相關,指的是將光引擎與計算晶片封裝在一起,甚至直接在晶片層面結合,這完全針對機櫃內場景。

圖:不同整合方式展示:可插拔、CPO、OIO

資料來源:台積電,Openlight,Dolphin Research

談到這裡,我們再來明確一下數據中心的架構:

數據中心可視為以下幾個部分相互連接:

伺服器專注於計算任務,內部裝載 GPU、CPU 等計算晶片、記憶體、硬碟等;

交換機負責伺服器之間以及伺服器對外的網路通信,並透過 ASIC 芯片實現資料交換;

此外還有存儲系統,在目前主流數據中心架構中,存儲器主要分散佈置在伺服器節點,並放置於伺服器內部,與伺服器結合在一起。

基於上述架構,我們就能想像 CPO 的應用場景。那麼在此基礎上,我們來討論一下,為何 CPO 率先從交換晶片開始?

在這裡,我們對交換機的作用做一個類比——交換機可視為數據中心內部的立交橋,因此可以想像,交換機所承擔的數據傳輸頻寬壓力、端口密度以及隨之而來的功耗瓶頸是最大的,因此對 CPO 的需求也更迫切。

4、CPC

CPC,即共封裝銅互連(Co-Packaged Copper),是指將高速銅連接器直接集成在封裝基板上。

這種技術路線的成本優勢非常明顯,但仍然無法解決銅介質的頻寬瓶頸和衰減問題,因此應用場景較為受限,可部分應用於機櫃內部的 GPU/CPU 節點與交換機及存儲晶片之間的連接。目前英偉達機櫃內方案仍採用銅連接,但未來可能將切換至光互連。

5、LPO

LPO 則是線性驅動可插拔光學(Linear-Drive Pluggable Optics),是一種瘦身版的可插拔光學,透過移除內部的 DSP/CDR 芯片,僅保留並強化模擬芯片 Driver 和 TIA(這些部件的作用我們後面會講),實現信號直驅。

簡單來說,就是在光模組中直接移除耗電量大的 DSP 芯片,放棄信號糾錯;同時強化模擬芯片,不論信號是否準確,都透過模擬放大,直接讓交換機 ASIC 的電信號衝進來驅動雷射器。

圖:傳統模式與 LPO 結構對比示意

資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research

但這裡同樣存在問題,由於 PCB 走線並未省略(會造成信號衰減),同時對信號質量的要求又更高,因此長距離傳輸仍受限,並且當速率邁向更高維度(1.6T 以上)時,信號完整性問題會格外凸顯。也就是說,在簡化結構的同時,性能上也會有所犧牲。

總體來看,儘管存在 NPO、CPC、LPO 等折中方案,但隨著數據中心朝向更高速率和更大集群發展,這些折中方案終將面臨瓶頸,CPO 是未來必須突破的下一代方案。

6、光電路交換機(OCS)又是什麼,會威脅到 CPO 的地位嗎?

談到這裡,無可避免地會涉及 OCS(Optical Circuit Switch)。OCS 這種交換機的核心特點是整個過程沒有光電轉換,透過光開關矩陣,直接在光域內建立物理光路。

圖:OCS 示意

資料來源:Orbray,Dolphin Research

可以直觀地想像,它就像由一排排反射鏡(微鏡陣列)組成,可根據指令調整反射鏡的角度,向不同角度反射光線。

表面上看,OCS 直接轉發光信號,取代傳統交換機的光-電和電-光轉換過程,似乎採用這種技術路線就無需 CPO(至少無需交換機環節的 CPO)。但實際上並非如此。

在這裡,我們整理一下資料中心中交換機架構是如何構建的:

(1)在主機板上:首先,我們知道資料中心內最核心的運算由 GPU 實現,GPU 完成運算後,需將數據傳遞給 CPU,CPU 處理後再傳遞給網卡(內含 ASIC),或由 GPU 直接傳輸至網卡。

那麼以上環節可以在一塊主機板上實現,或者至少可以在一台伺服器內實現。

(2)在機櫃內:之後,數據需從伺服器傳遞至機櫃的交換機。一個機櫃內可有多台伺服器高速互聯,但機櫃頂部必須設有一台交換機,用於與外部通訊,實現機櫃內外數據的交換。此交換機稱為 ToR(Top of Rack)交換機。

而以上環節是在同一機櫃內實現的。

(3)機櫃間:數據中心是由多個機櫃組成的叢集,機櫃與機櫃之間的通訊如何調度呢?這時就需要 Spine 交換機發揮作用。Spine 交換機負責管理所有 Leaf 交換機之間,以及向數據中心外部的高速連接,它是數據中心內整個交換機網絡的樞紐。

圖:數據中心中 Spine 交換機與 Leaf 交換機示意

資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research

而 OCS 主要用來替代 Spine 交換機。

首先,Spine 交換機價格高昂且功耗高,對替代方案的需求最為迫切。

此外,OCS 的功能有限,它僅能轉發信號(反射光線),就像鏡子一樣。但傳統交換機的功能更完整,它需要拆解數據包、查看 IP 位址,然後決定轉發方向。例如,由於 OCS 只能執行指令,缺乏判斷能力,因此在這種情況下,僅將其用作 Spine 交換機是可行的;但若想同時取代 Leaf 交換機,則需新增其他組件來執行「封包處理」功能,例如智慧網卡(SmartNIC),如此架構將變得複雜,未必是最優方案。

從以上可以看出,架構非常清晰:

雖然目前英偉達推出的 Quantum X800-Q3450、博通推出的 Tomahawk 6 - Davisson 等 CPO 路線的交換機,均為 Spine 交換機,而 Google 推動的 OCS 交換機,也是用來取代傳統的 Spine 交換機,兩者之間確實存在直接競爭關係。

但從最終結局來看,雖然 OCS 有機會取代 Spine 交換機,但在更下游的應用中,對於用量更大的 Leaf 交換機,其光引擎與 ASIC 芯片之間的電光轉換,再到伺服器內部主機板與主機板之間的連接(透過網卡 ASIC 或 NVSwitch 等),以及主機板上計算芯片與計算芯片之間、計算芯片與網卡 ASIC 之間的連接,仍然需要使用 CPO。因此,未來兩者更多是相輔相成的關係。

What industry chain segments are involved?

(一)首先我們解析下 CPO 的原理和架構

CPO 可視為升級版的光引擎,而光引擎的作用是進行光電轉換,它主要包括以下幾個部分:

1、光子電路部分

(1)調製器:通過控制光的強弱和信號,將電信號(0/1 數字)寫入光信號。

(2)探測器:為 PD(Photodiode,光電二極管),將光信號轉換為電信號。

(3)波導:可理解為晶片內部印製的微型光纖。

2、電子電路部分

(1)Driver(驅動器):將交換機或伺服器傳來的微弱電信號放大成能精確控制雷射器發光的電信號,因此 Driver 的下一個環節就是調製器。

(2)TIA(跨阻放大器):將 PD 產生的極其微弱的電信號放大並轉換為可供後續電路處理的電壓信號,因此 TIA 是 PD 的下一個環節。

3、光源,也就是雷射器

調制器本身不能發光,但它能控制光,因此需要一個發光部件與之配合,也就是雷射器。

資料:光引擎結構示意

資料來源:宗澤國等,《400G FR4 硅光收發模組的研究》,Dolphin Research

另外還有兩個部件:

4、DSP 和 CDR 都用於修復電信號。一個用於補償電信號的物理損傷,另一個用於從受損信號中提取精確時鐘並重整數據時序,其中 DSP 芯片通常整合了 CDR 功能。

CPO 與 LPO 相似之處在於,它們都將高功耗、高成本、高延遲的 DSP 從光引擎中移除。但在 CPO 方案中,DSP 的部分功能被整合至交換 ASIC 中,而 LPO 則是使用模擬晶片放大硬體信號的方案;此外,CPO 會將 CDR 整合至高速 SerDes 中。

那什麼是高速 SerDes 呢?高速 SerDes 包括 Ser 串行器和 Des 解串器,它們位於 ASIC 芯片內部,分別用來將芯片內部並行數據打包成高速串行數據流,或者將高速串行數據流解包還原成多路低速並行數據。

(二)再看整個 CPO 產業鏈涉及哪些環節:

1、首先是 CPO 整體

CPO 中的光引擎包含上述提到的光子電路部分和電子電路部分,然後光引擎與 ASIC 芯片構成 CPO 交換機主體部分。這裡先說一個核心問題:誰來做這個 CPO?

傳統的光模組作為由光學組件、分立器件等組成的獨立模組,可由專業生產廠商完整提供,例如我們耳熟能詳的中際旭創、新易盛、Coherent,那麼CPO呢?顯然它們已不可能再主導此領域。

我們傾向於認為,CPO 下的產業價值走向會是這樣的:

(1)掌握核心技術的交換廠商和平台商:掌握英偉達 / Google / 博通 / Marvell 這樣的資料中心系統平台方 & 交換晶片廠商來定義架構和標準 + 買整套產品;

(2)代工廠:台積電/日月光/Amkor 等 Fab 廠/封測廠進行晶圓製造/光電整合/先進封裝代工;

(3)上游供應商:Coherent/Lumentum 等器件廠繼續進行光電器件的生產和供應。

(4)傳統光模組廠商:中際旭創/新易盛等在過渡期內提供 NPO、LPO 等中間路線,以及基於可維護性考量的折中 CPO 設計方案下,繼續提供光引擎模組。

2、除了 CPO 的核心光引擎之外,還有幾個組件需要關注

(1)激光器

CPO 僅能整合光電轉換元件,直接整合雷射器仍存在難度,因此仍需使用外置雷射器。與此同時,CPO 對雷射器的功率要求大幅增加(至少增加 3-4 倍),對應的性能與可靠性要求也大幅提升,因此價值量也會大幅增加。

不過,這裡存在技術路線的選擇:

1)EML 激光器:傳統路線,將激光器與調制器集成在一起,優勢在於適合 200G 以上高帶寬和長距離通訊。此路線被 Lumentum、II-VI(Coherent)、住友等巨頭壟斷。

2)CW 激光器:新興路線,將激光器完全獨立,在成本和功耗上具優勢,也更契合未來的 CPO 路線。CW 激光器供應相對靈活,中國的源傑科技、仕佳光子、長光華芯等廠商已實現 70mW/100mW 產品量產並獲得大額訂單。

圖:EML 和 CW 激光器的區別示意

資料來源:住友電工,Dolphin Research

接下來是四大光纖組件,這些組件在傳統可插拔光模組路徑下很少使用:

(2)光纖陣列單元(FAU,Fiber Array Unit):用於精確安裝光纖,以實現光纖與波導之間的高精度對準。

圖:Fiber Array Unit

資料來源:Corning,Dolphin Research

(3)保偏光纖(PMF,Polarization Maintaining Fiber):是一種特殊的光纖,用來使光波的偏振態保持不變。

(4)光纖分配盒(Fiber Shuffle):用於排列光纖,可重新排列複雜高密度設備中光纖的位置順序。

圖:Fiber Shuffle 示意

資料來源:Hyoptic,Dolphin Research

(5)光纖連接器(MPO,Multi-Fiber Push On):用於多芯光纖之間的相互連接。

圖:MPO 端口示意

資料來源:Senko、US Conec、Dolphin Research

為何傳統光模組很少使用上述組件?

(1)在傳統模式下,光纖直接插入標準化接口,但在 CPO 下,光纖需要與光晶片表面的波導進行高精度耦合,因此需要使用 FAU;

(2)傳統模式為直接調製,對光波的偏振態不敏感,且此前保偏光纖(PMF)成本極高,不太適合產業化應用,但CPO通過外部激光器供應光源,激光偏振態會導致巨大能量損耗,因此必須使用PMF;

(3)傳統模式通常僅有單發單收兩條光纖,無需連接複雜的光纖至背板,因此可由人工操作,無需使用 Fiber Shuffle;但在 CPO 下則必須使用 Fiber Shuffle;

(4)同樣,傳統模組也不需要太多接口,但在CPO下,若達到400G以上,則需要8根甚至16根光纖並行傳輸,而面板空間又有限,因此需要MPO這種多芯連接器。

至於市場空間以及 CPO 所涉及的產業環節投資機會,我們將在下篇中進行分析。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露