CPO (Co-Packaged Optics) là một công nghệ truyền dẫn quang-điện tích hợp trực tiếp động cơ quang với chip trên cùng một nền bao bì, có thể ứng dụng đồng thời cho kết nối giữa các tủ và trong nội bộ tủ, giải quyết các vấn đề về tắc nghẽn băng thông, suy giảm tín hiệu và tản nhiệt mà các trung tâm dữ liệu truyền thống đang đối mặt. Với nhu cầu xử lý tính toán bùng nổ từ AI, hạ tầng mạng truyền thống đã không còn đáp ứng được yêu cầu về băng thông trong thời đại Agentic AI, khiến CPO trở thành hướng đột phá. Các công ty lớn như NVIDIA và Broadcom đang tích cực thúc đẩy các giải pháp switch CPO, hiện đang gặp phải các rào cản chính về quy trình đóng gói tiên tiến, quản lý nhiệt, bảo trì và tiêu chuẩn hóa. So với các tuyến công nghệ như NPO, OIO, CPC, LPO, OCS, CPO là giải pháp thế hệ tiếp theo bắt buộc phải vượt qua, và giá trị ngành công nghiệp sẽ tập trung vào các nhà sản xuất chip chuyển mạch và nhà đóng gói tiên tiến.
Tác giả bài viết, nguồn: Hải Đồn Đầu Tư
Kể từ khi ChatGPT ra đời vào cuối năm 2022, AI đã thúc đẩy liên tiếp những cơ hội ngành bán dẫn khổng lồ, những công ty có giá trị thị trường hàng nghìn tỷ USD, từ năng lực tính toán (GPU), dung lượng lưu trữ (bộ nhớ), đến khả năng điều phối và xử lý (CPU)...
Nếu trong cơ sở hạ tầng AI vẫn còn một phân khúc chưa xuất hiện một “đế chế” trị giá nghìn tỷ đô la, thì Dơi Quân tin tưởng nhất vào siêu kết nối thời đại AI. Nếu như năng lực tính toán giải quyết vấn đề “chỉ số IQ” của AI, năng lực lưu trữ giải quyết vấn đề “trí nhớ” của AI, thì năng lực vận chuyển chính là giải quyết cách đưa trí nhớ ngắn hạn và dài hạn “lên tên lửa” để di chuyển nhanh chóng vào và ra khỏi trung tâm xử lý trí tuệ.
Hoặc dùng cách nói của Giáo hoàng AI, ông Jensen Huang, khi các giới hạn về sức mạnh tính toán và bộ nhớ dần được giải quyết, năng lượng lại trở thành một mức độ khó liên tục ở cấp độ lớp 10; điểm nghẽn cốt lõi tiếp theo là kết nối mạng tốc độ cao trong thời đại AI, vì hạ tầng mạng của thời đại điện toán đám mây truyền thống hoàn toàn không thể đáp ứng nhu cầu băng thông truyền tải trong thời đại Agentic AI với hàng nghìn tỷ tham số mô hình, chuyên gia hỗn hợp (MoE) và kích hoạt cục bộ.
Trong bài này, chúng ta sẽ tiếp tục khám phá truyền tải mạng trong thời đại AI theo hướng chuyển đổi dần sang công nghệ truyền dẫn quang-điện (CPO) dưới tốc độ truyền tải mạng AI. Hải Đồn đã chia nghiên cứu về CPO thành:
Một, CPO là gì và liệu nó có thực sự thay thế được kết nối đồng truyền thống không?
Hai, liệu nó có thể hoàn toàn thay thế các mô-đun quang có thể thay thế đang phổ biến hiện nay không?
Ba, trong xu hướng này, cấu trúc cạnh tranh giữa các công ty trong chuỗi cung ứng ngành sẽ thay đổi như thế nào?
Trong bài viết này, chúng tôi sẽ tổng quan các vấn đề cơ bản trong chuỗi ngành công nghiệp.
Đây là phân tích chi tiết
01 CPO là gì?
Trong kiến trúc trung tâm dữ liệu truyền thống, có một bộ phận quan trọng gọi là "mô-đun quang", có chức năng chuyển đổi tín hiệu quang được truyền qua sợi quang thành tín hiệu điện để truyền đến trung tâm dữ liệu, hoặc chuyển đổi tín hiệu điện được tạo ra trong trung tâm dữ liệu thành tín hiệu quang và truyền đi qua sợi quang, đóng vai trò như một "cây cầu" và "người dịch" trong quá trình truyền dữ liệu.
Về mặt chức năng, kiến trúc CPO (Common Packaging Optics) bao gồm các chức năng của mô-đun quang truyền thống, nhưng có hai sự khác biệt rõ rệt sau:
1. Cấu trúc khác nhau
Các mô-đun quang truyền thống có thể tháo rời, trông bên ngoài giống như đầu thủy tinh trên cổng mạng gia đình, nhưng CPO hoàn toàn khác biệt: nó tích hợp trực tiếp động cơ quang chịu trách nhiệm chuyển đổi điện-quang và chip (chủ yếu là chip ASIC của bộ chuyển mạch) trên cùng một bo mạch nền hoặc lớp trung gian.
2. Các ứng dụng khác nhau
Các mô-đun quang thường được áp dụng giữa các tủ (tức là Scale-out); trong khi CPO có thể được áp dụng cả giữa các tủ (Scale-out) lẫn trong tủ (Scale-up). Khi áp dụng giữa các tủ, CPO thay thế các mô-đun quang truyền thống; khi áp dụng trong tủ, CPO thay thế các kết nối đồng phổ biến hiện nay.
Hình: So sánh sơ đồ giữa mô hình cắm rút truyền thống và giải pháp CPO

Nguồn: GTC 2025, Dolphin Research
Chúng ta có thể thấy, gần đây cả NVIDIA lẫn Broadcom đều đang tích cực thúc đẩy giải pháp switch CPO của họ.
Vậy tại sao công nghệ CPO lại được quan tâm đến vậy? Vì nhu cầu về sức mạnh tính toán của trung tâm dữ liệu không ngừng tăng lên, nhu cầu về băng thông truyền dữ liệu của trung tâm dữ liệu cũng tăng đột biến, đồng thời trung tâm dữ liệu đang tiến tới hướng phát triển các cụm sức mạnh tính toán siêu lớn, thì trong quá trình này, các công nghệ truyền dữ liệu truyền thống cũ sẽ tạo ra nhiều trở ngại:
1. Nút thắt băng thông
Đối với kịch bản giữa các tủ, do không gian mặt trước của switch truyền thống bị hạn chế và kích thước của các module quang có thể tháo rời truyền thống khó có thể thu nhỏ, dẫn đến số lượng cổng mà một switch có thể cung cấp bị giới hạn, không thể đáp ứng các yêu cầu băng thông ngày càng cao.
Hiện tại, mô-đun có thể tháo rời hỗ trợ tối đa băng thông 1,6 Tbps mỗi mô-đun, một bảng chuyển mạch có thể hỗ trợ tối đa 51,2 Tbps băng thông; trong tương lai có thể ra mắt mô-đun 3,2 Tbps, với chuyển mạch hỗ trợ tối đa 102,4 Tbps, gần như đạt đến giới hạn của mô-đun quang có thể tháo rời.
2. Nút thắt về tính toàn vẹn tín hiệu
Trong môi trường tủ, khi tốc độ truyền tăng lên, nếu sử dụng cáp đồng truyền thống, tín hiệu điện sẽ gặp phải suy giảm và méo tín hiệu nghiêm trọng trong quá trình truyền dài, đồng thời khoảng cách truyền cũng sẽ ngày càng bị hạn chế.
Hiện tại, cáp đồng có thể hỗ trợ băng thông tối đa lên đến 1,8 TB/s (ví dụ: cáp đồng NVLink của NVIDIA), nhưng khoảng cách bị giới hạn nghiêm ngặt trong vòng 2 mét, trong khi nhu cầu băng thông của từng GPU đang tiến tới 3,6 TB/s.
3. Giới hạn tản nhiệt và công suất
Khi tốc độ truyền tăng lên, công suất tiêu thụ của các đường truyền truyền thông truyền thống tăng đáng kể, đồng thời vấn đề tản nhiệt cũng ngày càng trở nên khó khăn. Chúng ta biết rằng hiện nay việc xây dựng trung tâm dữ liệu tại Hoa Kỳ đang đối mặt với trở ngại năng lượng lớn, do đó vấn đề công suất tiêu thụ sẽ gây áp lực chi phí đáng kể.
CPO về lý thuyết có thể giải quyết hiệu quả các vấn đề nêu trên, theo NVIDIA, hiệu suất công suất có thể tăng lên 3,5 lần sau khi áp dụng CPO.
02 Cụ thể, các cảnh huống truyền dữ liệu trong trung tâm dữ liệu là gì?
Ở đây, chúng tôi phân tích các tuyến đường công nghệ truyền dữ liệu của trung tâm dữ liệu trong các kịch bản và giai đoạn khác nhau:
Hình: Ví dụ về Scale-out và Scale-up

Nguồn: NADDOD, Dolphin Research
1. Scale-up, chủ yếu liên quan đến kết nối trong tủ
Chủ yếu liên quan đến kết nối phần cứng trong tủ, đặc biệt là giữa các thành phần trong máy chủ, bao gồm nhưng không giới hạn ở CPU, GPU, card mạng, bộ nhớ DDR và ổ cứng.
Hiện tại, các kết nối này chủ yếu sử dụng đồng làm môi trường kết nối chính, bao gồm các khe cắm PCIe dùng để kết nối CPU, GPU và card mạng, cùng các khe cắm bộ nhớ (đường đồng trên PCB), các loại cáp đồng như cáp SATA, v.v. Trong khi đó, CPO có thể làm thay đổi hoàn toàn giải pháp phổ biến hiện nay.
2. Mở rộng quy mô, chủ yếu liên quan đến kết nối giữa các tủ máy
Chủ yếu liên quan đến việc kết nối giữa các tủ, máy chủ và switch.
Phần kết nối này cần sử dụng ánh sáng làm phương tiện kết nối, hiện nay chủ yếu sử dụng sợi quang và mô-đun quang có thể tháo rời làm giải pháp chính. Tương tự, CPO là xu hướng phát triển quan trọng và đang tiến triển nhanh hơn so với các tình huống trong tủ.
3. Hơn nữa, còn có sự kết nối giữa các trung tâm dữ liệu và giữa trung tâm dữ liệu với bên ngoài, phần này không phải là trọng tâm của bài viết này.

Từ góc nhìn của các ông lớn, CPO hiện tại chủ yếu tập trung vào các kịch bản giữa các tủ, nhưng trong tương lai có thể mở rộng sang các kịch bản trong tủ.
03 CPO hiện vẫn đang ở giai đoạn quảng bá ban đầu, rào cản chính hiện nay là gì?
1. Sự trưởng thành của công nghệ đóng gói tiên tiến
Về mặt công nghệ cốt lõi, CPO hoàn toàn khác biệt so với các giải pháp truyền thống như mô-đun quang có thể tháo rời. Các linh kiện quang điện truyền thống về mặt công nghệ sản xuất không khác biệt nhiều so với các linh kiện và module quang điện nói chung, nhưng CPO cần đóng gói động cơ quang lên bo mạch nền hoặc lớp trung gian, chủ yếu dựa vào các công nghệ đóng gói tiên tiến như CoWoS.
Đồng thời, khác với đóng gói tiên tiến mà chúng ta thường hiểu, CPO cũng khác biệt vì nó không chỉ tích hợp mạch tích hợp điện tử mà còn tích hợp mạch tích hợp quang học, do đó, sự tích hợp dị hợp này cần được thực hiện thông qua kỹ thuật liên kết hỗn hợp như COUPE của TSMC.
Vấn đề nằm ở chỗ, một mặt, các công nghệ đóng gói tiên tiến nêu trên có độ khó công nghệ rất cao, cả NVIDIA lẫn Broadcom đều phụ thuộc vào năng lực sản xuất của TSMC, nhưng năng lực sản xuất là có hạn; ngoài ra, việc cung cấp các vật liệu như thiết bị quang耦, thiết bị liên kết hỗn hợp, thiết bị kiểm tra và nền ABF cũng có thể gặp trở ngại;
Đồng thời, trong giai đoạn hiện tại, tỷ lệ sản xuất của các công nghệ đóng gói tiên tiến nêu trên, đặc biệt là tích hợp dị thể, vẫn còn nhiều tiềm năng cải thiện, dẫn đến chi phí cao hơn đáng kể so với các giải pháp có thể cắm rút. Hiện tại, TSMC đang nỗ lực nâng cao tỷ lệ sản xuất của các công nghệ đóng gói tiên tiến, nhưng vẫn cần một khoảng thời gian nhất định.
2. Vấn đề bảo trì và sửa chữa
Đối với các giải pháp truyền thống có thể tháo rời, do chúng là “có thể tháo rời”, nên việc kiểm tra và bảo trì rất thuận tiện. Tuy nhiên, CPO hoàn toàn khác biệt, vì mô-đun quang-điện của nó được đóng gói trực tiếp cùng với bo mạch nền, lớp trung gian và thậm chí cả chip, do đó độ khó trong việc kiểm tra và bảo trì sẽ cao đáng kể so với các giải pháp truyền thống.
Tuy nhiên, các vấn đề trên cũng có thể được giải quyết, ví dụ như tăng mức độ lỗi chấp nhận được trong thiết kế, hoặc bố trí sự dư thừa ở cấp độ vận hành, v.v.
3. Vấn đề quản lý nhiệt
Việc đóng gói mật độ cao giữa động cơ quang và chip dẫn đến nhiệt độ cục bộ tăng rõ rệt trong quá trình vận hành, thậm chí vượt quá giới hạn chịu nhiệt của laser, do đó quản lý nhiệt cũng là một vấn đề lớn. Để giải quyết các vấn đề trên, cần áp dụng các giải pháp tản nhiệt hiệu quả hơn, nhưng điều này cũng sẽ liên quan đến chi phí.
4. Vấn đề chuẩn hóa
Hiện nay, NVIDIA, Broadcom và các công ty khác đang tích cực ra mắt các giải pháp switch CPO độc lập và hoàn chỉnh của riêng họ để giành lợi thế thị trường. Tuy nhiên, các tiêu chuẩn ngành (tiêu chuẩn giao diện, tiêu chuẩn đóng gói, v.v.) vẫn chưa được hình thành, dẫn đến việc các bên上下游 khó khăn trong việc nghiên cứu, sản xuất và cấu hình dựa trên một tiêu chuẩn chung, đây cũng là điểm khó trong việc thúc đẩy thương mại hóa.
Tóm lại, có thể thấy rằng tất cả các vấn đề trên đều có giải pháp, nhưng cần dựa vào sự trưởng thành của công nghệ, việc xây dựng tiêu chuẩn, v.v., và tất cả những điều này đều cần thời gian.
Mặt khác, về cơ bản, công nghệ CPO cần tạo ra lợi thế về chi phí tổng thể.
Điều này dẫn đến một câu hỏi: Dù là giải pháp nào, chi phí luôn là yếu tố cốt lõi, nhưng ngoài CPO, vẫn có những hướng đi tiên tiến hơn hoặc bảo thủ hơn đang được thúc đẩy, và chúng có mối quan hệ như thế nào? Ở đây, chúng ta hãy phân biệt sự khác biệt giữa các tuyến công nghệ khác nhau.
04 So sánh lộ trình kỹ thuật
1、CPO
CPO mà chúng ta đang thảo luận, tức là Quang học đóng gói chung (Co-Packaged Optics), như đã nêu ở trên, đề cập đến việc đóng gói động cơ quang và chip trên cùng một nền tảng, trong đó chip có thể là chip chuyển mạch (ASIC) hoặc các chip tính toán như GPU, nhưng thường chỉ đề cập đến chip chuyển mạch.
2. NPO
NPO là Quang học đóng gói gần (Near-Packaged Optics), cấp độ sơ cấp hơn CPO, chưa đạt đến mức độ đóng gói trên cùng một bo mạch nền hoặc lớp trung gian, mà chỉ đóng gói trên cùng một bo mạch chủ PCB.
Ở Trung Quốc, các công ty như Alibaba và Huawei đều đang thúc đẩy giải pháp NPO, điều này có thể được xem là một giải pháp thỏa hiệp trong bối cảnh thiếu năng lực đóng gói tiên tiến, nhưng có thể trở thành giải pháp chủ đạo trên thị trường Trung Quốc trong một thời gian, phần nào ảnh hưởng đến mức độ thâm nhập của giải pháp NVIDIA trên thị trường Trung Quốc.
Hình: Các phương pháp tích hợp khác nhau: (từ trên xuống dưới lần lượt là phương pháp có thể tháo rời, NPO, CPO (tích hợp trên bo mạch nền), CPO (tích hợp trên lớp trung gian), và OIO như sẽ đề cập phía dưới)

Nguồn: ASE, Dolphin Research
3、OIO
OIO (Optical I/O) có thể được xem là phiên bản nâng cao của CPO, ở đây không còn liên quan đến chip chuyển mạch, mà chủ yếu liên quan đến chip tính toán, chỉ việc tích hợp động cơ quang với chip tính toán cùng nhau, thậm chí kết hợp trực tiếp ở cấp độ chip, hướng đến hoàn toàn các cảnh huống trong tủ máy.
Hình: Hiển thị các phương pháp tích hợp khác nhau: có thể thay thế, CPO, OIO

Nguồn: TSMC, Openlight, Dolphin Research
Đến đây, chúng ta hãy làm rõ hơn về kiến trúc của trung tâm dữ liệu:
Trung tâm dữ liệu có thể được xem như là sự kết nối giữa các phần sau:
Máy chủ được tối ưu hóa cho các nhiệm vụ tính toán, bên trong được trang bị các chip tính toán như GPU, CPU, bộ nhớ, ổ cứng, v.v.;
Switch chịu trách nhiệm về giao tiếp mạng giữa các máy chủ và từ các máy chủ ra bên ngoài, thực hiện trao đổi dữ liệu thông qua chip ASIC;
Ngoài ra còn có hệ thống lưu trữ, trong kiến trúc trung tâm dữ liệu chính hiện nay, bộ nhớ chủ yếu được bố trí rải rác trên các nút máy chủ và đặt bên trong máy chủ, kết hợp với máy chủ.
Dựa trên kiến trúc trên, chúng ta có thể hình dung các kịch bản ứng dụng của CPO. Trên cơ sở đó, hãy cùng thảo luận tại sao CPO lại bắt đầu từ chip chuyển mạch?
Ở đây, chúng ta có thể so sánh vai trò của switch như một cầu vượt bên trong trung tâm dữ liệu; có thể hình dung rằng, switch chịu áp lực lớn nhất về băng thông truyền dữ liệu, mật độ cổng và các giới hạn về công suất đi kèm, do đó nhu cầu đối với CPO là cấp thiết hơn cả.
4. CPC
CPC, viết tắt của Co-Packaged Copper (đồng liên kết đóng gói chung), đề cập đến việc tích hợp trực tiếp các đầu nối đồng tốc độ cao lên bo mạch nền đóng gói.
Lợi thế chi phí của tuyến công nghệ này là rất rõ ràng, nhưng vẫn không giải quyết được vấn đề về giới hạn băng thông và suy giảm của môi trường đồng, do đó ứng dụng của nó bị hạn chế, có thể được sử dụng một phần để kết nối các nút GPU/CPU trong tủ với switch và chip lưu trữ. Hiện tại, giải pháp trong tủ của NVIDIA vẫn sử dụng kết nối đồng, nhưng trong tương lai có thể chuyển sang kết nối quang.
5. LPO
LPO là Quang học có thể cắm được dẫn động tuyến tính (Linear-Drive Pluggable Optics), một phiên bản thu gọn của quang học có thể cắm được, bằng cách loại bỏ chip DSP/CDR bên trong và chỉ giữ lại và tăng cường các chip analog Driver và TIA (chức năng của các bộ phận này sẽ được giải thích sau), nhằm đạt được việc điều khiển tín hiệu trực tiếp.
Nói một cách đơn giản, đó là loại bỏ trực tiếp chip DSP tiêu thụ nhiều năng lượng trong mô-đun quang, từ bỏ việc sửa lỗi tín hiệu; đồng thời tăng cường chip analog, bất kể tín hiệu có chính xác hay không, thông qua khuếch đại analog, trực tiếp để tín hiệu điện từ ASIC công tắc xông vào điều khiển laser.
Hình: So sánh sơ đồ mô hình truyền thống và cấu trúc LPO


Nguồn: Bryon Moyer, Semiconductor Engineering, Dolphin Research
Tuy nhiên, ở đây cũng tồn tại vấn đề, do các đường dẫn trên PCB không được rút gọn (gây suy giảm tín hiệu), đồng thời yêu cầu về chất lượng tín hiệu lại cao hơn, nên việc truyền tải khoảng cách xa vẫn bị hạn chế, và khi tốc độ tiến lên các cấp độ cao hơn (trên 1,6T), các vấn đề về toàn vẹn tín hiệu sẽ trở nên đặc biệt nổi bật. Nói cách khác, khi đơn giản hóa cấu trúc, hiệu suất cũng sẽ có sự hy sinh.

Tổng kết lại, chúng ta có thể thấy rằng, dù có các giải pháp dung hòa như NPO, CPC, LPO, nhưng khi các trung tâm dữ liệu tiến tới tốc độ cao hơn và quy mô cụm lớn hơn, các giải pháp dung hòa này cuối cùng sẽ gặp phải giới hạn, và CPO là giải pháp thế hệ tiếp theo bắt buộc phải đột phá.
6. Máy chuyển mạch quang học (OCS) là gì, liệu nó có đe dọa vị thế của CPO không?
Đến đây, không thể không đề cập đến OCS (Optical Circuit Switch). Đặc điểm cốt lõi của loại switch này là không có chuyển đổi quang-điện trong suốt quá trình, mà sử dụng ma trận công tắc quang để trực tiếp thiết lập đường dẫn quang vật lý trong miền quang.
Hình: Sơ đồ OCS

Nguồn: Orbray, Dolphin Research
Bạn có thể hình dung trực quan rằng nó giống như một mảng các gương phản xạ (mảng gương vi mô), có thể điều chỉnh góc của các gương theo lệnh để phản xạ ánh sáng theo các hướng khác nhau.
表面上看, OCS trực tiếp chuyển tiếp tín hiệu quang, thay thế quá trình chuyển đổi quang-điện và điện-quang của switch truyền thống, dường như sử dụng hướng công nghệ này thì không cần CPO (ít nhất là không cần CPO ở khâu switch). Nhưng thực tế không phải vậy.
Ở đây, chúng ta sẽ tổng hợp cách kiến trúc switch được xây dựng trong trung tâm dữ liệu:
(1) Trong bo mạch chủ: Trước hết, chúng ta biết rằng tính toán cốt lõi nhất trong trung tâm dữ liệu được thực hiện thông qua GPU. Sau khi GPU xử lý xong, dữ liệu cần được truyền cho CPU, CPU sau khi xử lý sẽ truyền tiếp cho card mạng (chứa ASIC), hoặc cũng có thể do GPU truyền trực tiếp cho card mạng.
Vậy các khâu trên có thể được thực hiện trên một bo mạch chủ, hoặc ít nhất là trên một máy chủ.
(2) Trong tủ: Sau đó, dữ liệu sẽ được truyền từ máy chủ đến switch trong tủ. Một tủ có thể chứa nhiều máy chủ kết nối tốc độ cao với nhau, nhưng trên đỉnh tủ phải có một switch để giao tiếp với bên ngoài, trao đổi dữ liệu giữa trong tủ và bên ngoài. Switch này được gọi là switch ToR (Top of Rack).
Và các bước trên được thực hiện trong cùng một tủ máy.
(3) Giữa các tủ: Trung tâm dữ liệu là một cụm gồm nhiều tủ, vậy thì việc điều phối giao tiếp giữa các tủ với nhau được thực hiện như thế nào? Lúc này, công dụng của switch Spine sẽ phát huy. Switch Spine chịu trách nhiệm quản lý tất cả các kết nối tốc độ cao giữa các switch Leaf và với bên ngoài trung tâm dữ liệu, đóng vai trò trung tâm của toàn bộ mạng switch trong trung tâm dữ liệu.
Hình: Sơ đồ Spine switch và Leaf switch trong trung tâm dữ liệu

Nguồn: Bryon Moyer, Semiconductor Engineering, Dolphin Research
Và OCS chủ yếu được sử dụng để thay thế các switch Spine.
Đầu tiên, các công tắc Spine có giá cao và tiêu thụ nhiều năng lượng, do đó nhu cầu về các giải pháp thay thế là cấp thiết nhất.
Thứ hai, vai trò của OCS là có hạn, nó chỉ có thể chuyển tiếp tín hiệu (phản xạ ánh sáng), giống như một chiếc gương phản xạ. Nhưng switch truyền thống có chức năng đầy đủ hơn, nó cần giải mã gói dữ liệu, xem địa chỉ IP, sau đó quyết định chuyển đến đâu. Ví dụ, do OCS chỉ có thể thực hiện lệnh mà không có khả năng phán đoán, trong trường hợp này, nó chỉ phù hợp để đóng vai trò là switch Spine; nhưng nếu muốn thay thế luôn switch Leaf, thì cần bổ sung các bộ phận khác để thực hiện chức năng “xử lý gói tin”, chẳng hạn như card mạng thông minh (SmartNIC), khi đó kiến trúc sẽ trở nên phức tạp hơn và không nhất thiết là giải pháp tối ưu.
Nhìn như vậy, kiến trúc trở nên rất rõ ràng:
Mặc dù hiện tại, các switch theo hướng CPO do NVIDIA giới thiệu như Quantum X800-Q3450 và các sản phẩm do Broadcom giới thiệu như Tomahawk 6 - Davisson đều là switch Spine, trong khi Google thúc đẩy switch OCS để thay thế cũng là switch Spine truyền thống, cả hai thực sự có mối quan hệ cạnh tranh trực tiếp.
Tuy nhiên, về mặt tổng thể, mặc dù OCS có cơ hội thay thế các switch Spine, nhưng ở cấp độ sâu hơn, các chuyển đổi điện-quang giữa quang engine và ASIC chip trên switch Leaf, cũng như kết nối giữa mainboard với mainboard trong máy chủ (thông qua card mạng ASIC hoặc NVSwitch...), và cuối cùng là kết nối giữa các chip tính toán với nhau và giữa chip tính toán với ASIC card mạng trên mainboard, vẫn cần sử dụng CPO. Do đó, trong tương lai, cả hai sẽ có mối quan hệ bổ trợ lẫn nhau.
05 Các khâu trong chuỗi công nghiệp liên quan là gì?
(1) Trước tiên, chúng ta phân tích nguyên lý và kiến trúc của CPO
CPO có thể được xem là phiên bản nâng cấp của quang engine, trong khi quang engine có chức năng chuyển đổi quang điện, bao gồm các bộ phận chính sau:
1. Phần mạch quang tử
(1) Bộ điều chế: Điều khiển cường độ ánh sáng và tín hiệu để ghi tín hiệu điện (số 0/1) thành tín hiệu quang.
(2) Bộ phát hiện: Là PD (Photodiode, điốt quang), chuyển đổi tín hiệu quang thành tín hiệu điện.
(3) Waveguide: có thể hiểu là sợi quang vi mô được in bên trong chip.
2. Phần mạch điện tử
(1) Driver: Khuếch đại tín hiệu điện yếu từ công tắc hoặc máy chủ thành tín hiệu điện có thể điều khiển chính xác đèn laser phát sáng, do đó bước tiếp theo sau Driver là bộ điều chế.
(2) TIA (Transimpedance Amplifier): Khuếch đại và chuyển đổi tín hiệu điện cực yếu do PD tạo ra thành tín hiệu điện áp có thể xử lý bởi các mạch tiếp theo, do đó TIA là bước tiếp theo sau PD.
3. Nguồn sáng, tức là laser
Bộ điều chế bản thân không thể phát sáng, nhưng nó có thể kiểm soát ánh sáng, do đó cần một bộ phận phát sáng phối hợp với nó, đó là laser.
Thông tin: Sơ đồ cấu trúc quang engine

Nguồn: Tsung Ze-kuo et al., "Nghiên cứu về mô-đun thu phát quang silicon 400G FR4", Dolphin Research
Ngoài ra còn có hai bộ phận khác:
4. DSP và CDR đều được sử dụng để sửa chữa tín hiệu điện. Một cái dùng để bù đắp tổn thất vật lý của tín hiệu điện, một cái dùng để trích xuất đồng hồ chính xác từ tín hiệu bị hư hỏng và tái tạo lại thứ tự dữ liệu, trong đó chip DSP thường tích hợp chức năng CDR.
Một điểm tương đồng giữa CPO và LPO là cả hai đều loại bỏ DSP có công suất cao, chi phí cao và nguồn độ trễ ra khỏi quang engine. Tuy nhiên, trong phương án CPO, các chức năng của DSP được tích hợp vào ASIC chuyển mạch, trong khi LPO sử dụng giải pháp khuếch đại bằng chip analog; ngoài ra, CPO sẽ tích hợp CDR vào高速SerDes.
Vậy SerDes tốc độ cao là gì? SerDes tốc độ cao bao gồm bộ Ser (bộ ghép nối nối tiếp) và bộ Des (bộ tách nối tiếp), nằm bên trong chip ASIC, lần lượt dùng để đóng gói dữ liệu song song bên trong chip thành luồng dữ liệu nối tiếp tốc độ cao, hoặc giải mã và phục hồi luồng dữ liệu nối tiếp tốc độ cao thành nhiều luồng dữ liệu song song tốc độ thấp.
(2) Xem tiếp toàn bộ chuỗi ngành CPO liên quan đến những khâu nào:
1, Trước tiên là tổng thể CPO
Trong CPO, quang engine bao gồm các phần mạch quang và mạch điện đã đề cập ở trên, sau đó quang engine kết hợp với chip ASIC tạo thành phần chính của công tắc CPO. Trước tiên, hãy nói về một vấn đề cốt lõi: ai sẽ làm CPO này?
Các mô-đun quang truyền thống, với cấu tạo gồm các linh kiện quang học và các linh kiện rời rạc, có thể được cung cấp đầy đủ bởi các nhà sản xuất chuyên môn, chẳng hạn như Zhongji Xinchuang, Xinyisheng, Coherent—những cái tên chúng ta đã quá quen thuộc. Vậy thì CPO thì sao? Rõ ràng là chúng không còn có thể dẫn dắt nữa.
Chúng tôi có xu hướng cho rằng, giá trị ngành công nghiệp dưới CPO sẽ có xu hướng như sau:
(1) Các nhà sản xuất và nền tảng chuyển mạch nắm giữ công nghệ cốt lõi: Các bên như hệ thống nền tảng trung tâm dữ liệu và nhà sản xuất chip chuyển mạch của NVIDIA/Google/Broadcom/Marvell định nghĩa kiến trúc và tiêu chuẩn + bán toàn bộ sản phẩm;
(2) Nhà sản xuất gia công: Các nhà máy Fab/kiểm tra và đóng gói như TSMC, UMC, Amkor thực hiện gia công sản xuất wafer, tích hợp quang điện và đóng gói tiên tiến;
(3) Nhà cung cấp đầu vào: Các nhà sản xuất linh kiện Coherent/Lumentum tiếp tục sản xuất và cung cấp linh kiện quang điện.
(4) Các nhà sản xuất mô-đun quang truyền thống: Trung Kế Húc Sáng / Tân Dị Thịnh v.v. trong giai đoạn chuyển tiếp cung cấp các giải pháp trung gian như NPO, LPO, cùng các thiết kế CPO thỏa hiệp dựa trên các yếu tố về khả năng bảo trì, tiếp tục cung cấp mô-đun động cơ quang.
2. Ngoài động cơ quang học cốt lõi của CPO, còn có một số thành phần khác cần lưu ý
(1) Máy phát laser
CPO chỉ có thể tích hợp các bộ phận chuyển đổi quang-điện, việc tích hợp trực tiếp laser vẫn còn gặp khó khăn, do đó vẫn cần sử dụng laser ngoài. Đồng thời, yêu cầu về công suất laser của CPO tăng đáng kể (tăng ít nhất 3-4 lần), dẫn đến yêu cầu về hiệu suất và độ tin cậy cũng tăng mạnh, do đó giá trị cũng sẽ tăng đáng kể.
Tuy nhiên, ở đây có sự lựa chọn về con đường công nghệ:
1) EML laser: Conventional approach, integrating the laser and modulator together, advantageous for high bandwidth and long-distance communication above 200G. This route is dominated by giants such as Lumentum, II-VI (Coherent), and Sumitomo.
2) Máy phát laser CW: Hướng đi mới, tách biệt hoàn toàn máy phát laser, mang lại lợi thế về chi phí và công suất tiêu thụ, đồng thời phù hợp hơn với lộ trình CPO trong tương lai. Nguồn cung máy phát laser CW linh hoạt hơn, các nhà sản xuất Trung Quốc như Yuanjie Technology, Shijia Photonics và Changguang Huaxin đã đạt sản lượng hàng loạt các sản phẩm 70mW/100mW và nhận được các đơn hàng lớn.
Hình: Sơ đồ so sánh sự khác biệt giữa EML và laser CW

Nguồn: Sumitomo Electric, Dolphin Research
Tiếp theo là bốn thành phần sợi quang, những thành phần này ít được sử dụng trong tuyến đường mô-đun quang có thể cắm rút truyền thống:
(2) Bộ phận mảng sợi quang (FAU, Fiber Array Unit): Dùng để lắp đặt chính xác sợi quang nhằm đạt được sự căn chỉnh chính xác giữa sợi quang và sóng dẫn.
Hình: Bộ phận mảng sợi

Nguồn: Corning, Dolphin Research
(3) Sợi quang duy trì phân cực (PMF, Polarization Maintaining Fiber): Là một loại sợi quang đặc biệt được sử dụng để duy trì trạng thái phân cực của sóng ánh sáng không đổi.
(4) Hộp phân phối sợi quang (Fiber Shuffle): Dùng để sắp xếp sợi quang, có thể sắp xếp lại thứ tự vị trí của các sợi quang trong các thiết bị mật độ cao phức tạp.
Hình: Minh họa Fiber Shuffle

Nguồn: Hyoptic, Dolphin Research
(5) Đầu nối sợi quang (MPO, Multi-Fiber Push On): Dùng để kết nối giữa các sợi quang đa lõi.
Hình: Sơ đồ cổng MPO

Nguồn: Senko, US Conec, Dolphin Research
Tại sao các mô-đun quang truyền thống hiếm khi sử dụng các thành phần trên?
(1) Trong mô hình truyền thống, sợi quang được cắm trực tiếp vào cổng tiêu chuẩn, nhưng trong CPO, sợi quang cần được ghép nối chính xác với sóng dẫn trên bề mặt chip quang, do đó cần sử dụng FAU;
(2) Mô hình truyền thống là điều chế trực tiếp, không nhạy cảm với trạng thái phân cực của sóng ánh sáng, và trước đây sợi quang giữ phân cực (PMF) có chi phí rất cao, không phù hợp để ứng dụng công nghiệp; tuy nhiên, CPO sử dụng bộ laze bên ngoài để cung cấp nguồn sáng, trạng thái phân cực của laze sẽ gây tổn thất năng lượng lớn, do đó bắt buộc phải sử dụng PMF;
(3) Mô hình truyền thống thường chỉ có hai sợi quang, một phát và một thu, không cần kết nối nhiều sợi quang phức tạp vào bo mạch nền, do đó có thể thực hiện bằng thao tác thủ công mà không cần Fiber Shuffle, nhưng trong CPO bắt buộc phải sử dụng Fiber Shuffle;
(4) Tương tự, các mô-đun truyền thống không cần nhiều cổng giao diện, nhưng trong CPO, nếu đạt đến hơn 400G, cần 8 hoặc thậm chí 16 sợi quang truyền song song, trong khi không gian bảng điều khiển lại hạn chế, do đó cần sử dụng bộ kết nối đa lõi MPO.
Về không gian thị trường và các cơ hội đầu tư trong các khâu công nghiệp liên quan đến CPO, chúng tôi sẽ phân tích trong bài tiếp theo.
