Báo cáo Bernstein: Cuộc chiến kết nối trung tâm dữ liệu AI, ai sẽ chiến thắng vào năm 2026?

Báo cáo sâu rộng 97 trang mới nhất của Bernstein chỉ ra rằng, các kết nối đồng và kết nối quang trong trung tâm dữ liệu AI không thay thế lẫn nhau, mà sẽ cùng tồn tại lâu dài trong các kịch bản mở rộng dọc và mở rộng ngang. Mặc dù công nghệ CPO có lợi thế về công suất và chi phí, nhưng việc triển khai rộng rãi vẫn gặp trở ngại do các thách thức trong sản xuất và bảo trì, và việc phổ biến quy mô lớn khó có thể xảy ra trước năm 2028; do đó, kết nối quang LPO/NPO có thể trở thành người dẫn đầu trong giai đoạn chuyển tiếp. Tuy nhiên, CPO đang tái định hình cơ cấu giá trị căn bản, chuyển trung tâm lợi nhuận từ các nhà cung cấp mô-đun quang truyền thống sang thiết kế chip, đóng gói tiên tiến và tích hợp hệ thống.

Ở đây cần đặc biệt nhắc đến tổ chức Bernstein. Bernstein (Bernstein, đầy đủ là Sanford C. Bernstein) là một công ty nghiên cứu đầu tư và tổ chức quản lý tài sản toàn cầu có trụ sở tại Hoa Kỳ. Được thành lập năm 1967, hiện nay Bernstein trực thuộc AllianceBernstein (viết tắt là AB) – tập đoàn quản lý tài sản toàn cầu lớn nhất. Bernstein cũng là một trong những tổ chức nghiên cứu bán lẻ độc lập lớn nhất và có lịch sử lâu đời nhất. Dưới đây là phân tích chi tiết báo cáo của Bernstein.

Tháng 2, đã phân tích chi tiết logic nền tảng của việc truyền dẫn nghẽn cổ chai trong chuỗi công nghiệp tính toán AI, và đề cập đến quang liên kết là một trong những trục AI chính mà thị trường đang chuyển đổi trong giai đoạn 25-26.

Mới bắt đầu quan tâm và nghiên cứu lĩnh vực quang liên kết từ cuối năm ngoái tại https://x.com/qinbafrank/status/2015377625167089671?s=20

Trong báo cáo của Bernstein, trọng tâm là ba khía cạnh:

Tại sao tính kết nối thay vì sức mạnh tính toán trở thành điểm nghẽn mới? Tiến độ thực hiện của CPO nằm ở đâu? Tại sao bo mạch PCB/ABF là hướng thực tế hơn để hiện thực hóa hiệu quả vào năm 2026? Phân tích chi tiết

Báo cáo này thực sự muốn nói đến không phải là “CPO sẽ bùng nổ”, mà là:

Sự tắc nghẽn trong trung tâm dữ liệu AI đang tiếp tục dịch chuyển từ GPU/HBM/CoWoS sang “hệ thống kết nối”. Chủ đề đầu tư tương lai không phải là CPO độc tôn, mà là sự đồng bộ nâng cấp của quang, điện, đồng, bo mạch, đóng gói và kiểm tra.

Nói một cách đơn giản hơn:

Trước đây, thị trường quan tâm đến AI chủ yếu tập trung vào sức mạnh tính toán của GPU.

Hiện thị trường bắt đầu quan tâm đến cách kết nối các GPU với nhau.

Điều cần quan sát trong tương lai là liệu khả năng sử dụng năng lực tính toán có thể được hệ thống kết nối giải phóng hay không.

Đó chính là điều được gọi là “Cuộc chiến về kết nối trung tâm dữ liệu AI” trong tiêu đề báo cáo.

Tại sao "kết nối" lại trở thành điểm nghẽn mới của trung tâm dữ liệu AI?

Việc xây dựng cụm AI không đơn giản chỉ là xếp chồng các GPU lại với nhau. Vấn đề thực sự là: các GPU này phải đồng bộ hóa, trao đổi tham số, truyền giá trị kích hoạt, thực hiện AllReduce, thực hiện song song mô hình và song song dữ liệu với tốc độ cao. Dù năng lực tính toán lý thuyết có mạnh đến đâu, nếu giao tiếp giữa các GPU không theo kịp, hiệu suất thực tế sẽ giảm xuống.

Có thể hiểu cụm AI như một nhà máy khổng lồ:

Bo mạch ABF

Tại sao tính kết nối lại thay thế sức mạnh tính toán trở thành điểm nghẽn mới?

Nguồn gốc của vấn đề này bắt nguồn từ cách huấn luyện mô hình lớn. Có hai phương pháp song song để huấn luyện mô hình lớn:

Một phương pháp gọi là tensor parallelism, một phương pháp khác gọi là expert parallelism. Điểm chung của hai phương pháp này là cần trao đổi dữ liệu thường xuyên và quy mô lớn giữa các GPU.

Lượng dữ liệu cần trao đổi giữa các GPU trong một lần huấn luyện là con số khổng lồ, điều này có nghĩa gì? Trước đây, bạn chỉ cần tăng số lượng GPU là được, nhưng bây giờ bạn càng tăng nhiều, chi phí giao tiếp giữa các GPU càng lớn. Đến một điểm giới hạn, việc thêm GPU không còn giúp huấn luyện nhanh hơn, mà ngược lại còn làm tình trạng tắc nghẽn giao tiếp trở nên nghiêm trọng hơn, đây chính là điểm nghẽn kết nối.

Bernstein đã đưa ra một so sánh: trong một tủ máy tiêu chuẩn của NVIDIA GB30, các GPU với nhau sử dụng cáp đồng vì khoảng cách ngắn, cáp đồng rẻ và ổn định. Tuy nhiên, giữa các tủ máy với nhau bắt buộc phải sử dụng sợi quang, vì cáp đồng vượt quá 2 mét sẽ bị suy giảm tín hiệu không thể chấp nhận được. Hai đầu sợi quang cần module quang, module quang có nhiệm vụ chuyển đổi tín hiệu điện thành tín hiệu quang và ngược lại.

Vấn đề đặt ra là, một mô-đun quang 1.6T tiêu thụ khoảng ba mươi watt, trong đó hơn một nửa bị một con chip gọi là DSP (bộ xử lý tín hiệu số) hấp thụ. Trong một tủ máy có hàng trăm mô-đun quang, mức tiêu thụ điện năng cho truyền thông quang không thể giảm xuống.

Vấn đề thực sự mà các trung tâm dữ liệu AI đang gặp phải hiện nay không phải là thiếu sức tính toán khiến công suất tiêu thụ đạt đỉnh. Chính NVIDIA cho biết rằng các bộ chuyển mạch CPU thế hệ mới có thể tiết kiệm tới 70% công suất so với các mô-đun quang truyền thống; chỉ riêng một bộ chuyển mạch 51,2T đã có thể tiết kiệm 500 watt, lượng công suất tiết kiệm được này giúp bạn có thể lắp thêm nhiều GPU hơn.

NVIDIA cũng đang củng cố câu chuyện này. Vào tháng 3 năm 2025, NVIDIA đã ra mắt Spectrum-X Photonics và các công tắc silicon photonics Quantum-X, nhấn mạnh rằng chúng được thiết kế để kết nối hàng triệu GPU trong các nhà máy AI, đồng thời giảm tiêu thụ năng lượng và chi phí vận hành; NVIDIA cho biết các công tắc photonics của họ có thể đạt tốc độ 1,6 Tb/s mỗi cổng, cải thiện hiệu quả năng lượng 3,5 lần, tăng độ toàn vẹn tín hiệu 63 lần và nâng cao độ bền mạng 10 lần.

Logic cơ bản trong báo cáo của Bernstein là: Giai đoạn tiếp theo của chi tiêu vốn cho AI không chỉ là mua thêm nhiều GPU hơn, mà còn là mua thêm nhiều “khả năng kết nối giúp GPU hoạt động hiệu quả” hơn.

Hai, phán đoán cốt lõi nhất của báo cáo: không phải "đồng lui, ánh sáng tiến", mà là "nhiều tuyến đường đồng thời tồn tại"

Trên thị trường thường có một cách nói đơn giản: tiến vào đồng, lùi ra khỏi vàng.

Tuy nhiên, quan điểm trong báo cáo này tinh tế hơn: đồng và quang không phải là mối quan hệ thay thế đơn giản, mà sẽ cùng tồn tại lâu dài trong các điều kiện khác nhau về khoảng cách, băng thông, yêu cầu bảo trì và cơ cấu chi phí. Bernstein cho rằng copper và optical interconnects không phải là sản phẩm thay thế trực tiếp, mà đang phát triển riêng biệt trong các kịch bản Scale-up và Scale-out. Phán đoán này cực kỳ quan trọng.

1. Mở rộng quy mô: Kết nối trong tủ hoặc gần nhau, đồng vẫn rất mạnh

Scale-up gần với kết nối tốc độ cao giữa GPU với GPU, GPU với switch, trong cùng tủ hoặc trong phạm vi gần tủ. Ở đây quan trọng nhất là:

Độ trễ thấp, chi phí thấp, độ tin cậy cao, khả năng bảo trì, khả năng truyền dẫn khoảng cách ngắn.

Trong tình huống này, đồng không chết ngay lập tức.

Trước đây, Huang đã rõ ràng tuyên bố: NVIDIA tạm thời sẽ không sử dụng CPO cho kết nối chính giữa các GPU hàng đầu, vì kết nối đồng truyền thống hiện nay đáng tin cậy hơn nhiều so với kết nối quang CPO; NVIDIA sẽ đầu tiên áp dụng CPO vào hai chip mạng mới trong switch ở đỉnh máy chủ.

Câu này rất quan trọng. Nó cho thấy: CPO là hướng đi, nhưng không ngay lập tức thay thế hoàn toàn đồng.

Nói cách khác, ít nhất ở giai đoạn hiện tại, logic của NVIDIA là:

Bên công tắc có thể triển khai CPO trước, trong khi bên GPU/XPU cần thận trọng hơn.

Lý do rất đơn giản: GPU là tài sản đắt nhất và quan trọng nhất trong hệ thống. Bạn không thể hy sinh độ tin cậy chỉ để tiết kiệm năng lượng qua kết nối quang. Trong cụm đào tạo AI, một liên kết thường xuyên bị mất kết nối không chỉ gây tổn thất về chi phí phần cứng, mà còn dẫn đến gián đoạn nhiệm vụ đào tạo, giảm hiệu suất sử dụng GPU và tăng độ phức tạp trong lập lịch.

2. Mở rộng quy mô: Kết nối giữa các tủ máy/tập hợp, quang học có lợi thế hơn

Scale-out là việc mở rộng quy mô cụm GPU lớn hơn, thường liên quan đến lưu lượng ngang xa hơn giữa các tủ và trong nội bộ trung tâm dữ liệu.

Trong bối cảnh này, lợi thế của giải pháp quang học rõ ràng hơn:

Khoảng cách xa hơn, băng thông cao hơn, dây cáp nhẹ hơn, công suất tiêu thụ thấp hơn và mật độ bố trí dây tốt hơn.

Vì vậy, tương lai không phải là “đồng bị ánh sáng thay thế hoàn toàn”, mà là:

Bo mạch ABF

Điểm giá trị nhất trong báo cáo của Bernstein: nó không dừng lại ở cấp độ “các cổ phiếu khái niệm CPO”, mà tách rời AI thành nhiều tuyến công nghệ khác nhau.

Ba, CPO: Hướng đi rất quan trọng, nhưng năm 2026 không phải là năm bùng nổ toàn diện

Điểm dễ bị thị trường hiểu lầm nhất trong báo cáo này là CPO.

Nhiều người nhìn thấy CPO, lập tức đưa ra kết luận:

Các module quang sẽ bị thay thế, CPO lập tức bùng nổ, các nhà sản xuất module quang truyền thống kết thúc.

Hiểu như vậy quá thô sơ.

Bernstein dự kiến việc triển khai quy mô nhỏ của CPO trong mạng scale-out có thể bắt đầu từ nửa sau năm 2026, chủ yếu để xác minh hiệu suất thực tế và mức độ trưởng thành của chuỗi cung ứng; tuy nhiên, việc áp dụng CPO trong các kịch bản scale-up quan trọng hơn có thể bị hoãn đến sau nửa sau năm 2028, vì ngành công nghiệp cần xác minh độ tin cậy dài hạn của CPO ở phía switch trước khi áp dụng vào các hệ thống XPU có giá trị cao hơn và ít dung sai lỗi hơn.

Điều này phù hợp với tuyên bố trước đây của Jensen Huang: CPO sẽ được sử dụng đầu tiên cho các chip trao đổi mạng, chứ không trực tiếp áp dụng quy mô lớn vào kết nối chính của GPU.

Vì vậy, nhịp thời gian nên được hiểu như sau:

Bo mạch ABF

Quan điểm của LightCounting cũng ủng hộ sự “tiến hóa dần dần” thay vì “chuyển đổi trong một đêm”. Nó dự đoán rằng các thiết bị pluggable truyền thống sẽ vẫn chiếm ưu thế trong 5 năm tới, mặc dù LPO/CPO sẽ chiếm tỷ trọng đáng kể trên các cổng 800G và 1.6T trong giai đoạn 2026–2028. Tóm tắt quan điểm ngành của EDN cũng đề cập rằng Yole cho rằng việc triển khai quy mô lớn CPO có thể diễn ra trong khoảng 2028–2030, trong khi LightCounting cho rằng trong thập kỷ này, các mô-đun quang vẫn sẽ chiếm đa số trong các liên kết quang tại trung tâm dữ liệu, nhưng các thiết bị quang sẽ tiếp tục tiến gần hơn đến ASIC.

Vì vậy, phán đoán của tôi là:

CPO là hướng đi trung và dài hạn, nhưng doanh thu chắc chắn hơn vào năm 2026 không nhất thiết nằm ở các cổ phiếu thuần CPO, mà nằm ở các thành phần phải được nâng cấp trước khi CPO ra đời: nguồn sáng, kiểm tra, đóng gói, PCB, ABF, CCL, mô-đun quang 1.6T và LPO/NPO.

Bốn, LPO/NPO: Chúng là "chủ đề chuyển tiếp" trước khi CPO bùng nổ

Một điểm quan trọng trong báo cáo này là không đơn giản hóa tuyến đường công nghệ thành “mô-đun quang truyền thống vs CPO”.

Còn có LPO và NPO ở giữa.

1. LPO là gì?

LPO, viết tắt của Linear Pluggable Optics. Nó có thể được hiểu大致 là: giữ nguyên hình thức có thể cắm vào, nhưng loại bỏ hoặc làm yếu DSP, sử dụng điều khiển tuyến tính và cân bằng phía chủ để giảm tiêu thụ điện năng.

Ưu điểm là: tiêu thụ điện năng thấp hơn, chi phí có thể thấp hơn và vẫn giữ được một mức độ bảo trì nhất định.

Nhược điểm là: việc gỡ lỗi hệ thống khó hơn, ngân sách liên kết chặt chẽ hơn, và yêu cầu cao hơn đối với SerDes và kỹ thuật hệ thống phía máy chủ.

Tóm tắt công khai cho biết, LPO có thể giảm đáng kể mức tiêu thụ năng lượng so với các mô-đun có thể thay thế truyền thống bằng cách loại bỏ DSP và giao xử lý tín hiệu cho các thành phần tuyến tính, đồng thời vẫn giữ được sự thuận tiện trong bảo trì mô-đun; Bernstein thậm chí cho rằng đến năm 2030, sản lượng LPO có thể vượt quá CPO.

2. NPO là gì?

NPO có thể được hiểu là Near-Packaged Optics, tức là đặt quang engine gần ASIC hơn, nhưng không hoàn toàn tích hợp như CPO.

Giá trị của nó nằm ở sự thỏa hiệp:

Bo mạch ABF

Điều này cho thấy trong vài năm tới rất có thể không phải là “bước trực tiếp đến CPO”, mà là:

Có thể thay thế truyền thống → LPO/NPO → CPO → I/O quang / optical fabric

Đó cũng là lý do tại sao năm 2026, bạn không thể chỉ nhìn vào CPO. Những công ty có khả năng cung cấp hàng qua nhiều giai đoạn mới là những công ty thực sự có thể hiện thực hóa hiệu quả kinh doanh.

Tóm lại, câu chuyện về CPO sẽ không được hiện thực hóa vào năm 2026; trong nửa cuối năm 2026, CPO chỉ có thể xuất hàng với số lượng nhỏ, chỉ dùng cho các kịch bản scale out, và việc triển khai quy mô lớn giữa các tủ máy sẽ chỉ diễn ra vào năm 2028.

Tại sao lại chậm vậy? Bernstein đưa ra ba lý do:

Lý do đầu tiên là các nhà cung cấp dịch vụ đám mây không muốn thay thế các mô-đun quang truyền thống, vì khi gặp sự cố, nhân viên vận hành chỉ cần tháo ra và thay bằng cái mới, vài phút là xong. CPU lại được hàn cố định trong switch, nếu một động cơ quang bị hỏng, cả thiết bị switch phải gửi về nhà máy sửa chữa, thời gian ngừng hoạt động và chi phí vận hành là vấn đề lớn đối với các nhà cung cấp dịch vụ đám mây như Amazon, Google và Microsoft. Hơn nữa, tỷ lệ lỗi của mô-đun quang không thấp; tiêu chuẩn ngành là cứ 100.000 giờ mới xảy ra một lần lỗi, tương đương với việc mỗi năm phải thay 9 mô-đun trong số 10.000 mô-đun, đây là lỗi cứng, chưa kể đến các lỗi mềm.

CPO tích hợp quang engine vào chip, độ tin cậy phải được nâng cao vài cấp độ mới khiến các nhà cung cấp dịch vụ đám mây yên tâm. Bernstein trực tiếp nói rằng, khi trao đổi với công ty Trung Quốc sản xuất mô-đun quang InnoLight, họ được biết không có nhà cung cấp dịch vụ đám mây nào lên kế hoạch triển khai quy mô lớn CPO trong giai đoạn 2026-2027. Câu này rất nặng, nhưng thị trường có thể vẫn chưa lắng nghe.

Lý do thứ hai là giải pháp chuyển tiếp đã được đưa ra, CPU không còn là lựa chọn duy nhất. Có hai công nghệ trung gian, một gọi là LPO và một gọi là NPO. LPO loại bỏ chip DSP tiêu tốn nhiều năng lượng nhất trong mô-đun quang, thay thế bằng các linh kiện đơn giản hơn. Việc loại bỏ này giúp giảm công suất xuống còn một phần ba so với mô-đun quang truyền thống, đồng thời vẫn giữ được khả năng cắm rút 800G. LPO hiện đã ở giai đoạn sản xuất hàng loạt.

NPO là đặt quang engine trên PCB cạnh chip switch, nhưng vẫn có thể tháo rời. Các sản phẩm mà NVIDIA hiện gọi là CPU, về mặt kỹ thuật, thực chất là các giải pháp chuyển tiếp NPO này có thể duy trì trong 2 đến 3 năm. Do đó, các nhà cung cấp dịch vụ đám mây hoàn toàn có lý do để nói rằng họ sẽ sử dụng LPU trước, và chờ đến khi CPO thực sự trưởng thành mới chuyển đổi.

Lý do thứ ba là trong các kịch bản mở rộng quy mô, cáp đồng vẫn chưa bị loại bỏ, kết nối giữa các GPU được gọi là scale up. Hiện tại, không có sản phẩm thay thế nào có thể vượt trội hơn về lợi thế chi phí và độ tin cậy của cáp đồng.

Bernstein rõ ràng cho rằng, từ năm 2026 đến 2028, việc mở rộng quy mô vẫn sẽ do cáp đồng dẫn đầu, Luxshare Precision là người hưởng lợi, công ty này đang cạnh tranh trực tiếp với Amphenol về bộ kết nối cáp đồng của NVIDIA GP300, đồng thời còn có công nghệ chuyển tiếp gọi là CPC (co-packaged copper cable), giúp kéo dài vòng đời của cáp đồng thêm một bước.

Công ty tư vấn ngành Lightcounting dự đoán rằng đến năm 2029, cáp đồng vẫn sẽ chiếm gần một nửa thị phần trong thị trường kết nối 1.6T.

V. Tác động lớn nhất của CPO: Không đơn thuần là giảm chi phí, mà là phân phối lại hồ lợi nhuận

Ý nghĩa công nghiệp của CPO không chỉ là tiết kiệm năng lượng, mà cũng không đơn thuần là thay thế mô-đun quang.

Điều nó thực sự thay đổi là: lợi nhuận đến từ đâu.

Thời kỳ mô-đun quang có thể thay thế truyền thống, chuỗi giá trị大致 là:

DSP / Chip quang / TOSA/ROSA / Bao bì mô-đun / Nhà sản xuất mô-đun quang / Nhà sản xuất switch / Nhà cung cấp đám mây.

Thời đại CPO sẽ trở thành:

Chuyển ASIC / Động cơ quang / Nguồn laser ngoài / FAU / Gói tiên tiến / Sản xuất wafer / Kiểm tra / Tích hợp hệ thống.

Bernstein đã phân tích chi phí cho switch NVIDIA Quantum-X800 CPO: switch này được trang bị bốn chip switch ASIC, mỗi chip tích hợp 18 optical engine và 18 module nguồn sáng bên ngoài; chi phí ước tính cho một switch Quantum-X800 CPO khoảng 570.000 USD. Tóm tắt cũng chỉ ra rằng trong kiến trúc CPO, DSP bị loại bỏ, optical engine và chip switch được đóng gói chung, trung tâm giá trị chuyển dịch sang thiết kế chip, đóng gói tiên tiến và sản xuất wafer.

Đó là lý do tại sao báo cáo sẽ tích cực cho các hướng này:

Bo mạch ABF

So sánh với đó, các nhà sản xuất module quang truyền thống sẽ đối mặt với một vấn đề:

Nếu giá trị chuyển từ mô-đun đóng gói sang ASIC, đóng gói, động cơ quang học và tích hợp hệ thống, các nguồn lợi nhuận của chúng có thể được tái cấu trúc.

Tuy nhiên, điều này không có nghĩa là các nhà sản xuất mô-đun quang truyền thống sẽ lập tức mất giá trị. Bởi vì trong giai đoạn 2026–2028, các sản phẩm 800G, 1.6T, LPO/NPO vẫn sẽ có nhu cầu lớn. Cignal AI cũng chỉ ra rằng, các mô-đun datacom tốc độ cao, đặc biệt là các thiết kế 800GbE và 1.6TbE mới nổi, vẫn sẽ là động lực tăng trưởng chính vào năm 2026.

Vì vậy, cách hiểu đúng là:

CPO sẽ thay đổi phân phối lợi nhuận trong chuỗi công nghiệp mô-đun quang, nhưng sẽ không loại bỏ ngay lập tức các mô-đun quang có thể cắm rút vào năm 2026.

Sáu, tại sao báo cáo nhấn mạnh PCB, ABF, CCL là những hướng đi thực tế hơn vào năm 2026?

Đây là điều tôi nghĩ bạn nên quan tâm nhất.

CPO có tiềm năng lớn nhưng chu kỳ hiện thực hóa dài hơn. So với đó, các sản phẩm PCB, ABF, CCL có sự nâng cấp gần với đơn hàng hiện tại hơn.

Lý do là: Ngay cả khi CPO vẫn chưa được thương mại hóa quy mô lớn, các máy chủ AI và switch đã đang được nâng cấp.

Rubin, Rubin Ultra, GB300, ASIC của nhà cung cấp đám mây, ASIC switch thế hệ tiếp theo, đều đang được cải thiện:

Tốc độ bảng đơn, diện tích bao bì, mật độ cấp điện, yêu cầu về tính toàn vẹn tín hiệu, yêu cầu tản nhiệt, yêu cầu vật liệu tổn thất thấp.

Đây là điểm phản biện nhất trong báo cáo này, nhưng cũng là điểm dễ bị bỏ qua nhất. Những người thực sự kiếm được tiền vào năm 2026 là những người đầu tư vào chuỗi ngành truyền thống gồm PCB, HDI, ABF và nền tảng.

Tại sao lại nói là phản đồng thuận? Vì lĩnh vực này quá truyền thống. PCB là ngành công nghiệp đã tồn tại hàng chục năm, thị trường toàn cầu đạt 85 tỷ USD vào năm 2025, nghe có vẻ không hề hấp dẫn, mọi người đều đang chú ý đến CPO, module quang học và NVIDIA, không ai chịu dành thời gian nghiên cứu bảng mạch in, nhưng dữ liệu từ Bernstein cho chúng ta thấy rằng lĩnh vực này đã âm thầm bùng nổ vào năm 2025.

Bernstein đã đưa ra một loạt con số: Shenghong Technology, chuyên sản xuất bảng HDI (High-Density Interconnect), ghi nhận doanh thu tăng 63% so với cùng kỳ năm 2025. WUS (Hubei Shengyi) tăng 45% doanh thu từ việc cung cấp PCB cho NVIDIA GB300. Gold Circuit (Jinxiang Electric) tăng 40% doanh thu cung cấp hàng năm cho AWS Trinium, và Shengyi Electronic, một nhà cung cấp khác trong chuỗi cung ứng AWS, cũng tăng 40%. Đây đều là những kết quả thực tế đã xảy ra, không phải dự báo, mà là đã được thực hiện. Tại sao lĩnh vực này lại tăng trưởng? Có ba chiều kích để xem xét:

Lớp đầu tiên là lượng PCB trong máy chủ AI đã tăng gấp đôi. Trước đây, với máy chủ NVIDIA H10, tổng giá trị của 80 GPU HDI cộng với PCB vào khoảng 100 đến 150 đô la Mỹ mỗi GPU. Nhưng khi chuyển sang tủ GB200VL72, con số này tăng trực tiếp lên 300 đô la Mỹ mỗi GPU. Điều này có nghĩa là: khi bán cùng một GPU, lợi nhuận của nhà sản xuất PCB đã tăng gấp đôi.

Và điều này chưa dừng lại, nền tảng Vera Robin sắp tới sẽ áp dụng một cấu trúc mới gọi là midplane, thay thế các đoạn cáp đồng trước đây bằng PCB đa lớp. Midplane này là bo mạch 44 lớp, sử dụng tấm đồng cấp M8 cao cấp nhất, và trong thế hệ tiếp theo là Rubin Ultra có thể sử dụng bo mạch 78 lớp cấp M9. Số lớp tăng gấp đôi, vật liệu được nâng cấp, giá trị tăng gấp đôi một lần nữa.

Lớp thứ hai là sự kìm hãm nguyên liệu đầu vào. Một loại nguyên liệu then chốt trong tấm ABF là sợi thủy tinh T-glass có hệ số giãn nở nhiệt thấp, có tác dụng ngăn ngừa biến dạng tấm nền do nhiệt độ cao, dẫn đến thất bại tại các điểm hàn.

Hiện nay, trên toàn cầu chỉ có một công ty có thể sản xuất T glass đạt tiêu chuẩn cao cấp, đó là Nisshinbo, với giá trị CTE là 2,8%, các nhà sản xuất khác không thể đạt được mức này. Công suất mới của Nisshinbo sẽ chỉ đi vào hoạt động vào cuối năm 2026 và bắt đầu giao hàng chính thức vào năm 2027, điều này có nghĩa là T glass sẽ tiếp tục thiếu hụt suốt năm 2026.

T glass shortage là gì? Đó là thời điểm các nhà sản xuất bo mạch ABF có thể tăng giá một cách chính đáng. Unimicron Advanced Electronics đã đàm phán lại giá với khách hàng. Mô hình của Bernstein dự đoán, ASP của bo mạch ABF sẽ tăng 5% đến 7% theo quý vào năm 2026, với mức tăng tích lũy cả năm có thể vượt quá 20%.

Lớp thứ ba là người độc quyền ẩn danh của màng ABF. Màng ABF là một trong những vật liệu cốt lõi của bo mạch ABF, và người phát minh ra vật liệu này là Agenomoto, Aji-no-moto—công ty thực phẩm Nhật Bản chuyên bán bột ngọt. Trong quá trình nghiên cứu bột ngọt vào những năm 90, họ vô tình phát hiện ra một loại màng dẫn xuất từ axit amin đặc biệt, có thể dùng làm lớp giãn nở nhiệt cho bo mạch bán dẫn. Kể từ đó, 95% màng ABF toàn cầu đều đến từ Aji-no-moto.

The data from Bernstein shows that Ajinomoto's ABF business has a gross profit margin of 60%, with a growth rate of 32% in fiscal year 12026, and is expected to accelerate to 45% in fiscal year 2027. This company's ABF business has been untouchable for 30 years.

Vì vậy, điều chắc chắn hơn vào năm 2026 không phải là “CPO bùng nổ trong một đêm”, mà là:

Cần nâng cấp PCB tốc độ cao; cần nâng cấp nền ABF; cần nâng cấp CCL sang vật liệu tổn thất thấp hơn; cần nâng cấp đồng foil, vải sợi thủy tinh và vật liệu có Dk/Df thấp; cần nâng cấp các bước kiểm tra và xác minh.

Vì vậy, chiến lược thực tế hơn cho năm 2026 là tập trung vào ba yếu tố chắc chắn—nhu cầu quang học từ chuyển đổi 1.6T và LPO/NPO, nâng cấp PCB/ABF/CCL do Rubin/ASIC mang lại, và các khoản đầu tư bắt buộc trước khi thử nghiệm CPO vào kiểm tra/FAU/nguồn sáng/đóng gói tiên tiến.

Vì thị trường vốn thường mắc một sai lầm:

Thích mua các khái niệm xa vời nhất, nhưng những thứ thực sự tạo ra kết quả đầu tiên thường là “cơ sở hạ tầng phải được xây dựng trước khi các khái niệm xa vời ấy có thể triển khai”.

CPO giống như nhà ga cao tốc của tương lai.

Nhưng trước khi hệ thống ga tàu cao tốc hoạt động toàn diện, những người có thể kiếm tiền trước có thể là những người xây đường, trải ray, cung cấp điện, hệ thống tín hiệu và thiết bị kiểm tra.

Bảy, thứ tự hưởng lợi từ chuỗi công nghiệp trong báo cáo này

Nếu chia chuỗi công nghiệp kết nối AI thành bốn lớp:

Lớp đầu tiên: Người chiến thắng mạnh nhất ở cấp độ nền tảng

Các công ty này không chỉ bán một bộ phận, mà còn kiểm soát kiến trúc.

NVIDIA

Lợi thế của NVIDIA không chỉ nằm ở GPU, mà còn là GPU + NVLink + InfiniBand + Ethernet + Spectrum-X + Quantum-X + hệ sinh thái phần mềm. Các công tắc mạng silicon photonics do NVIDIA công bố chính thức đã đưa các công ty như TSMC, Coherent, Corning, Fabrinet, Foxconn, Lumentum, SENKO, SPIL, Sumitomo Electric, TFC Communication vào hệ sinh thái.

Điều này cho thấy NVIDIA đang làm một việc:

Không chỉ bán GPU, mà còn đưa kiến trúc mạng của nhà máy AI vào nền tảng của mình để kiểm soát.

TSMC là trung tâm ẩn giấu của toàn bộ câu chuyện này

Nền tảng COP kết hợp chip điện tử và chip quang tử bằng công nghệ liên kết hỗn hợp. Tất cả các khách hàng lớn như NVIDIA, Broadcom, Ai labs đều đang chuyển sang TSMC. Công ty này không kiếm được nhiều tiền trực tiếp từ CPO, nhưng CPO đã củng cố vị thế thống trị của TSMC trong lĩnh vực đóng gói tiên tiến và sản xuất bán dẫn theo hợp đồng.

Broadcom

Logic của Broadcom khác biệt. Nó giống như:

ASIC chuyển mạch Ethernet + ASIC tùy chỉnh + CPO + hệ sinh thái chip tùy chỉnh của nhà cung cấp đám mây.

Broadcom công bố Tomahawk 6 Davisson vào tháng 10 năm 2025, đây là switch Ethernet CPO thế hệ thứ ba của họ, với dung lượng chuyển mạch 102,4 Tbps và đã bắt đầu giao hàng; Broadcom cho biết sản phẩm này giảm 70% mức tiêu thụ điện của optical interconnect thông qua tích hợp quang engine TSMC COUPE và bao bì đa chip tiên tiến, đồng thời hỗ trợ quy mô scale-up lên đến 512 XPUs và hơn 100.000 XPUs trong mạng hai lớp.

Điều này cho thấy TSMC và Broadcom là những công ty rất quan trọng trong chuỗi giá trị mạng AI và CPO, ngoài NVIDIA.

Lớp thứ hai: Quang học và kết nối tốc độ cao với độ chắc chắn cao

Điều này bao gồm:

Mô-đun quang 1,6T, LPO/NPO, quang silicon, laser, nguồn sáng ngoài, FAU, đầu nối quang.

Các đại diện bao gồm Coherent, Lumentum, Fabrinet, Innolight, Eoptolink, SENKO, Corning, Sumitomo. Danh sách hệ sinh thái chính thức của NVIDIA bao gồm nhiều doanh nghiệp liên quan đến quang học, đóng gói và kết nối.

Điểm trọng tâm của lớp này không phải là “ai giống CPO nhất”, mà là:

Ai có thể đồng thời đáp ứng nhu cầu 800G/1.6T, LPO/NPO, CPO thử nghiệm, nguồn sáng ngoài và FAU?

Các công ty có thể vượt qua các giai đoạn có tỷ lệ thắng cao hơn các công ty chỉ tập trung vào một khái niệm duy nhất.

Cấp độ thứ ba: PCB, ABF, CCL, vật liệu

Đây là những nơi được cho là bị đánh giá thấp nhất vào năm 2026.

Trong bản tường thuật công khai, báo cáo ban đầu đề cập đến hoặc nêu tên các công ty như Chroma, Luxshare, Unimicron, NVIDIA, Broadcom, TSMC, Ibiden.

Trong đây, các công ty trong chuỗi nền tảng/PCB như Unimicron và Ibiden rất đáng chú ý, vì sau khi độ phức tạp của máy chủ AI tăng lên, PCB và nền tảng đóng gói không còn là linh kiện đi kèm, mà trở thành chính yếu tố ràng buộc hiệu suất.

Mức thứ tư: Thiết bị kiểm tra, tỷ lệ sản phẩm đạt yêu cầu, độ tin cậy

Điểm khó nhất của CPO không phải là PPT, mà là sản xuất hàng loạt.

Cần giải quyết:

Tỷ lệ đạt yêu cầu của bộ ghép quang điện;

Độ ổn định của nguồn laser ngoài;

Độ tin cậy trong môi trường nhiệt độ cao;

Ứng suất đóng gói;

Bảo trì trực tiếp;

Thời gian kiểm tra;

Sự nhất quán;

Chế độ bảo trì sau khi hết hạn.

Vì vậy, thiết bị thử nghiệm và xác minh độ tin cậy có thể là những “người bán cuốc” rất tốt.

Những công ty này không nhất thiết phải hấp dẫn nhất, nhưng nếu CPO bước vào giai đoạn sản xuất thử nghiệm, chúng thường là những đơn vị đầu tiên nhận được đơn đặt hàng.

Tám: Ý nghĩa đầu tư của báo cáo này: Đừng mua những tài sản “giống khái niệm nhất”, hãy mua những tài sản “khó tránh khỏi nhất”

Bài báo này mang lại bài học lớn nhất cho đầu tư là:

Kết nối AI không phải là cuộc cách mạng công nghệ điểm đơn, mà là sự dịch chuyển của các điểm nghẽn. Đầu tư nên đặt cược vào các điểm nghẽn chung, chứ không nên đặt cược vào một con đường duy nhất.

Chung bottleneck là gì?

Đó là điều không thể tránh khỏi, bất kể cuối cùng là CPO, LPO, NPO, hay tiếp tục nâng cấp các loại có thể thay thế truyền thống. Ví dụ:

Bo mạch ABF

Ngược lại, so sánh rủi ro đường đơn

Ví dụ bạn chỉ mua “khái niệm CPO thuần túy”, rủi ro là:

Thời gian sản xuất hàng loạt CPO bị hoãn, đơn hàng không được thực hiện, định giá bị giảm mạnh.

Chỉ mua module quang truyền thống, rủi ro là:

CPO/NPO/LPO tái cấu trúc chuỗi giá trị, nguồn lợi nhuận dài hạn bị các nhà sản xuất nền tảng và nhà sản xuất chip/đóng gói chiếm lấy.

Chỉ mua PCB/vật liệu, rủi ro là:

Khách hàng mở rộng sản xuất quá nhanh, nguồn cung tập trung được giải phóng, biên lợi nhuận gộp đảo ngược.

Vì vậy, sự kết hợp tốt hơn là:

Mua tính chắc chắn vào năm 2026, mua độ co giãn đơn hàng vào năm 2027, mua quyền chọn kiến trúc sau năm 2028.

Chín, Đánh giá tính hợp lý của báo cáo này từ góc độ cá nhân

Nơi hợp lý

Đầu tiên, việc mở rộng điểm nghẽn AI từ GPU sang hệ thống kết nối là hướng đi hoàn toàn chính xác. Các sản phẩm của NVIDIA và Broadcom đều đang xác minh điều này.
Thứ hai, phản đối cách kể chuyện đơn giản về “đồng lui, ánh sáng tiến”, nhận định này rất quan trọng. Báo cáo của Reuters về Jensen Huang đã rõ ràng chỉ ra rằng, đồng vẫn có lợi thế về độ tin cậy trong ngắn hạn đối với kết nối lõi GPU/XPU.
Thứ ba, việc cho rằng CPO là hướng đi nhưng cần chờ xác minh độ tin cậy trước khi mở rộng quy mô cũng là một phán đoán hợp lý. Các đánh giá ngành từ LightCounting và Yole/EDN đều thiên về “chuyển đổi từng bước, thay vì thay thế toàn diện ngay lập tức”.
Thứ tư, nhấn mạnh các khâu "tiền kỳ" như PCB/ABF/CCL, kiểm thử, nguồn sáng... dễ dàng hiện thực hóa hơn vào năm 2026, điều này mang lại lợi ích lớn hơn cho đầu tư. Vì thị trường vốn thường giao dịch quá mức với những câu chuyện xa nhất, trong khi đánh giá thấp các khâu đang thực sự nhận đơn hàng trong ngắn hạn.

Những điểm cần lưu ý

Đầu tiên, việc chuyển tải công khai có thể làm “tài chính hóa” và “thu hút sự chú ý quá mức” quan điểm của Bernstein. Ví dụ, câu nói “Trận chiến thực sự của AI không nằm ở chip, mà nằm ở kết nối” có sức lan tỏa, nhưng nếu xét một cách nghiêm túc, GPU/HBM/CoWoS vẫn là những điểm nghẽn cốt lõi; chỉ là tầm quan trọng tương đối của kết nối đang gia tăng, chứ không có nghĩa là chip không còn quan trọng.

Thứ hai, hướng chuyển giao giá trị của CPO là đúng, nhưng tốc độ có thể bị thị trường đánh giá quá cao. CPO cần giải quyết các vấn đề như sản xuất, đóng gói, bảo trì tại chỗ, thay thế khi hỏng hóc và độ tin cậy, không phải là công nghệ có thể ngay lập tức tăng trưởng mạnh sau một buổi ra mắt.

Thứ ba, giá trị chuyển đổi của LPO/NPO rất lớn, nhưng độ khó trong việc gỡ lỗi hệ thống cũng không thấp. LPO không đơn giản chỉ là “bản tiết kiệm năng lượng có thể tháo rời”, mà nó đã chuyển nhiều độ phức tạp sang phía máy chủ và gỡ lỗi cấp hệ thống.

Thứ tư, mặc dù chuỗi PCB/ABF/CCL có độ xác thực cao, nhưng cần cảnh giác với chu kỳ mở rộng sản xuất. Ngành vật liệu và bo mạch nền một khi thấy mức độ sôi động cao, rất dễ mở rộng sản xuất; sau đó, nếu nhịp độ của khách hàng chậm lại, biên lợi nhuận gộp sẽ bị phản tác dụng.

Mười, trong 2–3 năm tới, bạn có thể theo dõi theo lịch trình này

2026: Đừng chỉ nhìn CPO, hãy xem ba yếu tố chắc chắn

Năm 2026, điều quan trọng không phải là CPO bùng nổ, mà là:

Liệu mô-đun quang có thể tháo rời 1,6T có được tăng sản lượng không;

LPO/NPO có nhận được thêm chứng nhận từ các nhà cung cấp đám mây/nền tảng switch không;

PCB/ABF/CCL có tiếp tục tăng giá hay mở rộng sản xuất không;

Các thiết bị kiểm tra liên quan đến CPO, FAU, nguồn sáng ngoài đã có đơn hàng thực tế chưa?

Nếu những điều này xảy ra, điều đó cho thấy logic báo cáo đã bước vào giai đoạn thực hiện.

2027: Xem CPO pilot chuyển từ “mẫu thử” sang “triển khai cho khách hàng”

Các chỉ số chính là:

Việc triển khai thực tế của NVIDIA Quantum-X / Spectrum-X Photonics;

Mở rộng khách hàng của Broadcom Davisson/Tomahawk CPO;

Có đang được sử dụng bởi CoreWeave, Lambda, Meta, Google, Microsoft, Amazon,... không;

CPO, nguồn sáng ngoài, thiết bị kiểm tra có được công nhận doanh thu hay không?

Sau năm 2028: Theo dõi xem CPO có bước vào giai đoạn Scale-up hay không

Điểm chuyển biến quan trọng nhất là:

CPO có đang di chuyển từ phía switch đến gần XPU/GPU không;

Liệu I/O quang có đang được tích hợp vào bao bì ASIC/GPU cao cấp không;

OCS/optical fabric có đang thay đổi kiến trúc mạng trung tâm dữ liệu không?

Nếu đến bước này, CPO không chỉ là sự thay thế các mô-đun quang học, mà còn là sự thay đổi trong kiến trúc tính toán AI.

Mười một: Khung đầu tư dựa trên báo cáo này: bốn loại tài sản, bốn logic

Nếu sử dụng báo cáo này để hướng dẫn đầu tư vào thị trường chứng khoán Mỹ/Hồng Kông/Trung Quốc, tôi sẽ chia thành bốn loại.

Bo mạch ABF

Chiến lược mà tôi tin tưởng nhất là:

Mua nền tảng kho chính, mua linh hoạt vào quang học và PCB với tính xác thực cao, mua tỷ lệ nhỏ quyền chọn vào hướng dài hạn của CPO.

Không nên ngay từ đầu đặt toàn bộ vốn vào cổ phiếu có khái niệm CPO thuần túy nhất.

十二、Báo cáo này có năm điểm chính cốt lõi nhất

Đầu tiên, điểm nghẽn của trung tâm dữ liệu AI đang chuyển từ "tính nhanh" sang "kết nối nhanh, kết nối ổn định và tiết kiệm điện".
Thứ hai, ánh sáng sẽ không tiêu diệt đồng ngay lập tức, và đồng cũng không thể giữ vững mọi tình huống; các giải pháp khác nhau sẽ được lựa chọn tùy theo khoảng cách và cấp độ hệ thống.
Thứ ba, CPO là hướng đi, nhưng doanh thu thực tế hơn vào năm 2026 nằm ở 1,6T, LPO/NPO, nguồn sáng, kiểm tra, PCB, ABF, CCL.
Thứ tư, tác động thực sự của CPO không phải là làm cho các mô-đun quang trở nên rẻ hơn, mà là chuyển dịch lợi nhuận từ việc đóng gói mô-đun truyền thống sang chip, đóng gói, động cơ quang, nguồn sáng, kiểm tra và nền tảng hệ thống.
Thứ năm, đầu tư vào các kết nối AI, đừng mua các khái niệm nóng nhất, hãy mua những điểm nghẽn khó tránh khỏi nhất.
Đây là một báo cáo rất có giá trị về “cơ sở hạ tầng lớp hai AI”. Nó nhắc nhở thị trường: sau GPU, yếu tố tiếp theo được định giá lại không phải là một bộ phận riêng lẻ, mà là toàn bộ stack kết nối AI.

Nhưng nó cũng không thể được hiểu đơn giản là “CPO bùng nổ ngay lập tức”. Cách đọc chính xác hơn là:

Năm 2026: Xem xét các yếu tố có thể tháo rời/LPO/NPO/PCB/ABF/kiểm tra;

Xem xét đơn hàng thí điểm CPO vào năm 2027;

Sau năm 2028, hãy theo dõi xem CPO và quang I/O có thực sự trở thành kiến trúc lõi trong tính toán AI hay không.