Tác giả bài viết: Hồ Huyên Phong, Giám đốc Kinh doanh Tài sản Số của Fosun Wealth, CMO của FinChain, Tổng giám đốc Viện Nghiên cứu Ứng dụng và Đầu tư Blockchain Hồng Kông, Phó giám đốc Trung tâm Hỗ trợ Ngành Công nghiệp Blockchain Trường Tam Giang
Cảnh báo rủi ro: Bài viết này không phải là lời khuyên mua bán chứng khoán nào, cũng không đưa ra phán đoán chắc chắn về giá cổ phiếu của bất kỳ ngành hay công ty nào. Các thuật ngữ như “cơ hội”, “đánh giá lại”, “bản đồ tài sản” trong bài đều chỉ các hướng mà ngành công nghiệp và thị trường vốn có thể quan tâm. Việc đầu tư thực sự vẫn cần dựa trên việc tự đánh giá độc lập về định giá, hiệu quả hoạt động, đơn hàng, cấu trúc cạnh tranh, chất lượng tài chính và khả năng chịu rủi ro.
Mở đầu: Ai sẽ là module quang tiếp theo
Sau khi các mô-đun quang tăng gấp mười lần, nhiều người cảm thấy mình đã bỏ lỡ cơ hội tốt nhất trong chuỗi công nghiệp AI. Những công ty phía trên như Zhongji Guangxun, Xinyisheng, Tianfu Communications và Yuanjie Technology đã trở thành chủ đề nổi bật nhất trên thị trường vốn trong năm qua. Đặc biệt, Yuanjie Technology từng có mức giá cổ phiếu trong phiên giao dịch vào tháng 4 năm 2026 vượt quá Kweichow Moutai, trở thành đại diện mới của các cổ phiếu giá cao trên thị trường A. Chính sự kiện này cho thấy phần cứng tính toán AI đã từ một chủ đề công nghệ trở thành một sự kiện định giá thực sự trên thị trường vốn. [1]
Nhưng điều tôi thực sự muốn thảo luận là “Người tiếp theo sẽ là module quang nào?”, vấn đề mà mọi người quan tâm nhất.
Để tìm ra câu trả lời này, chúng ta không thể nhìn ở bề mặt mà phải hiểu được logic cốt lõi: trong mỗi cuộc cách mạng công nghiệp, thị trường vốn có thể định giá cao những công ty kể chuyện hay, nhưng điều đó không bền vững; những công ty thực sự được thị trường vốn định giá lâu dài thường là những công ty chiếm giữ các rào cản mới.
Người kiểm soát nút thắt mới sẽ có quyền định giá mới; chỉ khi sở hữu quyền định giá mới, mới có thể được định giá lại. Làn sóng tăng giá của mô-đun quang về bản chất không phải do thị trường đột nhiên yêu thích viễn thông quang, mà do các trung tâm dữ liệu AI đã đẩy nút thắt “kết nối tốc độ cao” lên hàng đầu.
Một, AI là một cuộc cách mạng hạ tầng thông tin mới
Hôm nay, nhiều người nhìn vào AI vẫn dùng tư duy chủ đề: ChatGPT nổi lên, nên đầu cơ định giá mô hình lớn; NVIDIA tăng giá, nên đầu cơ GPU; module quang tăng giá, thì tất cả đều chạy theo module quang; ứng dụng chưa kiếm được tiền quy mô lớn, đã nói AI là bong bóng.
Quan điểm này quá ngắn hạn, dễ dẫn đến việc chạy theo thứ gì thì bị kẹt ở thứ đó. Điều thực sự nên làm là phân tích sâu sắc tại sao các mô-đun quang lại được giới đầu tư công nhận, và có quy luật nào có thể khám phá.
AI là một cuộc cách mạng hạ tầng thông tin mới. Nó đang tái định nghĩa cách thức sản xuất, truyền tải, xử lý và chuyển đổi giá trị thông tin, giống như điện báo, điện thoại và internet di động.
Gần đây, tôi đang viết cuốn sách mới có tựa đề “Kinh tế Token: Con đường phát triển mới trong thời đại trí tuệ”, sau khi nghiên cứu sâu, tôi phát hiện rằng mỗi cuộc cách mạng thông tin đều tạo ra một đơn vị định giá thương mại mới.
Thời đại điện báo, đơn vị quan trọng nhất là “chữ”; thời đại điện thoại, đơn vị quan trọng nhất là “phút”; thời đại internet di động, đơn vị quan trọng nhất là “dữ liệu”; thời đại AI, đơn vị quan trọng nhất chính là Token, hay còn gọi là từ nguyên.
Token, về bề ngoài là đơn vị nhỏ nhất mà AI xử lý thông tin, nhưng đằng sau nó là chi phí tổng hợp của năng lực tính toán, điện năng, bộ nhớ GPU, lưu trữ, mạng, kiến trúc mô hình và hiệu suất suy luận. Khi bạn đặt câu hỏi cho AI, bạn sẽ tiêu tốn token; khi doanh nghiệp cho Agent thực hiện một quy trình, cũng sẽ tiêu tốn token. Trong tương lai, khi AI thâm nhập vào các lĩnh vực như dịch vụ khách hàng, nghiên cứu đầu tư, thiết kế, lập trình, giáo dục, y tế, tài chính và sản xuất, mỗi lần thực hiện nhiệm vụ đều sẽ đi kèm chi phí token thực tế.
Vì vậy, việc phân phối của cải dài hạn trong chuỗi công nghiệp AI không thể chỉ nhìn vào ai có thể bán GPU. Điều thực sự quan trọng là bốn điều này: ai có thể sản xuất token, ai có thể giảm chi phí token, ai có thể điều phối token, và ai có thể biến token thành kết quả mà người dùng sẵn sàng trả tiền.
Hai, lịch sử không phải là bối cảnh, mà là quy tắc phân bổ ngành công nghiệp
Để hiểu được tương lai của AI, trước tiên phải hiểu được lịch sử ngành công nghiệp thông tin trong hơn một thế kỷ qua.
Telegram, điện thoại, internet, về bề ngoài là ba ngành công nghiệp khác nhau, nhưng về cơ bản đều lặp lại cùng một kịch bản: khi đơn vị mới vừa xuất hiện, giá rất cao, cơ sở hạ tầng kiếm tiền trước; khi chi phí trên mỗi đơn vị giảm xuống, tầng hiệu suất tiếp quản; cuối cùng, tầng入口 tái phân phối giá trị thương mại.
Cảnh đầu tiên là thời đại điện báo.
Năm 1866, cáp quang xuyên Đại Tây Dương chính thức được đưa vào sử dụng, việc truyền tin giữa châu Âu và Bắc Mỹ đã giảm từ mức tính theo tuần xuống còn tính theo phút. Tuy nhiên, ban đầu điện báo rất đắt, mỗi từ mất 10 đô la, gửi tối thiểu 10 từ. Một tin điện xuyên đại dương ngắn nhất tương đương với khoảng mười tuần lương của người lao động lành nghề thời đó. [2]
Lúc này, những người kiếm được tiền đầu tiên là những người lắp đặt cáp quang dưới đáy biển, những người kiểm soát mạng lưới điện tín xuyên quốc gia. Vì họ nắm giữ con đường cao tốc thông tin toàn cầu về tài chính, thương mại, hàng hải và ngoại giao thời bấy giờ.
Nhưng nếu một từ quá đắt, nó sẽ buộc phải phát sinh các kỹ thuật nén. Các thương nhân bắt đầu sử dụng mã điện báo và sách mật mã thương mại. Một từ không còn chỉ là một từ, mà có thể đại diện cho cả một câu, một lệnh giao dịch, một thông số hàng hóa. Ngày nay, chúng ta nói về nén mô hình AI, lượng tử hóa và giải mã suy luận, nghe có vẻ rất tiên tiến, nhưng logic cốt lõi không mới. Con người đã làm cùng một việc này từ thời điện báo: cùng một thông tin, liệu có thể truyền đi bằng ít đơn vị tính giá hơn không?
Sau đó, các lối vào xuất hiện. Reuters là một ví dụ điển hình. Năm 1850, Paul Julius Reuter sử dụng 45 con chim bồ câu để truyền tải giá cổ phiếu và tin tức giữa Brussels và Aachen, nhanh hơn đường sắt khoảng 6 giờ; sau khi cáp dưới biển Channel được lắp đặt, ông nhanh chóng kết nối vào mạng điện báo để bán thông tin tài chính, tin tức thương mại và tình hình thị trường cho các ngân hàng, báo chí và thương nhân. [3]
Điểm mạnh của Reuters không phải là họ đã kéo cáp, mà là họ biết thông tin nào quan trọng và biết ai sẵn sàng trả tiền để nhận thông tin nhanh hơn. Các công ty điện báo kiếm tiền từ phí truyền tải ký tự, trong khi Reuters kiếm tiền từ quyền phân phối thông tin. Một bên kiếm tiền từ kênh truyền, một bên kiếm tiền từ giá trị thông tin.
Hồi thứ hai, là thời đại điện thoại.
Đơn vị tính phí thời kỳ điện thoại trở thành phút. Năm 1915, trong giai đoạn đầu tiên của việc thương mại hóa cuộc gọi liên lục địa tại Mỹ, ba phút đầu tiên từ New York đến San Francisco có phí khoảng 20,70 đô la Mỹ, tương đương hàng trăm đô la Mỹ ngày nay. [4] Những người chiến thắng đầu tiên tự nhiên là AT&T. Mạng điện thoại có đặc tính độc quyền vật lý mạnh mẽ, với các đường dây, thiết bị chuyển mạch, trạm lặp và người dùng cuối cùng tạo thành một mạng lưới khổng lồ.
Tuy nhiên, sau đó, các thiết bị chuyển đổi tự động, bộ khuếch đại tín hiệu và nâng cấp thiết bị truyền thông đã khiến chi phí mỗi phút gọi điện liên tục giảm xuống. Thị trường vốn bắt đầu đánh giá lại các công ty sản xuất thiết bị nâng cao hiệu quả hệ thống. Sau đó nữa, các trang vàng xuất hiện trên mạng điện thoại. Trang vàng không thu phí gọi điện, mà thu phí từ các doanh nghiệp để hiển thị thông tin. Người dùng tìm doanh nghiệp, doanh nghiệp muốn được người dùng tìm thấy, từ đó hình thành một cổng thương mại.
Hồi thứ ba là thời đại điện thoại di động và internet.
Trong thời kỳ đầu của truyền thông không dây, các nhà xây dựng hạ tầng là những người có giá trị nhất. Sau đó, các nhà cung cấp dịch vụ viễn thông kiểm soát số điện thoại, mạng lưới, gói dịch vụ và hệ thống tính phí, trở nên cực kỳ nóng bỏng; tin nhắn, cuộc gọi và dữ liệu đều được tính phí theo mức sử dụng. Internet, dựa trên hạ tầng mạng có dây và không dây, đã giảm đáng kể chi phí và nâng cao hiệu quả thực thi, mở ra thời đại lưu lượng. Khi chi phí đơn vị lưu lượng giảm nhanh chóng, hạ tầng không còn được định giá cao, mà các doanh nghiệp kiểm soát cổng vào người dùng ngày càng trở nên có giá trị, từ đó hình thành nên những đế chế nền tảng Internet. WeChat, Taobao, Meituan, Douyin, Xiaohongshu và Pinduoduo đã nắm giữ thời gian, giao dịch và quyết định tiêu dùng của người dùng.
Nhà cung cấp dịch vụ kiểm soát các byte, còn các nền tảng internet kiểm soát ý định kinh doanh bên trong các byte đó. Đây là quy luật được ba thế hệ ngành công nghiệp thông tin cùng diễn giải: cơ sở hạ tầng tăng trưởng trước, lớp hiệu suất tiếp nối, và lớp入口 cuối cùng phân phối giá trị cao hơn. AI hiện đang ở vị trí then chốt trong quá trình chuyển tiếp từ giai đoạn đầu sang giai đoạn hai và ba.
Ba, tại sao đợt đầu tiên lại tập trung vào GPU, HBM và module quang?
Hai năm qua, đợt sóng đầu tiên của AI tăng trước tiên ở NVIDIA, bộ nhớ và module quang là điều không hề lạ, vì giai đoạn đầu của AI là huấn luyện mô hình lớn và xây dựng cụm tính toán.
Việc huấn luyện mô hình lớn đòi hỏi lượng lớn GPU; GPU cần bộ nhớ băng thông cao, tức là HBM; để nhiều GPU hoạt động phối hợp, cần kết nối tốc độ cao, bao gồm module quang, chip chuyển mạch, PCB, đầu nối và thiết bị mạng. Trung tâm dữ liệu truyền thống giống như một nhóm máy chủ xử lý nhiều tác vụ thông thường, trong khi trung tâm dữ liệu AI giống như một siêu máy tính khổng lồ. Hàng chục nghìn, hàng trăm nghìn GPU phải hoạt động như một thể thống nhất; bất kỳ khâu nào trong số đó chậm lại đều sẽ làm chậm toàn bộ hệ thống.
GPU rất đắt, nếu mạng không đủ nhanh, GPU sẽ phải chờ dữ liệu. Khi GPU chờ dữ liệu, tức là tài sản đắt tiền đang chạy rỗng. Vì vậy, sự tăng trưởng của module quang học có nền tảng công nghiệp; HBM tăng, thị trường vốn đang mua những điểm nghẽn thực sự trong chuỗi ngành.
Nhưng thị trường sẽ không mãi chỉ tập trung vào những điểm nghẽn đầu tiên. Khi các khâu rõ ràng như GPU, HBM, module quang đã được thảo luận đầy đủ, vấn đề sẽ tiếp tục được đẩy xa hơn: Sau khi xây dựng xong năng lực tính toán, làm thế nào để vận hành ổn định? Làm thế nào để vận hành rẻ hơn? Làm thế nào để tích hợp vào quy trình doanh nghiệp? Và làm thế nào để biến thành những kết quả mà người dùng sẵn sàng trả tiền?
Bốn: Rào cản tiếp theo trong phát triển AI: điện năng, làm mát bằng chất lỏng và bất động sản công nghiệp tính toán
Đường đi rõ ràng nhất tiếp theo, theo tôi, là điện lực và làm mát bằng chất lỏng. Lý do rất đơn giản: các trung tâm dữ liệu AI đang chuyển từ “kinh doanh phòng máy” thành “kinh doanh năng lượng”.
Trước đây, mọi người hiểu trung tâm dữ liệu đơn giản là một tòa nhà chứa nhiều máy chủ. Nhưng trung tâm dữ liệu AI không như vậy. Những ràng buộc cốt lõi của trung tâm dữ liệu AI hiện đang trở thành khả năng kết nối điện, mật độ công suất tủ, khả năng làm mát, điều phối năng lượng và giao nhận hạ tầng. Khi giới thiệu GB200 NVL72, NVIDIA nhấn mạnh rằng nó kết nối 36 CPU Grace và 72 GPU Blackwell trong một thiết kế quy mô rack, làm mát bằng chất lỏng—tức là hệ thống làm mát bằng chất lỏng toàn tủ. [5]
Điều này có nghĩa là cạnh tranh trong lĩnh vực AI đã không còn là cuộc đua của từng chiếc GPU đơn lẻ, mà là cuộc cạnh tranh hệ thống trên quy mô cả tủ, cả phòng máy và cả trung tâm dữ liệu. Trong tương lai, mật độ công suất của tủ sẽ tiếp tục được nâng lên mức hàng chục kilowatt và thậm chí cả trăm kilowatt; làm mát bằng chất lỏng và cấp điện không còn là các yếu tố hỗ trợ phía sau, mà trở thành điều kiện tiên quyết trong việc triển khai năng lực tính toán.
Quan trọng hơn cả là điện năng. Theo báo cáo Energy and AI của Cơ quan Năng lượng Quốc tế, lượng điện tiêu thụ của các trung tâm dữ liệu toàn cầu đến năm 2030 sẽ gần như tăng gấp đôi, đạt khoảng 945 TWh, chiếm gần nhưng dưới 3% tổng lượng điện tiêu thụ toàn cầu; trong đó AI là một trong những động lực tăng trưởng quan trọng nhất. [6]
GPU có thể đặt hàng, mô-đun quang có thể mở rộng sản xuất, máy chủ có thể lắp ráp, nhưng lưới điện, trạm biến áp, đường dây truyền tải, nguồn điện dự phòng, hệ thống làm mát không thể xuất hiện một cách kỳ diệu trong vài tháng. AI càng mạnh, mức tiêu thụ điện càng cao; mật độ tính toán càng cao, nhiệt sinh ra càng lớn; trung tâm dữ liệu càng tập trung, yêu cầu về điện năng và làm mát càng cực đoan.
Vì vậy, máy biến áp, UPS, tủ phân phối, nguồn cấp điện chuyển đổi, đường ray dẫn điện, hệ thống điện trung tâm dữ liệu, tấm làm mát lỏng, CDU, bơm và van, thiết bị trao đổi nhiệt, giải pháp làm mát lỏng toàn bộ tủ, và tổng thầu cơ sở hạ tầng trung tâm dữ liệu sẽ được định giá lại. Trước đây, tất cả những sản phẩm này đều được xem là thuộc ngành sản xuất truyền thống, nhưng sau khi AI xuất hiện, chúng đã trở thành điều kiện tiên quyết để cung cấp năng lực tính toán.
Tiếp tục suy luận một bước nữa, trung tâm dữ liệu AI sẽ chuyển từ IDC truyền thống thành một loại bất động sản công nghiệp mới. IDC truyền thống đánh giá dựa trên số lượng tủ máy, tỷ lệ lắp đặt, PUE, tiền thuê và khách hàng; trong khi trung tâm dữ liệu AI lại xem xét các chỉ số điện năng, trạm biến áp, hợp đồng năng lượng dài hạn, khả năng làm mát bằng chất lỏng, kết nối mạng tốc độ cao, hợp đồng dài hạn với khách hàng lớn, năng lực vận hành cụm GPU và không gian mở rộng đất đai.
Đây đã không còn là một ngành kinh doanh đơn thuần “xây nhà cao tầng đặt máy chủ”. Nó giống như các trạm đường sắt thời kỳ đường sắt, bến cảng thời kỳ hàng hải, sân bay thời kỳ hàng không, hay trung tâm giao thông thời kỳ cao tốc. Công ty trung tâm dữ liệu AI tốt nhất trong tương lai không chỉ cho thuê phòng máy mà còn có thể tổ hợp đất đai, điện năng, làm mát, mạng lưới, chip và hợp đồng dài hạn với khách hàng thành một tài sản hạ tầng có dòng tiền, rào cản và tính khan hiếm.
Đường dây này còn có một sự thay đổi tiếp theo: tài sản trung tâm dữ liệu được tài chính hóa. Một khi trung tâm dữ liệu AI tạo ra dòng tiền ổn định, nó có thể được chuyển thành REITs, RWA, quỹ cơ sở hạ tầng, sản phẩm quyền thu nhập và tài sản cho thuê dài hạn. Trong thời đại điện toán đám mây trước đây, trung tâm dữ liệu là tài sản hậu trường của các nhà cung cấp đám mây; trong thời đại AI, trung tâm dữ liệu sẽ được định giá lại là “bất động sản công nghiệp tính toán”.
Năm, sau khi huấn luyện, là cuộc chiến về chi phí suy luận
Hiện nay, nhiều người cho rằng NVIDIA quá mạnh, nên cơ hội trong lĩnh vực chip AI đã bị NVIDIA chiếm hết. Phán đoán này chỉ đúng một nửa.
Trong giai đoạn huấn luyện mô hình lớn, lợi thế của NVIDIA rất mạnh mẽ. Không chỉ GPU mạnh, mà cả CUDA, hệ sinh thái nhà phát triển, hệ thống mạng, giải pháp toàn bộ máy và chuỗi công cụ phần mềm đều vượt trội. Tuy nhiên, khi AI bước vào giai đoạn suy luận quy mô lớn, logic sẽ thay đổi. Trong giai đoạn huấn luyện, điều quan trọng nhất là tạo ra mô hình; trong giai đoạn suy luận, điều quan trọng nhất là để mô hình phục vụ hàng triệu người dùng mỗi ngày. Huấn luyện giống như chi phí vốn, trong khi suy luận giống như chi phí hoạt động.
Khi AI được áp dụng vào dịch vụ khách hàng, văn phòng, lập trình, tài chính, giáo dục, y tế và sản xuất, mỗi ngày đều tạo ra lượng gọi vô cùng lớn. Lúc này, mọi người nhận ra rằng logic kinh tế của token khác với logic kinh tế lưu lượng truy cập: trong kinh tế lưu lượng truy cập, chi phí biên giảm dần, do đó có thể thu hút quy mô người dùng lớn trước rồi mới xem xét doanh thu, vì chi phí mạng thêm một người dùng ngày càng giảm. Nhưng logic kinh tế của token lại khác biệt: điều này khiến các công ty mô hình lớn và nhà cung cấp đám mây cảm nhận được chi phí kinh tế hoàn toàn khác biệt — chi phí biên của nó không thay đổi hoặc thậm chí tăng lên. Việc huấn luyện là đầu tư một lần với lợi ích dài hạn, nhưng suy luận thì không phải. Nếu mỗi lần phục vụ một người dùng bằng AI đều lỗ, thì khi một tác vụ được gọi hàng chục triệu, hàng trăm triệu lần mỗi ngày, bất kỳ công ty nào cũng không thể chịu nổi. Đó là lý do ngay cả mô hình lớn DouBao của ByteDance cũng phải bắt đầu thu phí.
Lúc này, cơ hội mới xuất hiện, mọi người sẽ suy nghĩ về cách giảm chi phí. Tại sao tất cả các nhiệm vụ đều phải sử dụng GPU phổ thông đắt nhất? Liệu có thể sử dụng chip chuyên dụng không? Liệu có thể sử dụng ASIC tiêu thụ ít năng lượng hơn, thông lượng cao hơn và phù hợp hơn với các kịch bản cố định không?
Đó là lý do các trường hợp như Broadcom, AMD, Google TPU đáng được quan tâm.
Reuters báo cáo rằng Broadcom dự kiến đến năm 2027, cơ hội doanh thu từ chip AI tùy chỉnh có thể vượt quá 100 tỷ USD, nhờ nhu cầu ngày càng tăng mạnh từ các công ty công nghệ lớn đối với chip AI tùy chỉnh. [7] AMD tiết lộ trong báo cáo năm 2024 rằng doanh thu hàng năm từ lĩnh vực AI trung tâm dữ liệu của họ đã vượt quá 5 tỷ USD, với các khách hàng như Meta, Microsoft, Oracle đang triển khai quy mô lớn bộ tăng tốc AMD Instinct MI300. [8] Google Cloud nhấn mạnh TPU v5e hướng đến hiệu quả chi phí, có thể cung cấp lượng truy vấn cao hơn với cùng một chi phí. [9]
Vì vậy, tương lai của chip AI sẽ không chỉ có một hình thái duy nhất. NVIDIA sẽ tiếp tục mạnh mẽ, nhưng các nhà cung cấp đám mây sẽ tự phát triển chip, ASIC tùy chỉnh, chip tăng tốc suy luận và chip AI biên, mỗi loại đều sẽ chiếm được vị trí riêng của mình. Đây không phải là sự thay thế đơn giản NVIDIA, mà là chia sẻ một phần lợi nhuận trong thời kỳ suy luận. Khi AI chuyển từ thời kỳ huấn luyện sang thời kỳ suy luận, tối ưu hóa chi phí sẽ trở thành quyền định giá mới.
Sáu, sau module quang là toàn bộ mạng AI
Nhiều người cho rằng module quang đã tăng hết mức, do đó đợt thị trường AI đã kết thúc. Tôi không nghĩ vậy. Module quang chỉ là lớp đầu tiên rõ ràng trong mạng AI. Sau đó còn có chip chuyển mạch, switch, DPU, SmartNIC, CPO, quang học silicon, điều phối cụm và hệ điều hành mạng.
Bản chất của trung tâm dữ liệu AI là kết nối hàng loạt GPU thành một siêu máy tính. Tài sản đắt nhất ở đây là GPU, và điều không thể chấp nhận nhất là GPU bị chờ đợi vô ích. Nếu độ trễ mạng cao, GPU sẽ chờ dữ liệu; nếu hiệu suất trao đổi thấp, GPU sẽ chờ dữ liệu; nếu kiến trúc truyền thông không tốt, GPU vẫn sẽ chờ dữ liệu.
Vì vậy, giá trị của mạng AI không chỉ là truyền dữ liệu, mà còn là tăng cường hiệu suất sử dụng của toàn bộ cụm GPU. Trong trung tâm dữ liệu internet thông thường, nếu mạng chậm hơn một chút, người dùng chỉ bị tải chậm; nhưng trong trung tâm dữ liệu AI, nếu mạng chậm hơn một chút, có thể dẫn đến giảm hiệu suất sử dụng của các thiết bị trị giá hàng trăm triệu đến hàng tỷ đô la.
NVIDIA's Quantum-X800 InfiniBand platform is designed for end-to-end 800 Gb/s networking to serve AI models with trillions of parameters; Spectrum-X Ethernet emphasizes enhancing AI network performance and supporting scalable GPU clusters. [10] TrendForce also notes that demand for 800G and higher optical transceivers in AI server cluster interconnects is rising rapidly, and the market size for AI optical transceivers is expected to continue expanding. [11]
Vì vậy, mạng AI trong tương lai sẽ tiếp tục được nâng cấp: từ 400G lên 800G, rồi đến 1.6T; từ mô-đun quang truyền thống sang CPO; từ chuyển mạch điện tử sang tích hợp điện-quang; từ mạng thông thường sang AI fabric; từ thiết bị đơn lẻ sang điều phối toàn bộ cụm. Thị trường vốn trong thời gian tới sẽ không chỉ tập trung vào lĩnh vực mô-đun quang, mà sẽ xem xét ai có thể tăng hiệu quả kết nối cụm AI, ai có thể giảm thời gian chờ GPU, và ai có thể làm cho các cụm hàng vạn, hàng chục vạn GPU trở nên ổn định hơn.
Bảy, sau khi token trở nên rẻ hơn, người vào sẽ thay đổi
Việc ứng dụng quy mô lớn thực sự trong thời đại AI phụ thuộc vào việc chi phí token có thể tiếp tục giảm hay không. Token càng đắt, AI càng khó được phổ biến; token càng rẻ, AI càng dễ dàng thâm nhập vào các quy trình doanh nghiệp và cuộc sống hàng ngày.
The Stanford 2025 AI Index report shows that the cost of querying models reaching GPT-3.5 level dropped from approximately $20 per million tokens in November 2022 to about $0.07 in October 2024, a decline of over 280 times in roughly 18 months; the rate of price reduction for LLM inference varies significantly across different tasks, ranging from 9-fold to 900-fold per year. [12]
Dữ liệu này cho thấy lực giảm phát dài hạn thực sự của ngành AI đã bắt đầu xuất hiện. Ai có thể thực hiện cùng một nhiệm vụ với ít token hơn, ít bộ nhớ GPU hơn, ít điện năng hơn và thời gian suy luận ngắn hơn, người đó mới có giá trị.
Các công ty này, tôi gọi là phe nén token.
Chúng có thể là các công ty mô hình, nền tảng suy luận, công ty chip, nhà cung cấp đám mây hoặc công ty cơ sở hạ tầng AI doanh nghiệp. Điều quan trọng không phải là chúng gọi là gì, mà là chúng có thể giảm chi phí cho cùng một nhiệm vụ, rút ngắn chuỗi suy luận, giảm thiểu các cuộc gọi vô ích và đạt được kết quả ổn định hơn hay không.
Có vài loại công nghệ quan trọng ở đây: MoE, định lượng, chưng cất, bộ nhớ đệm, giải mã suy đoán và định tuyến mô hình. Đặc biệt, định tuyến mô hình không phải lúc nào cũng cần gọi đến mô hình đắt nhất. Các hệ thống AI trưởng thành sẽ tự động chọn mô hình và đường đi phù hợp nhất dựa trên độ khó của nhiệm vụ, ngân sách chi phí, yêu cầu về tốc độ, yêu cầu về bảo mật và yêu cầu về độ chính xác. Tuy nhiên, định tuyến mô hình cũng dễ bị ảnh hưởng bởi các công ty lớn, và lợi thế cạnh tranh của nó không vững chắc.
Sau khi chi phí được giảm xuống, vấn đề về điểm vào sẽ trở nên quan trọng hơn. Nhiều người cho rằng điểm vào thời đại AI sẽ là một nền tảng điều phối mô hình, giống như Meituan của thời đại AI. So sánh này có lý, nhưng chưa đủ sâu sắc. Điểm vào AI thực sự có thể không phải là một nền tảng giúp bạn lựa chọn mô hình, mà có khả năng cao hơn là một hệ thống được tích hợp vào quy trình làm việc.
Người dùng thông thường không tự nguyện mở nền tảng điều phối mô hình mỗi ngày. Người dùng doanh nghiệp cũng không gọi mô hình chỉ để gọi mô hình. Người dùng cần hoàn thành nhiệm vụ, doanh nghiệp cần nâng cao hiệu quả quy trình, nhân viên cần kết quả công việc. AI cuối cùng sẽ được tích hợp vào Office, Feishu, DingTalk, WeCom, ERP, CRM, trình soạn thảo mã, trình duyệt, email, tìm kiếm, hệ thống kế toán, hệ thống hỗ trợ khách hàng và hệ thống giao dịch. Ai kiểm soát luồng công việc, người đó kiểm soát quyền gọi AI.
Microsoft trong báo cáo năm 2025 tiết lộ, tổng số người dùng hoạt động hàng tháng của gia đình sản phẩm Copilot trên cả nền tảng doanh nghiệp và người tiêu dùng đã vượt quá 100 triệu, đồng thời tích hợp sâu hơn Microsoft 365 Copilot vào các quy trình làm việc. [13] Điều này cho thấy, cổng vào AI không nhất thiết phải là một ứng dụng riêng lẻ, mà có thể là lớp thông minh được tích hợp vào quy trình làm việc hiện có.
Cửa vào của lập trình viên có thể là trình soạn thảo mã và nền tảng lưu trữ mã; cửa vào văn phòng có thể là Microsoft 365, Google Workspace, Feishu, DingTalk; cửa vào kinh doanh doanh nghiệp có thể là ERP, CRM, hệ thống kế toán; cửa vào cá nhân có thể là hệ điều hành điện thoại, trình duyệt, thanh tìm kiếm, kính thông minh. Cửa vào thực sự trong thời đại AI không phải là danh sách mô hình, mà là cửa vào quy trình làm việc.
Tám, điều khó thực sự của AI doanh nghiệp là tích hợp vào quy trình
Để AI trở thành điểm vào của quy trình làm việc, còn một điều kiện tiên quyết: nó phải thâm nhập vào quy trình thực tế của doanh nghiệp. Điều khó nhất đối với AI doanh nghiệp không phải là kết nối một chatbot, mà là liệu mô hình có thể an toàn truy cập dữ liệu doanh nghiệp, hiểu được quy trình kinh doanh, gọi được các hệ thống, ghi lại nhật ký, chấp nhận kiểm toán và kết hợp với cơ chế phê duyệt của con người hay không.
Hôm nay, nhiều doanh nghiệp sử dụng AI vẫn chỉ dừng ở mức nhân viên tự hỏi, tự viết và tự tóm tắt. Điều này có thể nâng cao hiệu suất cá nhân, nhưng không thực sự thay đổi cấu trúc tổ chức. AI doanh nghiệp thực sự là khi Agent được tích hợp vào quy trình.
Agent hỗ trợ khách hàng không chỉ trả lời câu hỏi, mà còn phải tra cứu đơn hàng, xem tình trạng vận chuyển, đánh giá điều kiện hoàn tiền và kích hoạt hệ thống hậu mãi; Agent tài chính không chỉ lập báo cáo, mà còn phải đọc chứng từ, đối chiếu tài khoản, phát hiện bất thường và tạo ý kiến phê duyệt; Agent đầu tư và nghiên cứu không chỉ tóm tắt tin tức, mà còn phải thu thập dữ liệu, xây dựng mô hình, so sánh các công ty và theo dõi rủi ro; Agent pháp lý không chỉ soạn hợp đồng, mà còn phải tra cứu điều khoản, nhận diện rủi ro, liên kết các vụ việc và lưu lại lịch sử chỉnh sửa.
Đằng sau điều này là một hệ thống hạ tầng hoàn chỉnh: cơ sở dữ liệu, tìm kiếm vector, quản lý quyền truy cập, quản trị dữ liệu, tích hợp hệ thống, động cơ quy trình làm việc, nhật ký kiểm toán, tuân thủ an toàn, kho tri thức doanh nghiệp, nền tảng sắp xếp Agent. Những thứ này nghe có vẻ không hấp dẫn bằng mô hình lớn, nhưng chúng là nền tảng thực sự để AI triển khai thành công trong doanh nghiệp. Đồng tiền đầu tiên mà doanh nghiệp nên chi để triển khai AI không phải là để mua một con tôm hùm thực hiện những nhiệm vụ hoa mỹ, mà là để mua an toàn, mua dữ liệu, mua quyền truy cập, mua quy trình, mua tích hợp và mua tuân thủ.
Ở đây còn ẩn chứa một thay đổi lớn hơn: Tiền thật sự trong các ứng dụng AI không nhất thiết đến từ ngân sách phần mềm, mà có thể đến từ ngân sách nhân sự. SaaS bán công cụ, AI Agent bán kết quả. Công cụ cần người vận hành, trong khi Agent tự thực hiện nhiệm vụ.
Một hệ thống hỗ trợ khách hàng bằng AI, nếu chỉ bán phần mềm, thì giới hạn là thị trường phần mềm hỗ trợ khách hàng; nhưng nếu nó thực sự thay thế một lượng lớn nhân viên hỗ trợ khách hàng, thì giới hạn sẽ là chi phí outsourcing hỗ trợ khách hàng và chi phí nhân sự hỗ trợ khách hàng của doanh nghiệp. Một hệ thống pháp lý bằng AI, nếu chỉ bán công cụ tài liệu, thì giới hạn sẽ bị hạn chế; nhưng nếu nó có thể thay thế luật sư cấp sơ cấp, xem xét hợp đồng và tổng hợp kiểm tra due diligence, thì giới hạn sẽ là kho chi phí dịch vụ pháp lý.
Harvey là một trường hợp AI pháp lý đáng để theo dõi. Theo TIME năm 2025, Harvey có định giá khoảng 5 tỷ USD, sở hữu hơn 300 khách hàng, phủ sóng 53 quốc gia và hiện diện trong bảy trong số mười văn phòng luật sư có doanh thu cao nhất tại Hoa Kỳ. [14] Điều này cho thấy, ứng dụng AI trong các bối cảnh công việc tri thức giá trị cao không đơn thuần là thay thế công cụ, mà đang xâm nhập vào nguồn chi phí lao động của dịch vụ chuyên môn.
Các công ty ứng dụng AI thực sự xuất sắc trong tương lai sẽ không chỉ tự xưng là công ty phần mềm, mà sẽ nói rằng họ có thể hoàn thành bao nhiêu công việc thay cho khách hàng, tiết kiệm bao nhiêu nhân lực, giảm bao nhiêu sai sót, tăng bao nhiêu tỷ lệ chuyển đổi và rút ngắn bao nhiêu chu kỳ giao hàng. Thị trường vốn trước đây nhìn vào ARR, trong tương lai còn sẽ xem nó có thể giảm bao nhiêu chi phí lao động.
Chín: Đừng bỏ qua AI địa phương và tài chính hóa năng lực tính toán
Còn hai đường khác, hiện tại không phải là nóng nhất, nhưng trong trung và dài hạn không thể bỏ qua. Một là AI địa phương. Hiện nay, phần lớn token vẫn được sản xuất tại các trung tâm dữ liệu trên đám mây; khi bạn hỏi một mô hình, về bản chất là một trung tâm dữ liệu ở xa đang tính toán giúp bạn. Nhưng trong tương lai, không thể đặt tất cả các phép suy luận AI lên đám mây.
Lý do rất đơn giản: suy luận trên đám mây quá đắt, nhiều bối cảnh yêu cầu độ trễ thấp, nhiều dữ liệu không thể tải lên đám mây, và các thiết bị đầu cuối sẽ ngày càng thông minh hơn. Vì vậy, trong tương lai, một phần token sẽ được di chuyển từ đám mây sang cục bộ, hay còn gọi là phía thiết bị đầu cuối. Điện thoại sẽ chạy AI, PC sẽ chạy AI, ô tô sẽ chạy AI, robot sẽ chạy AI, kính thông minh sẽ chạy AI, và các trạm làm việc cục bộ cũng sẽ chạy AI.
Khi AI tại thiết bị đầu cuối được kích hoạt, nó sẽ thúc đẩy một chu kỳ phần cứng mới. Các chip AI đầu cuối, NPU, bộ nhớ tiết kiệm điện, quản lý nguồn, tản nhiệt, cảm biến, mô-đun camera, mảng mic, PC AI, điện thoại AI, kính AI, robot và nền tảng tính toán thông minh trên xe sẽ bước vào giai đoạn đánh giá lại chuỗi cung ứng.
Tuy nhiên, cần nhìn nhận tuyến này một cách khách quan. Hướng AI tại đầu cuối là đúng đắn, nhưng hiện vẫn thiếu những ứng dụng thực sự đột phá. AI PC và AI điện thoại hiện nay chủ yếu do các nhà sản xuất phần cứng thúc đẩy, còn người dùng chưa tạo ra nhu cầu bắt buộc phải thay thế. Vì vậy, AI đầu cuối sẽ không phải là tuyến chính đầu tiên bùng nổ, nhưng nó sẽ là tuyến quan trọng trong trung và dài hạn.
Một tuyến khác là tài chính hóa công suất tính toán. Cơ sở hạ tầng AI quá nặng nề. GPU đắt, trung tâm dữ liệu đắt, hợp đồng điện đắt, chu kỳ xây dựng kéo dài và chiếm dụng vốn lớn. Chỉ dựa vào bảng cân đối kế toán của chính các công ty công nghệ để gánh vác không nhất thiết là giải pháp tối ưu.
Trong tương lai, có thể xuất hiện một số loại tài sản tài chính mới: hợp đồng thuê GPU, quyền lợi từ doanh thu tính toán, REITs trung tâm dữ liệu, quỹ cơ sở hạ tầng AI, thỏa thuận mua điện dài hạn, tài trợ thế chấp GPU, tài trợ có cấu trúc dựa trên doanh thu suy luận, cũng như tài sản tính toán được RWA hóa.
Đội ngũ kinh doanh tài sản số tại Fosun Wealth mà tôi đang làm việc là một trong những đội ngũ phát hành RWA chuyên nghiệp nhất tại Hồng Kông. Từ góc nhìn phân tích thực tế của tôi, tài sản tính toán RWA có giá trị tài chính rất cao và tiềm năng giao dịch tuân thủ toàn cầu trong tương lai. FinChain StarChain và StarRoad đang hỗ trợ các nhà sản xuất tính toán truyền thống lớn thực hiện con đường tài chính tuân thủ mới thông qua token hóa, từ tính toán Bitcoin đến tính toán AI.
Đã có những ví dụ thành công về tài chính hóa năng lực tính toán ở nước ngoài, và CoreWeave là trường hợp điển hình nhất. Vào tháng 3 năm 2026, CoreWeave thông báo đã hoàn tất khoản vay kỳ hạn 8,5 tỷ USD và gọi đây là khoản tài trợ đầu tiên được bảo đảm bằng GPU đạt cấp độ đầu tư. [15] Điều này cho thấy GPU, tủ máy và hợp đồng năng lực tính toán đang được các thị trường tài chính định giá lại như những tài sản cơ sở hạ tầng có thể thế chấp và huy động vốn.
Điều này rất giống với ngành đường sắt, viễn thông và điện toán đám mây. Trong thời kỳ đường sắt, các công ty đường sắt huy động vốn thông qua trái phiếu để xây dựng đường sắt; trong thời kỳ viễn thông, các nhà cung cấp dịch vụ sử dụng vốn dài hạn để xây dựng mạng lưới; trong thời kỳ điện toán đám mây, các nhà cung cấp đám mây đầu tư vốn lớn để xây dựng trung tâm dữ liệu. Trong thời kỳ AI, GPU, tủ máy chủ, hợp đồng điện và doanh thu suy luận trong tương lai cũng sẽ được các thị trường tài chính tái đóng gói, định giá và lưu thông.
Mười: Cơ hội cao nhất: Các công ty bản địa AI sẽ viết lại bảng lợi nhuận
Những điều đã nói ở trên đều liên quan đến chuỗi công nghiệp. Nhưng ảnh hưởng dài hạn lớn nhất của AI không chỉ dừng lại ở chuỗi công nghiệp, mà còn là việc cấu trúc tổ chức sẽ được viết lại.
Trước đây, công ty xây dựng các phòng ban dựa trên con người: phòng kinh doanh, phòng chăm sóc khách hàng, phòng tài chính, phòng pháp lý, phòng nghiên cứu và đầu tư, phòng vận hành—mỗi phòng ban đều có các vị trí, quy trình, phê duyệt và đánh giá hiệu suất. Sau khi AI Agent được đưa vào, tổ chức sẽ thay đổi: một người có thể quản lý nhiều Agent, một phòng ban có thể được thu gọn nhờ luồng công việc của Agent, các vị trí hậu cần và trung tâm sẽ được tự động hóa, phạm vi quản lý sẽ mở rộng, và công ty sẽ chuyển từ tổ chức dựa trên lao động thủ công thành tổ chức con người-hợp tác với máy móc.
Điều này có nghĩa là trong tương lai, thị trường vốn sẽ định giá lại một loại công ty: các công ty bản địa AI. Đó không phải là đơn giản chỉ mua vài công cụ AI hay để nhân viên dùng ChatGPT viết bài, mà là thiết kế lại cấu trúc tổ chức từ đầu dựa trên AI. Ít người hơn, doanh thu cao hơn, năng suất trên đầu người cao hơn, chi phí biên thấp hơn và tốc độ giao hàng nhanh hơn.
Vì vậy, tác động lớn nhất của AI lên thị trường vốn không chỉ là “trong chuỗi ngành AI, ai sẽ tăng giá”, mà còn là “trong mọi ngành, ai có thể dùng AI để viết lại bảng lợi nhuận của mình”. Thị trường tương lai sẽ thưởng cho hai loại công ty: một loại là các công ty bán cơ sở hạ tầng AI và năng lực AI; loại còn lại là các công ty dùng AI tái cấu trúc cơ cấu chi phí và cơ cấu doanh thu của chính họ. Những công ty sau này về bề ngoài có thể không phải là công ty AI, nhưng hiệu quả tổ chức, biên lợi nhuận và sản lượng trên đầu người của họ sẽ thay đổi căn bản.
Kết luận: AI đang tái định nghĩa sự khan hiếm
Đến đây, nếu chỉ nhìn vào GPU, mô-đun quang, điện lực, làm mát bằng chất lỏng, ASIC, trung tâm dữ liệu và thiết bị đầu cuối, thực ra vẫn đang xem AI như một chuỗi công nghệ. Sự thay đổi sâu sắc hơn là AI sẽ định nghĩa lại điều gì là khan hiếm.
Trước đây, GPU khan hiếm, nên NVIDIA tăng giá; sau đó, HBM và module quang học khan hiếm, nên lĩnh vực lưu trữ và module quang học tăng giá; tiếp theo, điện năng, làm mát bằng chất lỏng, mạng AI, chip suy luận, đường dẫn dữ liệu, điểm vào quy trình làm việc, dữ liệu doanh nghiệp và năng lực tổ chức sẽ trở nên khan hiếm.
Nếu tách riêng đợt thị trường AI này ra, giai đoạn đầu tiên đầu tư vào cơ sở hạ tầng tính toán, giai đoạn thứ hai đầu tư vào khả năng vận hành ổn định và chi phí thấp của năng lực tính toán, và giai đoạn thứ ba đầu tư vào khả năng tích hợp năng lực tính toán vào quy trình doanh nghiệp, tạo ra doanh thu và lợi nhuận thực tế.
Các mô-đun quang tăng gấp mười lần, không phải là kết thúc câu chuyện, mà là lần đầu tiên thị trường vốn nhận rõ ràng về giới hạn vật lý của cơ sở hạ tầng AI. Sự đánh giá lại lớn hơn nữa sẽ xảy ra với những giới hạn mới tiếp theo chưa được định giá đầy đủ.
Điện lực, làm mát bằng chất lỏng, trung tâm dữ liệu AI, ASIC tùy chỉnh, mạng AI, nén token, định tuyến mô hình, đường ống dữ liệu doanh nghiệp, điểm vào quy trình, AI tại đầu cuối, tài chính hóa năng lực tính toán, công ty bản địa AI—những hướng này sẽ cùng nhau tạo nên bản đồ tài sản tiếp theo của chuỗi giá trị AI.
Tất nhiên, điều này không có nghĩa là tất cả các công ty sẽ tăng giá, cũng không phải mọi khái niệm đều đáng để mua. Trong mỗi đợt cách mạng công nghiệp, của cải không được phân phối đều. Những công ty thực sự được thị trường vốn thưởng dài hạn chắc chắn là những công ty kiểm soát được các điểm nghẽn, có khách hàng, có đơn hàng, có rào cản công nghệ, có lợi thế chi phí và vị trí trong hệ sinh thái.
Tóm tắt một câu: Cơ hội đầu tiên của AI là ai có thể xây dựng năng lực tính toán; cơ hội tiếp theo của AI là ai có thể hỗ trợ, tối ưu hóa và điều phối năng lực tính toán, đồng thời biến năng lực tính toán thành kết quả kinh doanh thực tế.
Ghi chú và nguồn tham khảo
Các tài liệu sau đây hỗ trợ các sự kiện lịch sử, dữ liệu công khai và trường hợp ngành được đề cập trong bài viết. Để thuận tiện cho biên tập viên truyền thông tài chính kiểm tra lại, ưu tiên sử dụng các nguồn từ cơ quan chính thức, thông báo của công ty, phương tiện truyền thông uy tín hoặc tài liệu gốc.
[1] Về việc cổ phiếu của Công ty Khoa học Yuanjie tăng vượt mức của Khuê Châu Ma Đài, trở thành đại diện cổ phiếu mới đắt nhất trên thị trường A: Sina Tài chính, ngày 17 tháng 4 năm 2026, “Vượt mặt Ma Đài, vị vua cổ phiếu mới của thị trường A ra đời”. https://finance.sina.com.cn/wm/2026-04-17/doc-inhuupte2305062.shtml
[2] Về phí truyền tin xuyên Đại Tây Dương năm 1866: PBS American Experience, “How the Early Cable Was Used”, cho biết phí ban đầu của tin nhắn xuyên Đại Tây Dương năm 1866 là 10 đô la Mỹ mỗi từ, tối thiểu 10 từ, tương đương khoảng mười tuần lương của người lao động lành nghề. https://www.pbs.org/wgbh/americanexperience/features/cable-how-early-cable-was-used/
[3] Về trường hợp bồ câu đưa tin của Reuters: Reuters, “The long history of speed at Reuters”, đề cập đến việc Reuter hồi đầu sử dụng bồ câu để truyền tải thông tin tài chính. https://www.reuters.com/article/business/the-long-history-of-speed-at-reuters-idUSKBN2761WD/
[4] Về phí cuộc gọi xuyên lục địa Mỹ năm 1915: JSTOR Daily, “AT&T: Sự ra đời của mạng xã hội đầu tiên”, đề cập đến chi phí 20,70 đô la Mỹ cho cuộc gọi 3 phút từ bờ này sang bờ kia. https://daily.jstor.org/birth-first-social-network/
[5] Về NVIDIA GB200 NVL72: Trang web chính thức của NVIDIA cho biết GB200 NVL72 kết nối 36 CPU Grace và 72 GPU Blackwell, sử dụng thiết kế quy mô rack và làm mát bằng chất lỏng. https://www.nvidia.com/en-us/data-center/gb200-nvl72/
[6] Về lượng điện tiêu thụ của các trung tâm dữ liệu toàn cầu: Cơ quan Năng lượng Quốc tế, “Energy demand from AI”, dự kiến lượng điện tiêu thụ của các trung tâm dữ liệu toàn cầu vào năm 2030 sẽ vào khoảng 945 TWh, chiếm dưới 3% tổng lượng điện tiêu thụ toàn cầu. https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai
[7] Về chip AI tùy chỉnh của Broadcom: Reuters, 2026-03-04, “Broadcom dự báo doanh thu quý hai cao hơn dự kiến”, báo cáo rằng Broadcom dự kiến doanh thu từ chip AI sẽ vượt quá 100 tỷ USD vào năm 2027. https://www.reuters.com/technology/broadcom-forecasts-second-quarter-revenue-above-estimates-2026-03-04/
[8] Về hoạt động AI trung tâm dữ liệu của AMD: Báo cáo Thường niên 2024 của AMD tiết lộ doanh thu hàng năm của hoạt động AI trung tâm dữ liệu vượt quá 5 tỷ USD, đồng thời đề cập đến việc Meta, Microsoft, Oracle triển khai bộ tăng tốc AMD Instinct MI300. https://ir.amd.com/financial-information/sec-filings/content/0001193125-25-067185/0001193125-25-067185.pdf
[9] Về hiệu quả chi phí của Google TPU v5e: Google Cloud Blog, “Performance per dollar of GPUs and TPUs for AI inference”, đề cập đến việc TPU v5e tăng số lượng truy vấn với cùng chi phí. https://cloud.google.com/blog/products/compute/performance-per-dollar-of-gpus-and-tpus-for-ai-inference
[10] Về nền tảng mạng AI của NVIDIA: Trang chính thức của NVIDIA Quantum-X800 mô tả đây là mạng InfiniBand端到端 800 Gb/s. https://www.nvidia.com/en-us/networking/products/infiniband/quantum-x800/
[11] Về thị trường mô-đun quang thu phát AI: TrendForce, 2026-04-20, “Thị trường mô-đun quang thu phát AI toàn cầu đạt 26 tỷ USD”, chỉ ra nhu cầu về các mô-đun quang thu phát 800G trở lên đang tăng nhanh. https://www.trendforce.com/presscenter/news/20260420-13017.html
[12] Về việc chi phí suy luận AI giảm: Stanford HAI, “AI Index 2025: State of AI in 10 Charts”, cho thấy chi phí truy vấn mô hình đạt mức GPT-3.5 đã giảm hơn 280 lần trong khoảng 18 tháng. https://hai.stanford.edu/news/ai-index-2025-state-of-ai-in-10-charts
[13] Về quy mô người dùng Microsoft Copilot: Báo cáo thường niên năm 2025 của Microsoft, tiết lộ rằng gia đình sản phẩm Copilot có tổng cộng hơn 100 triệu người dùng hoạt động hàng tháng trên cả thị trường doanh nghiệp và người tiêu dùng. https://www.microsoft.com/investor/reports/ar25/index.html
[14] Về trường hợp AI pháp lý Harvey: Danh sách 100 công ty có ảnh hưởng nhất toàn cầu năm 2025 của TIME báo cáo rằng Harvey có định giá khoảng 5 tỷ USD, với hơn 300 khách hàng và phủ sóng tại 53 quốc gia. https://time.com/collections/time100-companies-2025/7289586/harvey/
[15] Về khoản tài trợ được đảm bảo bởi GPU của CoreWeave: Thông báo từ bộ phận quan hệ nhà đầu tư của CoreWeave, vào tháng 3 năm 2026, công ty đã hoàn tất khoản vay kỳ hạn 8,5 tỷ USD với cơ chế rút vốn chậm và gọi đây là khoản tài trợ được đảm bảo bởi GPU đầu tiên đạt xếp hạng đầu tư. https://investors.coreweave.com/news/news-details/2026/CoreWeave-Closes-Landmark-8-5-Billion-Financing-Facility-Achieving-First-Investment-Grade-Rated-GPU-backed-Financing/default.aspx
Ghi chú: Bài viết này là bài phân tích quan điểm ngành, các chú thích dùng để nêu nguồn thông tin, không tạo thành bất kỳ lời khuyên đầu tư nào.
