Ngành công nghiệp AI bước vào 'kỷ nguyên token' với cơ sở hạ tầng bảy lớp

icon MarsBit
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Chương trình tin tức AI + crypto cho thấy ngành công nghiệp đang chuyển từ “thời kỳ mô hình” sang “thời kỳ công nghiệp Token”, được thúc đẩy bởi nhu cầu suy luận AI ngày càng tăng. GoodVision AI chi tiết một hạ tầng bảy lớp, bao gồm năng lượng, sản xuất GPU và phân phối Token. Dự kiến sẽ có thêm các đợt niêm yết Token mới khi việc sử dụng AI Agent tăng lên, với các hệ thống dựa trên Token trở thành trung tâm của sản xuất và tiêu dùng.

Động lực của thời đại AI đã chuyển từ mô hình sang Token

Trong hai năm qua, logic kể chuyện của giai đoạn đầu ngành AI chủ yếu xoay quanh cuộc "chiến tranh mô hình lớn" do các công ty lớn khởi xướng. Số tham số tăng từ hàng trăm tỷ lên hàng nghìn tỷ, chi phí huấn luyện tăng từ vài chục triệu đô la Mỹ lên hàng trăm triệu đô la Mỹ, và cụm GPU mở rộng từ vài nghìn card lên vài chục nghìn card. Mọi người đều bàn luận về mô hình nào mạnh hơn và ai tiến gần đến AGI hơn, như thể điểm kết thúc của cuộc cạnh tranh AI là hiệu suất của chính các mô hình lớn.

Và khi thời gian trôi đến năm 2026, logic thúc đẩy ngành AI đã thay đổi. Báo cáo mới nhất của JPMorgan cho rằng, trong tương lai, yếu tố thực sự thúc đẩy sự mở rộng liên tục của cơ sở hạ tầng AI không còn là việc huấn luyện mô hình, mà là nhu cầu推理 (Inference) khổng lồ từ AI. Những gì tiêu tốn nhiều năng lực tính toán nhất trong tương lai không còn chỉ là huấn luyện các mô hình lớn, mà là các AI Agent phân bố toàn cầu. Mỗi lần gọi, mỗi lần tương tác, mỗi lần thực hiện nhiệm vụ đều về bản chất đang tiêu tốn Token. Ngành AI đang chuyển từ “thời đại mô hình” sang “thời đại công nghiệp Token”.

Vì điều thực sự thúc đẩy thế giới AI trong tương lai không chỉ là chính các mô hình, mà còn là hệ thống sản xuất, phân phối, điều phối và tiêu thụ xung quanh Token. Đặc biệt sau khi các AI Agent bắt đầu xuất hiện quy mô lớn, cách Token được tạo ra theo thời gian thực, phân phối xuyên vùng, điều phối động và tiêu thụ hiệu quả sẽ trở thành vấn đề mới quan trọng nhất của toàn bộ ngành công nghiệp AI.

Như Huang Renxun mới đây đã đề xuất, AI không phải là một ngành phần mềm đơn giản, mà là một hệ thống hạ tầng giống như điện lực và internet. Trong kiến trúc "bánh kem năm lớp" của ông, ngành công nghiệp AI được chia thành năm lớp: năng lượng, chip, hạ tầng, mô hình và ứng dụng. Và khi ngành công nghiệp AI dần chuyển từ thời kỳ "đào tạo" sang thời kỳ "suy luận", GoodVision AI có xu hướng hiểu toàn bộ chuỗi giá trị kinh tế AI như một "cấu trúc bánh kem bảy lớp" xoay quanh Token:

Lớp đầu tiên: Điện năng — Nền tảng năng lượng của thời đại AI
Lớp thứ hai: AIDC – Nhà máy Token
Lớp thứ ba: GPU – Thiết bị sản xuất Token
Lớp thứ tư: LLM – Động cơ sản xuất Token
Cấp độ thứ năm: Phân phối Token —— "Lưới điện" của thời đại AI
Tầng thứ sáu: Tối ưu hóa Token và điều phối thông minh — Bộ não của thời đại AI
Tầng thứ bảy: AI Agent – Thiết bị tiêu thụ Token

Từ năng lượng, GPU, đến AIDC, nút biên, rồi đến suy luận mô hình và lập lịch thông minh, ngành công nghiệp AI đang hình thành một “hệ thống công nghiệp Token” chưa từng có.

However, this system is still far from mature at this stage.

Có người sở hữu GPU tiên tiến nhất nhưng bị giới hạn bởi năng lượng; có người xây dựng AIDC quy mô lớn nhưng thiếu khả năng điều phối hiệu quả; có người phát triển AI Agent mạnh mẽ nhưng đối mặt với chi phí suy luận cao và độ trễ; có người nắm giữ các nút biên nhưng không thể tạo thành mạng lưới phối hợp thống nhất. Toàn bộ chuỗi giá trị dù đang phát triển nhanh chóng, nhưng giữa các tầng vẫn tồn tại nhiều sự tách rời, trùng lặp và điểm nghẽn về hiệu suất.

Chỉ khi bảy lớp hạ tầng này thực sự được kết nối, phối hợp và liên kết với nhau, ngành công nghiệp AI mới thực sự chuyển từ “thời đại công cụ” ngày nay sang “thời đại áp dụng quy mô lớn” của thế giới thông minh.

Lớp bánh đầu tiên: Điện năng – Năng lượng của thời đại AI

Cuộc tranh giành của Cách mạng Công nghiệp là than đá và dầu mỏ, thời đại Internet là lưu lượng truy cập và máy chủ, còn trong thời đại AI, cuộc chiến cơ bản nhất đang quay trở lại với năng lượng.

Vì AI cuối cùng tiêu thụ điện năng. Lượng điện tiêu thụ của một trung tâm dữ liệu AI quy mô lớn đã gần bằng một thành phố vừa. Các trung tâm dữ liệu AI mới được xây dựng trên toàn cầu đang đối mặt với cùng một vấn đề: GPU có thể mua, đất đai có thể xây, nhưng nguồn cung điện và khả năng điều phối lưới điện không theo kịp.

Đó cũng là lý do ngày càng nhiều công ty AI bắt đầu quay lại chú ý đến cơ sở hạ tầng năng lượng. Tại GTC 2026, Huang Renxun thậm chí còn định nghĩa các trung tâm dữ liệu trong tương lai là “nhà máy Token”. Chuỗi cung ứng của nhà máy này sẽ thúc đẩy sự ra đời của một ngành công nghiệp năng lượng siêu lớn.

Trong thị trường Trung Quốc, các công ty như Trường Giang Điện lực, Điện lực Hạt nhân Trung Quốc, Điện lực Quảng Hán Trung Quốc, Năng lượng Tam Hiệp, Long Nguyên Điện lực và Hoa Điện Tân Năng đại diện cho các hướng năng lượng cốt lõi như thủy điện, điện hạt nhân, điện gió và điện mặt trời. Trong đó, điện hạt nhân và thủy điện, nhờ khả năng cung cấp điện ổn định, đang trở thành nguồn năng lượng nền tảng quan trọng nhất cho AIDC; trong khi điện gió và điện mặt trời được hưởng lợi từ nhu cầu ngày càng tăng về điện xanh và ESG trong ngành AI. Cùng với việc thúc đẩy dự án “Đông số Tây tính” và xây dựng các trung tâm dữ liệu AI quy mô lớn, mối quan hệ phối hợp giữa các cơ sở năng lượng mới và trung tâm tính toán đang được củng cố nhanh chóng.

Tại thị trường Mỹ, các tập đoàn năng lượng truyền thống như NextEra Energy, Dominion Energy, Duke Energy, Southern Co. và Exelon cũng đang hưởng lợi từ sự mở rộng của các trung tâm dữ liệu AI. Trong đó, NextEra là nhà lãnh đạo năng lượng xanh ở Bắc Mỹ; Dominion kiểm soát các nguồn tài nguyên truyền tải then chốt tại “vành đai trung tâm dữ liệu” ở Bắc Virginia; còn Exelon nhờ vào khả năng cung cấp điện ổn định từ năng lượng hạt nhân, trở thành một trong những bên hưởng lợi quan trọng từ nhu cầu về “điện ổn định cao 24/7” trong thời đại AI. Nhìn chung, ngành điện toàn cầu đang dần chuyển đổi từ ngành tiện ích truyền thống thành lớp tài nguyên cốt lõi trong thời đại hạ tầng AI.

Trung tâm dữ liệu AI

Nhìn chung, cục diện cạnh tranh ở cấp độ này đang chuyển từ cuộc cạnh tranh về giá điện của các công ty năng lượng truyền thống sang cuộc cạnh tranh về quyền khống chế điện năng giữa các trung tâm dữ liệu AI, nhà cung cấp đám mây và các công ty năng lượng ở khâu cuối. Ai có thể khống chế được nguồn năng lượng dài hạn, ổn định và chi phí thấp, người đó sẽ nắm giữ viên ngọc rồng đầu tiên trong sản xuất Token.

Lớp bánh thứ hai: AIDC—Nhà máy nguyên liệu Token

Một GPU đơn lẻ không có ý nghĩa; điều thực sự quan trọng là quy mô cụm. Do đó, AIDC đã ra đời.

Nó giống như các nhà máy luyện thép, nhà máy điện và dây chuyền sản xuất thời công nghiệp, tập trung hàng chục nghìn GPU để tạo ra năng lực sản xuất Token ổn định. Nhưng các vấn đề của nhà máy cũng bắt đầu xuất hiện: chu kỳ xây dựng AIDC truyền thống thường kéo dài từ 18 đến 36 tháng, và việc mở rộng lưới điện thậm chí còn mất nhiều thời gian hơn. Khi nhu cầu AI tăng trưởng theo cấp số nhân, tốc độ xây dựng IDC thời kỳ trước đã không còn đáp ứng được nền kinh tế Token mới.

Trên thị trường chứng khoán Mỹ, Equinix là một trong những nhà vận hành trung tâm dữ liệu hàng đầu toàn cầu, với hơn 240 trung tâm dữ liệu tại hơn 30 quốc gia. Lợi thế cốt lõi của nó không chỉ nằm ở số lượng phòng máy, mà còn ở khả năng kết nối toàn cầu và nguồn tài nguyên mạng độ trễ thấp, khiến nó trở thành nút hạ tầng quan trọng cho việc triển khai năng lực tính toán AI.

Digital Realty đã thâm nhập vào cơ sở hạ tầng AI thông qua nền tảng PlatformDIGITAL, phục vụ các nhà cung cấp đám mây lớn và các tổ chức tài chính.

Trong thị trường Trung Quốc, Runze Technology là một trong những nhà vận hành AIDC điển hình nhất trên thị trường A. Hoạt động kinh doanh chính của công ty đã dần chuyển từ IDC truyền thống sang trung tâm tính toán AI, với lợi thế cạnh tranh cốt lõi nằm ở các trung tâm dữ liệu quy mô lớn, nguồn điện và năng lực vận hành AIDC. Các doanh nghiệp như Aofei Data và Capital Online lần lượt mở rộng mạnh mẽ trong các lĩnh vực trung tâm dữ liệu khu vực, cơ sở hạ tầng đám mây và dịch vụ托管 tính toán AI. Sunway Information hướng đến hợp tác trong lĩnh vực chính phủ - doanh nghiệp và nghiên cứu khoa học trong hoạt động AIDC.

Một nhóm người chơi khác đến từ việc chuyển đổi trang trại khai thác. Các công ty như CoreWeave, IREN, Applied Digital và Cipher Mining trước đây chủ yếu liên quan đến khai thác tiền điện tử, nhưng do nhu cầu GPU cho AI tăng mạnh, họ nhanh chóng chuyển sang cơ sở hạ tầng tính toán AI. IREN tập trung vào mô hình “năng lượng xanh + tính toán AI”, xây dựng trung tâm dữ liệu GPU mật độ cao bằng năng lượng tái tạo. Applied Digital và Cipher Mining cũng đang chuyển đổi từ các trang trại khai thác truyền thống sang cơ sở hạ tầng tính toán hiệu năng cao cho AI.

Trung tâm dữ liệu AI

Ngoài ra, AI Factory bị phân hóa, thu nhỏ và mô-đun hóa đang trở thành xu hướng mới. Giống như thời kỳ internet đã chuyển từ máy chủ lớn sang điện toán đám mây, năng lực tính toán AI cần dần lan rộng từ các nút trung tâm siêu lớn sang các nút biên khu vực.

Do đó, GoodVision AI đã chọn một con đường khác: xây dựng AI Factory nhẹ hơn, mô-đun hóa và có thể sao chép nhanh chóng. So với các trung tâm dữ liệu AI truyền thống quy mô lớn, GoodVision AI nhấn mạnh mạnh hơn vào khả năng triển khai khu vực, hiệu suất của cụm GPU mật độ cao, cũng như sự phối hợp tích hợp giữa năng lượng và sức mạnh tính toán.

Logic cốt lõi không phải là xây dựng một trung tâm dữ liệu siêu lớn duy nhất, mà là triển khai nhanh các nút AI Factory tại các khu vực có mật độ dân số cao trên toàn cầu, thường là các phòng máy tính推理 với công suất 2-4MW. Mô hình này không chỉ giúp kết nối nhanh hơn với các nguồn năng lượng địa phương, mà còn phù hợp hơn với xu hướng tương lai khi nhu cầu推理 AI lan rộng về phía biên.

Nếu AIDC truyền thống giống như các nhà máy luyện thép quy mô lớn thời công nghiệp, thì những gì GoodVision AI xây dựng lại giống như một “nhà máy Token khu vực” thời AI—nhẹ nhàng hơn, linh hoạt hơn, gần gũi người dùng hơn và phù hợp hơn với hướng phát triển của mạng lưới suy luận phân tán toàn cầu trong tương lai.

Tầng thứ ba: GPU – Thiết bị sản xuất Token

Nếu điện năng là năng lượng, thì GPU chính là thiết bị sản xuất. Trong những năm đầu bùng nổ của AI, GPU chủ yếu phục vụ việc huấn luyện; nhưng trong tương lai, nhu cầu lớn hơn sẽ đến từ suy luận. Vì huấn luyện chỉ thuộc về một số ít công ty hàng đầu, trong khi suy luận sẽ thấm sâu vào mọi ứng dụng, mọi thiết bị và mọi đầu cuối. Robot cần suy luận, xe tự lái cần suy luận, kính AI cần suy luận, thậm chí ngay cả sự hợp tác giữa các AI Agent trong tương lai cũng đều tiêu thụ Token theo thời gian thực.

NVIDIA hiện vẫn là trung tâm tuyệt đối của ngành công nghiệp chip AI toàn cầu. Các sản phẩm GPU như H100, B200, Blackwell của nó gần như đã định nghĩa tiêu chuẩn đào tạo và suy luận AI toàn cầu hiện nay. Quan trọng hơn, NVIDIA không chỉ bán chip mà còn xây dựng một hệ sinh thái hoàn chỉnh thông qua các nền tảng phần mềm và phần cứng như CUDA, TensorRT, DGX, HGX, do đó, đối thủ cạnh tranh của nó không chỉ cần thách thức hiệu năng GPU, mà còn phải thách thức toàn bộ hệ sinh thái phần mềm AI.

AMD hiện là nhà thách thức chính trong lĩnh vực GPU, với các sản phẩm cốt lõi bao gồm AI GPU MI300X. So với NVIDIA, AMD nhấn mạnh hơn vào hệ sinh thái mở và nền tảng phần mềm ROCm, nhằm thu hút các nhà phát triển AI và khách hàng doanh nghiệp thông qua cách tiếp cận mở hơn.

Broadcom và Marvell đại diện cho một hướng đi khác—ASIC và kết nối tốc độ cao. Khi các kịch bản suy luận AI trở nên phức tạp hơn, ngày càng nhiều doanh nghiệp bắt đầu thử nghiệm phát triển chip ASIC tùy chỉnh để đạt được hiệu suất năng lượng cao hơn và chi phí thấp hơn.

Intel đang thâm nhập thị trường AI thông qua CPU máy chủ và card tăng tốc AI Gaudi, với hy vọng tận dụng hệ sinh thái CPU của mình để tái tham gia cuộc cạnh tranh về cơ sở hạ tầng AI.

Trong thị trường Trung Quốc, Cambricon là một trong những doanh nghiệp tiêu biểu nhất về chip AI trong nước, tập trung vào dòng chip AI Kunlun và xây dựng khung AI tự phát triển Neuware. Higon Information sở hữu giấy phép kiến trúc AMD Zen, tập trung phát triển thị trường DCU và suy luận AI.

Các công ty GPU trong nước như Moortec, Suanyuan Technology, Muxi Shares và Biren Technology đại diện cho hướng đi "thay thế trong nước" cho chip AI của Trung Quốc. Các công ty này đều nhấn mạnh khả năng tương thích với hệ sinh thái CUDA và nỗ lực xây dựng cụm GPU trong nước.

Trung tâm dữ liệu AI

Từ hệ sinh thái CUDA, bộ nhớ HBM đến Tensor Core, hiệu suất tạo Token trên đơn vị thời gian chính là cốt lõi của toàn bộ ngành công nghiệp AI. Đồng thời, GPU cùng các cơ sở hạ tầng đi kèm như máy chủ, mô-đun quang, làm mát bằng chất lỏng, switch... cũng có mối liên hệ mật thiết với hiệu suất sản xuất Token.

Những thứ này không nổi bật như NVIDIA hay OpenAI, những công ty ứng dụng AI, nhưng chúng quyết định liệu toàn bộ thế giới AI có thể vận hành thực sự hay không. Giống như Cách mạng Công nghiệp không chỉ cần động cơ hơi nước, mà còn cần đường sắt, lưới điện và cảng biển. Cách mạng AI cũng không chỉ là một cuộc cách mạng phần mềm. Đó là một sự nâng cấp chuỗi giá trị toàn cầu bao gồm năng lượng, chip, mạng lưới, điện toán đám mây và hạ tầng.

Trung tâm dữ liệu AI

Vertiv là công ty hàng đầu toàn cầu về UPS và quản lý điện cho trung tâm dữ liệu, cung cấp hệ thống cấp điện cho trung tâm dữ liệu, phân phối điện cho tủ và hệ thống điều hòa không khí chính xác.

Yingweike là doanh nghiệp dẫn đầu thị trường hệ thống làm mát bằng chất lỏng và điều khiển nhiệt độ trên thị trường A, với khách hàng bao gồm các công ty internet lớn như BAT. Khi công suất GPU ngày càng tăng, làm mát bằng chất lỏng đang trở thành tiêu chuẩn quan trọng cho các trung tâm dữ liệu AI.

Các công ty như Zhongheng Electric, Kehua Data và Kstar giữ vị trí quan trọng trong lĩnh vực UPS, hệ thống nguồn điện và cung cấp điện cho IDC.

Trong lĩnh vực mạng và module quang, các công ty như Zhongji Xuchuang, Xinyisheng và Tianfu Communications được hưởng lợi từ nhu cầu truyền thông tốc độ cao trong cụm AI tăng vọt.

Trong lĩnh vực máy chủ nguyên bộ, các công ty như Dell, HPE, Supermicro, Lenovo và Inspur đảm nhận việc lắp ráp và giao hàng quy mô lớn các máy chủ AI.

Mặc dù lớp này không trực tiếp tiếp xúc với người dùng cuối, nhưng nó quyết định liệu hạ tầng AI có thể vận hành ổn định thực sự hay không. Làm mát bằng chất lỏng, UPS, mô-đun quang, switch, lưu trữ năng lượng và toàn bộ máy chủ giống như đường sắt, lưới điện và cảng trong thời đại công nghiệp, đang trở thành những công việc thực sự “bán cuốc” trong thế giới AI.

Tầng thứ tư của chiếc bánh: LLM – Động cơ sản xuất Token

LLM (mô hình ngôn ngữ lớn) quyết định cách các token được hiểu, tạo ra và tổ chức. Trong hai năm qua, các công ty như OpenAI, Anthropic, Google, Meta, xAI, DeepSeek đã thúc đẩy cuộc đua toàn cầu về mô hình lớn. Số tham số đã tăng từ hàng trăm tỷ lên hàng nghìn tỷ, và khả năng của các mô hình cũng dần mở rộng từ sinh văn bản sang đa phương thức, suy luận, mã hóa, hợp tác Agent và trí nhớ dài hạn.

Tuy nhiên, khi ngành công nghiệp dần phát triển, thị trường cũng bắt đầu nhận ra: điều quan trọng thực sự trong tương lai không còn là “ai sở hữu mô hình lớn nhất”, mà là ai có thể vận hành mô hình một cách liên tục với chi phí thấp hơn và hiệu quả cao hơn. Vì bản thân mô hình không tạo ra giá trị trực tiếp, giá trị thực sự được tạo ra là từ quá trình suy luận khi mô hình được gọi liên tục.

Điều này cũng có nghĩa là LLM đang dần chuyển đổi từ việc “triển khai khả năng mô hình” trong quá khứ thành “động cơ sản xuất Token” trong thế giới AI.

Các mô hình đóng và mở nguồn như OpenAI, Anthropic, Google Gemini, Meta Llama đang cạnh tranh để giành vị trí cổng vào hệ sinh thái AI tương lai; trong khi các người chơi mới nổi như DeepSeek đang bắt đầu tái định hình cục diện cạnh tranh ngành thông qua chi phí thấp hơn và hiệu suất suy luận cao hơn. Hiện nay, cuộc cạnh tranh ở tầng LLM cũng dần không còn chỉ tập trung vào việc theo đuổi số lượng tham số, mà tiêu chí đánh giá đang dần chuyển sang nhiều khía cạnh so sánh:


Chi phí token
Hiệu suất suy luận
Bối cảnh năng lực
Hợp tác đa tác nhân
Long-term memory
Khả năng phối hợp giữa mô hình và cơ sở hạ tầng

Trung tâm dữ liệu AI

Điều thực sự quan trọng trong thời đại AI không chỉ là việc các mô hình lớn có “thông minh” hay không, mà là liệu các mô hình này có thể được vận hành liên tục, quy mô lớn và chi phí thấp trên toàn cầu hay không. GoodVision AI cũng có giải pháp tối ưu riêng ở cấp độ này: thông qua hợp tác với các nhà cung cấp mô hình lớn, triển khai các mô hình lớn trong các trung tâm dữ liệu AI Factory, chuyển đổi từ mô hình cho thuê sức mạnh tính toán truyền thống sang cung cấp dịch vụ Token trực tiếp; không chỉ tăng biên lợi nhuận kinh doanh, mà trải nghiệm người dùng cũng thân thiện hơn.

Tầng thứ năm của bánh kem: Phân phối token — “lưới điện” của thời đại AI

Sau khi AIDC được xây dựng xong, câu hỏi tiếp theo xuất hiện: Làm thế nào để toàn thế giới sử dụng những nguồn tính toán này?

Do đó, các nền tảng cho thuê tính toán bắt đầu xuất hiện. Chúng giống như hệ thống "lưới điện" của thời đại AI, tách rời và phân phối nguồn GPU tập trung, sau đó cho thuê theo nhu cầu đến các nhà phát triển, doanh nghiệp và ứng dụng AI.

AWS, Azure, Google Cloud, Alibaba Cloud và Tencent Cloud vẫn là những người chơi mạnh nhất ở cấp độ này. Họ sở hữu cơ sở hạ tầng điện toán đám mây lớn nhất toàn cầu và đang dần tích hợp tài nguyên AI GPU vào hệ thống IaaS của mình.

Tuy nhiên, cùng lúc đó, một loạt nền tảng “điện toán đám mây bản địa AI” đang nhanh chóng nổi lên. Các công ty như CoreWeave, Nebius và Nscale đã xây dựng các nền tảng đám mây GPU chuyên biệt nhằm đáp ứng nhu cầu huấn luyện và suy luận AI. So với các nhà cung cấp đám mây truyền thống, họ linh hoạt hơn, tập trung hơn vào các nhiệm vụ AI và giỏi hơn trong việc tối ưu hóa cụm GPU.

CoreWeave là một trong những công ty tiêu biểu nhất của NeoCloud. Ban đầu, công ty tập trung vào khai thác Ethereum, sau đó chuyển hoàn toàn sang dịch vụ điện toán GPU AI, hiện đã trở thành một trong những công ty cơ sở hạ tầng AI được NVIDIA hỗ trợ trọng điểm.

Các nền tảng điện toán đám mây nhẹ như DigitalOcean và Vultr nhắm đến các nhà phát triển và startup vừa và nhỏ, nhấn mạnh vào việc triển khai nhanh chóng và dịch vụ GPU chi phí thấp.

Trên thị trường Trung Quốc, ngoài các ông lớn, các công ty như UCloud, Kingsoft Cloud và Capital Online đều là nhà cung cấp chính trên thị trường điện toán đám mây GPU và cho thuê năng lực AI. Mô hình cạnh tranh ở cấp độ này rất giống với lưới điện thời kỳ đầu: làm thế nào để phân phối hiệu quả các nguồn năng lực tính toán phân tán.

Trung tâm dữ liệu AI

Tầng thứ sáu của chiếc bánh: Tối ưu hóa Token và lập lịch thông minh — Bộ não của thời đại AI

Đây có lẽ là lớp “bánh” bị đánh giá thấp nhất nhưng lại quan trọng nhất. Sau khi lượng sử dụng AI Agent bùng nổ, mọi người nhận ra rằng không phải mọi nhiệm vụ đều đáng để gọi đến mô hình lớn đắt nhất. Nhiều nhiệm vụ đơn giản có thể được thực hiện bởi mô hình cục bộ; nhiều nhiệm vụ thời gian thực phù hợp hơn với suy luận biên; nhiều nhiệm vụ liên quan đến quyền riêng tư thậm chí không thể tải lên đám mây. Sau câu hỏi “có đủ năng lực tính toán hay không”, giờ đây lại xuất hiện thêm một câu hỏi khác: “làm thế nào để sử dụng năng lực tính toán một cách thông minh hơn?”

Với nhu cầu về Token tăng trưởng theo cấp số nhân, “đưa mô hình phù hợp lên nền tảng tính toán phù hợp để xử lý nhiệm vụ phù hợp” là chìa khóa để sử dụng Token một cách hợp lý và hiệu quả. Đây chính là một trong những hướng đi mà GoodVision AI đang nỗ lực phát triển, bên cạnh việc xây dựng nhà máy AI Token.

Giống như hệ thống điện ngày nay: một số nhu cầu đến từ lưới điện lớn; một số nhu cầu đến từ năng lượng mặt trời trên mái nhà. Và điều thực sự quan trọng là lớp trung gian – “hệ thống điều phối thông minh”.

AI trong tương lai cũng sẽ có cùng cấu trúc này: các nhiệm vụ đơn giản được thực hiện bởi mô hình nhỏ tại chỗ, các nhiệm vụ phức tạp gọi đến mô hình lớn trên đám mây, các nhiệm vụ yêu cầu bảo mật cao được xử lý tại biên, và các nhiệm vụ có lưu lượng cao được điều phối động thông qua đám mây lai.

Ngoài Goodvision AI, các công ty như Qingyun Technology, Lambda, OpenRouter và Fireworks AI cũng là những người dẫn đầu trong tối ưu hóa token và điều phối thông minh.

Lớp “bánh” này có sự trùng lặp cao về người chơi với hai lớp “bánh” trước đó — AIDC và cho thuê sức mạnh tính toán. Khi tài nguyên GPU, nút khu vực và quy mô nhiệm vụ suy luận không ngừng mở rộng, việc chỉ “có sức mạnh tính toán” đã không còn đủ để tạo ra rào cản lâu dài. Ngày càng nhiều nhà vận hành AIDC và nền tảng GPU đám mây nhận ra rằng, điều quyết định hiệu quả và lợi nhuận trong tương lai không chỉ là số lượng GPU, mà còn là cách thức điều phối linh hoạt mô hình, sức mạnh tính toán và luồng token.

Do đó, nhiều nền tảng ban đầu tập trung vào AIDC và GPU cloud đang mở rộng sang “lớp điều phối thông minh”. Ví dụ, các công ty như UCloud, Capital Online và Sugon tại thị trường Trung Quốc đều đang nỗ lực kết hợp cơ sở GPU cloud, tài nguyên đa đám mây và khả năng điều phối suy luận của mình, dần chuyển từ “bán sức mạnh tính toán” sang “tối ưu hóa sức mạnh tính toán”.

Trung tâm dữ liệu AI

Bánh tầng bảy: Mô hình và Agent—Người tiêu thụ Token

Mặc dù lớp này gần người dùng nhất và dễ dàng thu hút lưu lượng truy cập nhất, nhưng cạnh tranh cũng khốc liệt nhất. Tại GTC 2026, Huang Renxun đã đưa ra quan điểm rằng: trong tương lai, mỗi công ty sẽ trở thành “người sản xuất Token và người tiêu dùng Token”.

Một AI Agent có thể đồng thời gọi nhiều mô hình, nhiều công cụ và nhiều API, liên tục thực hiện suy luận, lập kế hoạch và thực thi. Điều này có nghĩa là lượng Token mà AI sẽ tiêu thụ trong tương lai sẽ vượt xa quy mô hiện tại của các cuộc hội thoại giữa con người và AI. Hiện nay, một số người dùng AI nặng đã tự xây dựng hệ thống đa Agent chạy đồng thời và gọi lẫn nhau, tiêu thụ 1 tỷ Token mỗi ngày hoàn toàn không phải vấn đề.

Tương lai không phải là 1 tỷ người sử dụng AI, mà là 10 tỷ, thậm chí 100 tỷ AI Agent cùng hoạt động và gọi lẫn nhau. Và điểm nghẽn thực sự sẽ chuyển từ “khả năng mô hình” sang “hiệu suất điều phối Token”.

Các ông lớn công nghệ không cần phải nói nhiều nữa, Microsoft, Google, Meta, Amazon đang dần tích hợp khả năng AI vào tất cả sản phẩm của họ thông qua hệ thống văn phòng, tìm kiếm, mạng xã hội và dịch vụ đám mây.

Các công ty phần mềm doanh nghiệp như Adobe, Salesforce, ServiceNow, Palantir đang nhanh chóng đẩy mạnh phát triển AI Agent cấp doanh nghiệp và các luồng công việc tự động hóa. Đồng thời, Hugging Face đang trở thành “Github” của thời đại AI. Không chỉ là cộng đồng mô hình, mà còn là cơ sở hạ tầng quan trọng của hệ sinh thái phát triển AI toàn cầu.

Tại thị trường Trung Quốc, các công ty như iFlytek, Kunlun Tech, 360, Kingsoft Office và SenseTime đang triển khai chiến lược xung quanh trợ lý AI, văn phòng AI và AI Agent.

Khi "bánh bảy tầng" thực sự được hình thành, thế giới AI mới thực sự bắt đầu

Ngành công nghiệp AI hôm nay thực tế vẫn đang nằm trong một hệ thống hạ tầng chưa hoàn toàn trưởng thành.

Có người sở hữu GPU tiên tiến nhất nhưng bị giới hạn bởi năng lượng; có người xây dựng AIDC quy mô lớn nhưng thiếu khả năng điều phối hiệu quả; có người phát triển mô hình và Agent mạnh mẽ nhưng đối mặt với chi phí suy luận và độ trễ cao; có người nắm giữ các nút biên nhưng không thể tạo thành mạng lưới phối hợp thống nhất.

Từ điện lực, AIDC, GPU đến LLM, phân phối Token, điều phối thông minh và AI Agent, toàn bộ chuỗi giá trị AI dù đang phát triển nhanh chóng, nhưng giữa các tầng vẫn tồn tại nhiều sự tách rời, trùng lặp và điểm nghẽn về hiệu suất.

Chỉ khi bộ "bánh bảy tầng" này được xây dựng hoàn chỉnh và bắt đầu vận hành hiệu quả, ngành AI mới thực sự chuyển từ "thời đại công cụ" ngày nay sang "thời đại áp dụng quy mô lớn" thuộc về thế giới thông minh.

Thế giới AI trong tương lai sẽ không còn chỉ là vài tập đoàn công nghệ lớn huấn luyện các mô hình lớn, mà là hàng tỷ AI Agent liên tục trực tuyến, liên tục hợp tác và liên tục gọi nguồn tính toán và Token. Mỗi cuộc hội thoại, mỗi lần suy luận, mỗi lần gọi công cụ và mỗi lần thực hiện tác vụ tự động đều đi kèm với sự phối hợp vận hành của năng lượng, GPU, mạng lưới, hệ thống điều phối và nút suy luận.

Điều này cũng có nghĩa là ngành AI đang dần chuyển đổi từ “logic phần mềm” trong quá khứ thành một hệ thống công nghiệp siêu cấp bao gồm năng lượng, chip, điện toán đám mây, mạng biên và điều phối thông minh.

Giống như Cách mạng Công nghiệp không chỉ cần động cơ hơi nước, mà còn cần đường sắt, lưới điện và cảng biển; Cách mạng Internet không chỉ cần máy tính cá nhân, mà còn cần sợi quang, trung tâm dữ liệu và điện toán đám mây. Dấu hiệu thực sự trưởng thành của Cách mạng AI cũng không chỉ là một ứng dụng nổi bật, mà là sự hình thành một “mạng lưới hạ tầng thông minh” toàn cầu, có khả năng sản xuất, phân phối, điều phối và tiêu thụ Token một cách liên tục.

Và khi bảy lớp hạ tầng này cuối cùng được kết nối hoàn toàn, logic cạnh tranh trong ngành AI cũng sẽ được tái cấu trúc hoàn toàn. Những công ty quan trọng nhất trong tương lai có thể không còn chỉ là những công ty sở hữu mô hình lớn nhất, mà là những công ty có khả năng kết nối năng lượng, sức mạnh tính toán, mạng lưới, mô hình và dòng chảy Token.































Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.