Trung Quốc tụt hậu so với Hoa Kỳ trong việc tiếp cận chip đào tạo cao cấp và sức mạnh tính toán

Sức mạnh tính toán bị hạn chế

Từ cuối năm ngoái, các công ty GPU trong nước như Moore Threads, Muxi Shares, Biren Technology và TianShu Intelligent Chip đã tạo nên làn sóng vốn. Tuy nhiên, dưới bữa tiệc tài chính trên thị trường thứ cấp, một đường nét ẩn không thể bỏ qua đang ngày càng rõ ràng, và những vấn đề do nó gây ra cũng trở nên cấp bách hơn bao giờ hết.

Trong vài năm qua, các chip AI trong nước chủ yếu tập trung vào các nhiệm vụ “suy luận” tương đối an toàn và tương đối biên, chẳng hạn như gần đây dự án DouBao đã mua sắm 50.000 chip của TianShu Zhixin để thực hiện các tác vụ suy luận, nhằm đáp ứng nhu cầu truy cập tần suất cao từ ứng dụng AI lớn nhất Trung Quốc.

Trong chuỗi cấp cao nhất của kim tự tháp tính toán dành cho đào tạo AI, các chip trong nước hiện chỉ có thể tham gia vào các nhiệm vụ biên phụ trợ.

Chip đào tạo AI chủ yếu được sử dụng để đào tạo các mô hình trí tuệ nhân tạo, trong quá trình này diễn ra nhiều phép toán ma trận và điều chỉnh tham số, do đó cần có khả năng tính toán mạnh mẽ và tỷ lệ hiệu quả năng lượng cao, hiệu suất mạnh mẽ hơn và giá thành cũng rất đắt đỏ, chẳng hạn như NVIDIA A100, H100, H200 và loạt MI300 của AMD;

So sánh với vậy, nhiệm vụ của chip suy luận nhẹ nhàng hơn nhiều. Được sử dụng trong giai đoạn triển khai sau khi huấn luyện mô hình, chủ yếu đảm nhiệm việc thực hiện các tác vụ suy luận của mô hình, yêu cầu cao về tính thời gian thực; chip suy luận cần đảm bảo độ chính xác đồng thời có khả năng phản hồi nhanh và tiêu thụ ít năng lượng.

Một phép ẩn dụ phù hợp là: đào tạo giúp mô hình AI “học kiến thức”, trong khi suy luận giúp mô hình lớn “vận dụng kiến thức”. Trong giai đoạn học, chip đào tạo phải sử dụng lượng dữ liệu khổng lồ để “nuôi dưỡng” sự cập nhật động của các tham số ở mức hàng tỷ, hàng nghìn tỷ thậm chí hàng chục nghìn tỷ, không chỉ cần khả năng tính toán mạnh mẽ, mà còn phải được trang bị băng thông và khả năng truyền thông hiệu quả, đồng thời đảm bảo độ ổn định trong các cụm hàng vạn card.

Sự khác biệt giữa các mô hình Trung-Mỹ xuất phát từ những "nơi vô hình" này, đặc biệt là sự vắng mặt của các chip đào tạo cao cấp.

Dưới quy luật Scaling Law của mô hình lớn, càng tăng tham số mô hình, nhu cầu tính toán tương ứng tăng tuyến tính, trong khi chi phí tính toán và phần cứng tăng theo cấp số nhân khiến việc huấn luyện mô hình lớn trở thành “trò chơi độc quyền” của một số ít đế chế công nghệ.

Trong số các tập đoàn công nghệ Mỹ, chỉ riêng Meta đã lên kế hoạch triển khai hơn 1,2 triệu GPU cao cấp vào cuối năm 2026, với chi phí đầu tư hàng năm vượt quá 145 tỷ USD; theo ước tính, tổng năng lực tính toán AI mà Google sở hữu tương đương với 5 triệu card NVIDIA H100, chiếm tới một phần tư tổng lượng toàn cầu.

Bốn công ty Amazon, Microsoft, Alphabet và Meta đã chi tiêu vốn lên tới 725 tỷ USD trong năm nay, tăng mạnh 77% so với cùng kỳ năm trước, quy mô này tương đương 13% tổng đầu tư trong nước của khu vực tư nhân tại Mỹ. Morgan Stanley còn dự đoán rằng đến năm 2027, chi tiêu vốn của các doanh nghiệp công nghệ Mỹ có thể đạt kỷ lục 1.1 nghìn tỷ USD.

Hiện tại, Hoa Kỳ kiểm soát hơn 70% GPU cao cấp toàn cầu, sau lệnh cấm chip, số lượng chip cao cấp có thể sử dụng trong nước chỉ bằng 1/8 so với Hoa Kỳ. Báo cáo Stanford AI Index Report 2026 chỉ ra rằng, số lượng trung tâm dữ liệu của Hoa Kỳ (5.427 cái) nhiều hơn 10 lần so với Trung Quốc.

Theo tính toán của Viện Nghiên cứu Thông tin và Viễn thông Trung Quốc (CAICT), tính đến đầu năm 2025, quy mô tính toán của Hoa Kỳ là 2400 EFLOPS, của Trung Quốc là 1053 EFLOPS, tức Hoa Kỳ vượt quá gấp đôi Trung Quốc.

Quy mô năng lực tính toán mà bốn công ty công nghệ lớn trên sở hữu, mỗi công ty riêng lẻ đều đã vượt quá tổng hợp của tất cả các doanh nghiệp AI tại Trung Quốc.

Lợi thế về sức mạnh tính toán áp đảo này cho phép các doanh nghiệp Mỹ hoàn thành hàng chục chu kỳ thí nghiệm lặp lại mô hình lớn trong vòng một năm.

Elon Musk còn xa xỉ hơn khi công ty xAI của ông sở hữu Colossus 2, được mệnh danh là cụm AI GW đầu tiên trên thế giới. Vì vậy, ông có cơ sở tuyên bố đang đồng thời huấn luyện 7 mô hình—hai mô hình 1 nghìn tỷ tham số, hai mô hình 1,5 nghìn tỷ tham số, một mô hình 6 nghìn tỷ tham số và một mô hình 10 nghìn tỷ tham số. “Vẻ đẹp bạo lực” này chỉ có thể thực hiện được khi năng lực tính toán cực kỳ dồi dào.

Đồng thời, do Hoa Kỳ hạn chế xuất khẩu chip, tỷ lệ thị phần mà các doanh nghiệp Trung Quốc giành được trong các chip AI cao cấp được giao trong những năm gần đây liên tục giảm (theo thống kê của epoch.AI).

Có thể nói một cách không quá lời rằng, sự chênh lệch lớn về năng lực tính toán sẽ khiến AI của Trung Quốc duy trì trạng thái đuổi theo trong thời gian dài, đồng thời khiến quá trình các mô hình lớn trong nước bắt kịp các đối thủ Mỹ trở nên khó khăn hơn.

Sự khác biệt giữa các thế hệ

Bước tiến đổi mới của Trung Quốc là không thể ngăn cản, “ai nghĩ rằng Trung Quốc không thể làm ra (chip) thì thật sự đã đánh giá sai. Khoảng cách giữa Trung Quốc và Mỹ chỉ ở mức nan giây”.

Nhà sáng lập NVIDIA, Huang Renxun, đã không chỉ một lần khen ngợi sự tiến bộ của ngành bán dẫn Trung Quốc trong các sự kiện công khai.

Elon Musk cũng thường xuyên bày tỏ quan điểm tương tự trên X: “Trung Quốc nhất định sẽ giải quyết vấn đề bị kẹt trong lĩnh vực chip, trong lĩnh vực năng lực tính toán AI, Trung Quốc chắc chắn sẽ vượt xa tất cả các quốc gia khác trên thế giới”, “Trung Quốc sẽ chiến thắng cuộc đua AI trên Trái Đất”.

Các nhân vật nổi tiếng trong giới công nghệ đã ca ngợi không tiếc lời về sự phát triển AI của Trung Quốc, khiến người ta dễ dàng tin theo. Những phát ngôn này rõ ràng có vẻ như đang cố tình thổi phồng để gây hại. Một số phương tiện truyền thông Mỹ liên tục khuếch đại luận điệu cho rằng khoảng cách giữa các mô hình Trung-Mỹ là rất nhỏ, nhằm làm lẫn lộn sự thật và che giấu một số sự thật khách quan.

Đối với điều này, tất cả các lĩnh vực liên quan đến AI trong nước đều nên giữ sự tỉnh táo và bình tĩnh.

Nếu hiện nay các mô hình lớn tiên tiến của Trung Quốc khi giải quyết các vấn đề chuẩn hóa không có nhiều khác biệt so với đối thủ Mỹ, thì trong môi trường công nghiệp và doanh nghiệp phức tạp, khoảng cách sẽ trở nên rõ ràng hơn.

So sánh với các mô hình tiên tiến của các công ty như Anthropic ở Mỹ, Trung Quốc vẫn là người đi sau. Đánh giá của CAISI Mỹ cho thấy DeepSeek V4 Pro mạnh nhất trong nước đang tụt hậu khoảng 8 tháng so với các mô hình tiên tiến của Mỹ.

Li Ka-shing gần đây trong một cuộc phỏng vấn với The Wall Street Journal đã chỉ ra rằng, với các mô hình hàng đầu của Mỹ như Claude Fable 5 do Anthropic ra mắt, Mỹ hiện đang dẫn trước Trung Quốc khoảng 15 tháng.

Các mô hình lớn tuân theo quy luật Scaling Law: càng nhiều tham số mô hình, càng nhiều dữ liệu huấn luyện và càng nhiều sức mạnh tính toán được đầu tư, thì hiệu suất mô hình càng tốt. Hiện nay, các mô hình lớn tiên tiến nhất của Mỹ đã bước vào thời đại mười nghìn tỷ tham số, và tốc độ cập nhật vẫn đang tăng nhanh.

Anthropic mạnh nhất Myths đã đạt 10 nghìn tỷ tham số, việc huấn luyện nó đã tốn 10 tỷ USD; xAI đang đồng thời huấn luyện 7 mô hình Colossus 2, bao gồm các mô hình 6 nghìn tỷ và 10 nghìn tỷ tham số; OpenAI chỉ mất một tháng để lặp lại một mô hình 4 nghìn tỷ tham số.

Mô hình mạnh nhất Trung Quốc, DeepSeek V4 Pro, có tổng tham số là 1,6 nghìn tỷ, kém khoảng 6 lần so với các mô hình tiên tiến cấp mười nghìn tỷ của Mỹ.

Dòng Claude thuộc Anthropic đã được công nhận là mô hình AI lập trình mạnh nhất trong hai năm qua, trong khi Mythos lại một lần nữa thay đổi nhận thức của công chúng, với hiệu năng còn mạnh mẽ hơn cả người tiền nhiệm Oups 4.6.

OpenBSD được nổi tiếng trong ngành là hệ thống an toàn nhất, nhưng Mythos đã tìm ra một lỗ hổng chưa từng được phát hiện trong 27 năm, đồng thời cũng phát hiện ra những lỗ hổng chưa được phát hiện trong nhiều năm甚至 thập kỷ trong FFmpeg và nhân Linux, và toàn bộ quá trình này được thực hiện tự chủ mà không cần sự hỗ trợ của con người.

Cần lưu ý rằng, việc “tiền huấn luyện” mô hình lớn xác định giới hạn khả năng của mô hình, và không thể thông qua “huấn luyện sau” để nâng cấp mô hình có hàng nghìn tỷ tham số lên mức khả năng của mô hình có 10 nghìn tỷ tham số. Yếu tố quyết định trong tiền huấn luyện chính là chip tính toán cao cấp, nó xác định quy mô tham số và tốc độ lặp lại huấn luyện.

Chủ tịch Khoa Đại Húc Phi Lưu Khánh Phong thẳng thắn cho biết, hiện nay các nhà phát triển mô hình lớn hàng đầu, đặc biệt là các tập đoàn lớn của Mỹ, đều đang xây dựng các nền tảng tính toán quy mô cực lớn. Trong khi đó, năng lực tính toán trong nước hiện thực sự đang trải qua giai đoạn khó khăn, dẫn đến hạn chế trong việc huấn luyện các ngữ cảnh văn bản cực dài.

Có thể thấy, sự chênh lệch về năng lực tính toán chính là nguồn gốc của khoảng cách giữa các mô hình của Trung Quốc và Mỹ.

Sự trỗi dậy của sản phẩm trong nước

Một doanh nghiệp độc quyền 90% thị phần toàn cầu về chip đào tạo AI cao cấp — điều này giúp NVIDIA duy trì vị trí công ty có vốn hóa thị trường lớn nhất thế giới. Tổng vốn hóa của nó từng vượt quá GDP của Đức, nền kinh tế lớn thứ ba thế giới, vào năm 2025.

Theo dữ liệu từ TrendForce, quý 1 năm 2026, NVIDIA chiếm 68% thị phần máy chủ GPU toàn cầu, AMD chiếm 5%-6%, trong khi các nhà sản xuất GPU trong nước tổng cộng dưới 4%.

Với lợi thế đi trước, rào cản công nghệ vượt trội, kết nối tốc độ cao, hệ sinh thái phần mềm và hợp tác với quy trình sản xuất tiên tiến của TSMC, NVIDIA đang thống trị thị trường. Trong các kịch bản đào tạo cao cấp, hiệu năng của NVIDIA GB300 vượt trội so với AMD MI325, cũng như so với Cambricon Siyuan 690 và Moore Threads MTT40, đặc biệt trong đào tạo mô hình lớn với hàng nghìn tỷ tham số, hiệu năng vượt đối thủ hơn 30%.

Dưới lệnh cấm xuất khẩu, Huang Renxun trước đó đã cho biết thị phần mới của NVIDIA tại Trung Quốc đã cơ bản về gần bằng không, chỉ còn lại thị trường hiện có. Dưới sự hỗ trợ của chính sách thay thế trong nước, các sản phẩm như Huawei Ascend 910, Higon DCU Shen Suan số 2, Cambricon MLU370/590, cùng các doanh nghiệp như Moore và Muxi đã lần lượt xuất hiện.

Trong đó, Ascend 910 là chip tính toán mạnh nhất của Huawei, với hiệu năng của Ascend 910B đạt 640 TOPS (INT8), có thể sánh ngang với chip NVIDIA A100.

Về mặt hiệu năng tuyệt đối, GPU trong nước vẫn còn khoảng cách, nhưng có thể bắt đầu từ các kịch bản suy luận và biên, hiện tại GPU trong nước cơ bản đáp ứng nhu cầu suy luận phổ thông của các tổ chức chính phủ và doanh nghiệp trong nước, khoảng cách với các sản phẩm trung cấp của NVIDIA đã thu hẹp xuống còn 15%-20%, đủ điều kiện thay thế.

Cần đặc biệt lưu ý rằng, mặc dù hiệu năng tính toán là quan trọng, nhưng hệ sinh thái phần mềm đằng sau mới là điểm yếu của GPU trong nước. Như CUDA chính là nền tảng tạo nên đế chế GPU của NVIDIA, Giáo sư Zheng Weimin, học viên Viện Kỹ thuật Trung Quốc, đã chỉ ra rằng vấn đề cốt lõi của chip AI trong nước là hệ sinh thái chưa tốt; nếu hệ sinh thái tốt, ngay cả khi hiệu năng chỉ đạt 60% cũng sẽ có người sử dụng.

Có thể nói, hệ sinh thái phần mềm là rào cản vững chắc nhất trên phân khúc GPU, và năng lực của NVIDIA trong lĩnh vực này cũng khó thay thế.

Sau hơn một thập kỷ phát triển, hệ sinh thái CUDA đã sở hữu hơn 4 triệu nhà phát triển, hàng trăm nghìn mô hình mã nguồn mở và chuỗi công cụ bên thứ ba đầy đủ, bao phủ các lĩnh vực như đào tạo AI, suy luận, xử lý đồ họa và tính toán khoa học, tạo nên rào cản hệ sinh thái không có đối thủ.

The IDC data shows that over 95% of AI models worldwide are developed based on the CUDA ecosystem. Domestic GPUs, supported by policy, require long-term collaboration with the industrial chain and sufficient patience from the media and capital markets.

Vào tháng 1 năm nay, Zhipu đã hợp tác với Huawei để mở nguồn mô hình tạo hình ảnh thế hệ mới GLM-Image, mô hình này được huấn luyện toàn bộ quy trình từ xử lý dữ liệu đến huấn luyện mô hình trên thiết bị Huawei Ascend Atlas 800T A2 và khung AI MindSpore, là mô hình đa phương thức SOTA đầu tiên được huấn luyện hoàn toàn trên chip trong nước;

Mole Thread cùng với Viện Nghiên cứu Trí tuệ Nhân tạo Bắc Kinh đã hoàn thành quá trình huấn luyện toàn bộ mô hình RoboBrain 2.5 do Tự chủ phát triển, dựa trên cụm máy tính thông minh MTT S5000 và khung FlagOS-Robo. Thành tựu này lần đầu tiên xác minh tính khả thi của cụm máy tính trong nước trong việc huấn luyện các mô hình lớn về trí tuệ thể chất.

Có thể thấy, GPU trong nước đã có những bước đột phá trong khả năng tương thích và xây dựng hệ sinh thái, đang tiến từ việc “đột phá điểm đơn” ở khía cạnh suy luận sang “tương thích dần dần” ở khía cạnh đào tạo — đây là một bước tiến đáng kể.

Summary

Nhìn chung, trong bối cảnh nhập khẩu chip tiên tiến từ nước ngoài bị cản trở, nên kết hợp “Đông - Tây” để đi bằng hai chân, đồng thời tập trung hỗ trợ mạnh mẽ các chip tính toán trong nước nhằm đáp ứng nhu cầu thị trường cấp thiết.

Tính thực tế của nhu cầu là không thể phủ nhận, “thuyết bong bóng” vẫn tồn tại, nhưng tiếng nói này không ngày càng lớn mạnh. Sự nhiệt tình của thị trường toàn cầu đối với việc xây dựng AI đã vượt qua mọi giai đoạn đầu phát triển của bất kỳ ngành công nghiệp nào trước đây.

Từ đầu năm đến nay, thị trường vốn toàn cầu lại chứng kiến chu kỳ AI siêu cấp, giá cổ phiếu của Samsung, SK Hynix, Broadcom và TSMC liên tục lập đỉnh mới; trên thị trường trong nước, các công ty công nghệ cứng như Cambricon cũng tăng trưởng mạnh mẽ, giá trị thị trường của trung tâm quang module lớn nhất, InnoLight, từng vượt cả Maotai.

Nhìn lại lịch sử phát triển ngành bán dẫn Hàn Quốc, Hàn Quốc đã huy động toàn lực hỗ trợ ngành công nghiệp chip lưu trữ, vượt qua những thời khắc đen tối nhất và cuối cùng đánh bại Nhật Bản, trở thành ông vua tuyệt đối của ngành công nghiệp lưu trữ toàn cầu.

Dù là chip lưu trữ, chip điện thoại, hay thậm chí là chip AI hiện nay, Trung Quốc vẫn đang trong giai đoạn đuổi theo, và đây không phải là điều có thể đạt được trong một sớm một chiều. Tuy nhiên, với thị trường khổng lồ, nguồn nhân lực AI không ngừng xuất hiện và sức mạnh vốn lớn mạnh, GPU nội địa đã bắt đầu thể hiện khả năng tương thích nhất định, có thể đáp ứng nhiều nhu cầu thực tế của các doanh nghiệp AI.

Trong cuộc đối弈 AI về vận mệnh quốc gia, Trung Quốc và Hoa Kỳ vừa là đối thủ, vừa có những công nghệ, thị trường và nguồn lực mà bên kia cần.

Bài viết này đến từ tài khoản WeChat: JuChao WAVE, biên tập: Dương Húc Nhiên, tác giả: Tạ Trác Phong, tiêu đề gốc: “Vấn đề năng lực tính toán dưới cuộc cạnh tranh AI Trung-Mỹ | JuChao”