ByteDance và Oracle áp dụng CPU Arm AGI, Arm dự báo doanh thu 20 tỷ USD vào năm 2028

Ngày 3 tháng 6, Tâm Đông Tây đưa tin, CEO của Arm, Rene Haas, đã có bài phát biểu chủ đề trong khuôn khổ Computex 2026 hôm qua, thông báo rằng ByteDance và Oracle đã triển khai chip CPU trung tâm dữ liệu tự phát triển của Arm là Arm AGI.

ByteDance

Tháng trước, Arm đã tăng gấp đôi dự báo nhu cầu đối với CPU Arm AGI, dự kiến đạt 2 tỷ USD (tương đương khoảng 13,5 tỷ nhân dân tệ) trong năm tài chính 2027 và 2028, đồng thời dự kiến sản phẩm này sẽ tạo ra doanh thu hàng năm 15 tỷ USD (tương đương khoảng 101,6 tỷ nhân dân tệ) trong vòng khoảng năm năm.

Rene Haas đã chia sẻ trong một cuộc phỏng vấn với truyền thông nước ngoài hôm qua rằng việc Mỹ ngăn chặn xuất khẩu CPU AI sang Trung Quốc “gần như là không thể”, vì CPU AI được sử dụng rộng rãi, khó xác định những CPU nào được thiết kế đặc biệt cho AI, và khó thiết lập các ngưỡng hiệu năng cụ thể cùng giới hạn băng thông bộ nhớ như đối với chip AI.

Thứ Hai tuần này, NVIDIA đã ra mắt siêu chip RTX Spark và CPU trung tâm dữ liệu Vera dựa trên kiến trúc Arm, ngay trong đêm đó, cổ phiếu của Arm tăng liên tục, đến khi đóng cửa vào thứ Ba, mức tăng đạt 16%. Tính từ đầu năm đến nay, cổ phiếu của Arm đã tăng tổng cộng 263%.

ByteDance

Người sáng lập và CEO của NVIDIA, Huang Renxun, cũng đến tham dự bài phát biểu của Rene Haas vào thứ Ba, ngay khi lên sân khấu đã đùa: “Hãy xem cổ phiếu của anh ấy, mỗi khi tôi ra mắt một sản phẩm, cổ phiếu của anh ấy lại tăng, còn tôi thì chẳng có chuyện gì xảy ra.”

ByteDance

Rene Haas đã khéo léo phản hồi: “Trước đây bạn là cổ đông, sau đó bạn đã bán cổ phần.”

Huang Renxun lập tức đáp lại: “Vâng, vâng, ôi, tôi cần tiền mặt.”

Hai người dường như là bạn cũ, trò chuyện sôi nổi trong 15 phút, liên tục diễn tiểu phẩm, ném và bắt lời đùa khiến khán giả cười ngặt nghẽo, còn chính họ cũng thường cười đến mức lộ hết cả răng.

ByteDance

Đây thực sự là cuộc trò chuyện trong giới công nghệ sôi động nhất mà tôi từng chứng kiến gần đây.

Ví dụ, sau khi khen ngợi rất nhiều về CPU Arm, Huang Renxun kết luận: “Từ khóa là ‘Arm hoàn hảo’.”

Rene Haas tiếp lời: “Một từ khóa khác là ‘cảm ơn’.”

Huang Renxun lập tức nói tiếng Trung: “Đâu có, đâu có, đừng khách sáo.”

Sau đó, Rene Haas phàn nàn: “Bây giờ cuộc so tài này không công bằng rồi.” (ý nói Hoàng nói tiếng Trung là không công bằng)

Sau đó, Huang Renxun thêm một câu tử tế: “You're welcome.”

ByteDance

Huang Renxun còn đùa rằng “Một trong những lợi thế tuyệt vời nhất của Arm là không cần lo lắng về các vấn đề chuỗi cung ứng”, chuỗi cung ứng của IP là điện tử, có thể sử dụng bất kỳ lượng điện tử nào.

“Vì vậy, tôi yêu mô hình kinh doanh của nó,” Huang Renxun bắt đầu nhớ lại, “Các bạn biết đấy, tôi đã từng thử, tôi từng nỗ lực trở thành Arm, tôi từng làm việc cùng Rene trước đây, rồi chúng tôi lại cố gắng hợp tác lần nữa, nhưng điều đó cũng chẳng quan trọng lắm, tôi vẫn rất buồn.”

Rene Haas nói: “Nếu hai công ty sáp nhập, chúng ta sẽ trở thành công ty lớn nhất thế giới.”

“Tôi thích điều này,” Huang Renxun cười nói, “Đây thực sự là một ý tưởng hay.”

Có vẻ như cả hai đều cảm thấy tiếc nuối vì Nvidia không thể mua lại Arm.

Đến phần tặng quà, Rene Haas đã tạo nên “khoảnh khắc hoài niệm” khi tặng Huang Renxun một chiếc máy tính xách tay Microsoft Surface RT trang bị chip NVIDIA Tegra 3, đồng thời bắt chước chữ ký của Huang Renxun để ký tên mình.

ByteDance

NVIDIA Tegra 3 là bộ xử lý di động bốn nhân Arm đầu tiên trên thế giới mà NVIDIA ra mắt vài năm trước.

Huang Renxun chỉ vào bức ảnh trên màn hình lớn và tự khen: “Chúng ta đã trải qua những gì khi còn trẻ? Tôi phải nói rằng, tôi cảm thấy mình trông trẻ hơn. Các bạn có đồng ý không? Tôi cảm thấy mình chăm sóc bản thân rất tốt.”

ByteDance

Rene Haas cười đến mờ mắt.

ByteDance

Sau đó, Huang Renxun giật lấy món quà, giọng nói nâng cao: “Đây là dành cho tôi sao? Nếu tôi ký tên rồi trả lại cho bạn, nó sẽ trở thành một báu vật.”

Rene Haas nói: “Không, bạn ký xong thì trả lại cho tôi, ở đây có hợp đồng, có hóa đơn, chúng tôi không thể làm vậy. Chúng tôi biết trò chơi đó.”

ByteDance

Trở lại chủ đề ngành công nghiệp nghiêm túc, trong bài phát biểu này, Rene Haas đã hỏi Huang Renxun một số câu hỏi then chốt:

1. Tại sao phải làm RTX Spark?

2. Làm thế nào để cân nhắc giữa tác nhân cục bộ và tác nhân trên đám mây?

3. Agent có thực sự có thể hoạt động độc lập mà không cần hệ điều hành cơ sở không?

4. Huang Renxun nhìn nhận các yếu tố hạn chế tăng trưởng trong vài năm tới như thế nào?

Huang Renxun còn vẽ ra một viễn cảnh phát triển thị trường: Hiện nay, ngành công nghiệp máy tính bị giới hạn bởi số lượng người sử dụng máy tính; với sự xuất hiện của các tác nhân thông minh có thể tự sử dụng máy tính, chúng ta sẽ không còn là một tỷ người sử dụng máy tính, mà là hàng chục tỷ, thậm chí có thể nhiều hơn số lượng tác nhân thông minh, robot và xe tự hành sử dụng máy tính.

Vậy nên vấn đề là quy mô của các sản phẩm máy tính có thể lớn đến mức nào?

“Tôi cảm thấy rằng, đến nay, kết cục đã được định đoạt, ngành công nghiệp quy mô hàng chục nghìn tỷ USD này có thể lớn gấp mười lần, và chúng ta đang trên đường tiến lên,” Huang Renxun nói.

Rene Haas cũng chia sẻ những tiến bộ mới nhất và kế hoạch tiếp theo của Arm trong lĩnh vực CPU cho PC và trung tâm dữ liệu thông minh.

Anh ấy cũng nhắc đến việc đã trò chuyện với ngài Wei Zhejia, Chủ tịch kiêm Tổng giám đốc TSMC, và ngài Zhang Xiaoqiang, Phó Chủ tịch cấp cao kiêm COO, trong tuần này, họ cho biết chưa bao giờ chứng kiến chu kỳ ngành bán dẫn liên tiếp bốn năm lại thịnh vượng đến vậy.

01. Bài học nhỏ của Huang Renxun: Thiết kế PC đại lý thông minh như thế nào?

Huang Renxun đã trả lời từng câu hỏi quan trọng mà Rene Haas đặt ra, những quan điểm này rất có giá trị tham khảo đối với sự phát triển của AI PC và tư duy thiết kế chip trong tương lai.

1. Tại sao lại phát triển sản phẩm RTX Spark?

PC và hệ điều hành đã tồn tại 40 năm, lập trình thủ công sẽ bị thay thế bởi các tác nhân thông minh sử dụng các công cụ trong PC. Vậy tương lai nên tái cấu trúc kiến trúc, thay đổi hệ điều hành và phát minh lại máy tính như thế nào?

NVIDIA nhận ra rằng các hệ thống tác nhân cần CPU mạnh mẽ, đó là lý do họ chọn Arm.

RTX Spark siêu chip trang bị CPU 20 nhân, sở hữu hiệu năng đơn luồng xuất sắc, bộ nhớ cần lưu trữ nhiều tham số.

Vì vậy, NVIDIA đã tạo ra một định dạng dữ liệu mới có tên NVFP4 để nén các ngôn ngữ khổng lồ, xây dựng mô hình càng nhiều càng tốt và tích hợp AI cực kỳ thông minh vào bộ nhớ hệ thống.

NVIDIA cũng mong muốn kết hợp CUDA và CUDA Tile được sử dụng để tăng tốc tính toán, tích hợp xử lý tensor core vào một bộ xử lý duy nhất.

2. Làm thế nào để cân nhắc giữa các tác nhân chạy cục bộ và các tác nhân chạy trên đám mây?

Những chiếc PC Arm này sẽ trở thành các tác nhân tự vận hành.

Hôm nay, nếu bạn để laptop ở nhà hoặc khách sạn, bạn sẽ không thể sử dụng nó.

Nhưng trong tương lai, bạn chỉ cần cầm điện thoại lên là có thể nói chuyện từ xa với PC và ra lệnh cho các tác nhân thực hiện công việc.

Huang Renxun nói: “Bản chất của thiết bị tính toán cá nhân là bạn có thể làm bất cứ điều gì với thiết bị này mà không cần tốn thời gian.”

Sử dụng một số API trên đám mây thì gọi API trên đám mây. Mọi việc có thể làm tại chỗ thì hãy hoàn thành trên máy tính.

3. Khi chạy tác nhân, hệ điều hành có quan trọng không? Nếu coi tác nhân là hệ điều hành, liệu nó có thực sự có thể tự hoàn thành công việc mà ít phụ thuộc vào hệ điều hành nền tảng?

The importance of the operating system remains unchanged, and may even be more important than before.

Đây cũng là điểm gây tranh cãi thường được nhắc đến khi AI xuất hiện — “phần mềm đã chết”, nhưng Huang Renxun cho rằng không có gì sai lầm hơn thế.

Con người có thể chỉ hiểu khoảng một đến hai phần trăm các tính năng của nhiều công cụ.

But now, you can tell the agent what you want.

Agent rất rõ cách sử dụng các công cụ này vì chúng đã đọc tệp Skills, trong đó Skills về cơ bản là hướng dẫn sử dụng công cụ đó, nên bây giờ nó sẽ sử dụng MCP hoặc CLI được kết nối với công cụ này để mở khóa tất cả các công cụ này và đáp ứng nhu cầu của bạn.

Các công cụ này sẽ có giá trị hơn bao giờ hết, chúng chạy trên hệ điều hành, vì vậy chúng ta cần hệ thống Windows, và chúng ta sẽ cần những API và công cụ này trong một thời gian dài.

4. Những yếu tố hạn chế tăng trưởng trong những năm tới là gì?

“Chúng tôi đã thấy hạn chế ở hầu hết mọi khía cạnh,” Huang Renxun nói, NVIDIA đã lên kế hoạch từ trước và lập kế hoạch chuỗi cung ứng rất tốt, năm nay tăng trưởng gần 100% so với cùng kỳ năm trước, năm tới sẽ đạt mức tăng trưởng rất nhanh, chuỗi cung ứng có thể hỗ trợ sự tăng trưởng của NVIDIA.

But demand is actually higher.

Huang Renxun cho biết, các mô hình ứng dụng tính toán mới thực sự đòi hỏi một kiến trúc mới, và một bước đột phá lớn hiện nay là các tác nhân có thể tạo ra AI thực dụng, đây là lý do vì sao sự tăng trưởng của mọi người đều đáng kinh ngạc đến vậy.

Khi AI trở nên thiết thực, các token được tạo ra có thể mang lại lợi nhuận. Khi token tạo ra lợi nhuận, mọi người đều muốn tạo ra token tăng gấp nghìn tỷ lần.

Hiện nay, AI không chỉ là chatbot trả lời câu hỏi, mà còn có thể suy nghĩ, sử dụng công cụ, đọc, tiếp tục suy nghĩ, lập kế hoạch và thử nghiệm, dẫn đến nhu cầu về số lượng token được tạo ra tăng mạnh. Khả năng sinh lời của token đang thúc đẩy nhu cầu về năng lực tính toán, tạo ra hiệu ứng cộng hưởng.

02. Chip ARM cho PC: Apple, Google, Qualcomm đều khen ngợi, hợp tác chặt chẽ với NVIDIA và MediaTek

Trong lĩnh vực PC, Google, Apple, NVIDIA, Qualcomm và các công ty khác đều phát triển chip PC dựa trên kiến trúc Arm, và Arm đã hợp tác với Apple, Google, Microsoft và các công ty khác trong vài thập kỷ.

ByteDance

Rene Haas cho biết, Arm rất vinh dự khi hợp tác với NVIDIA để phát triển siêu chip RTX Spark dựa trên kiến trúc Arm. CPU tùy chỉnh Grace của chip này có 20 lõi, mỗi lõi đều dựa trên kiến trúc Arm.

“Tôi tin đây là con chip có số lượng lõi CPU nhiều nhất trên thị trường máy tính xách tay hiện nay,” Rene Haas nói, khi kết hợp với GPU Blackwell, chip này đạt hiệu năng AI FP4 lên đến 1 PFLOPS, cùng dung lượng bộ nhớ thống nhất 128GB và hỗ trợ hoàn toàn bản gốc hệ điều hành Windows trên nền tảng Arm.

ByteDance

Vai trò của Arm trong điều này là hợp tác chặt chẽ với NVIDIA và MediaTek thông qua chiến lược hệ thống tính toán của Arm.

The compute subsystem integrates all components required to build a customized SoC—CPU, GPU, system IP, memory controller—into a complete end-solution system.

Arm đã hợp tác với MediaTek để hoàn thành công việc này, và MediaTek có thể cung cấp giải pháp toàn diện.

Rene Haas cũng đã trình bày lộ trình Arm CSS dành cho PC trí tuệ, thế hệ tiếp theo sẽ tối ưu hóa các lõi CPU tùy chỉnh được thiết kế riêng cho PC.

ByteDance

03. ARM tự phát triển CPU agent thông minh: OpenAI và ByteDance đều là đối tác

Rene Haas cho biết hơn 25 tỷ chip Arm được sản xuất tại Đài Loan, và CPU tự thiết kế đầu tiên của Arm, Arm AGI, được công bố vào tháng 3 năm nay, được sản xuất bởi TSMC tại Đài Loan.

ByteDance

Arm AGI CPU được thiết kế riêng cho hạ tầng tác nhân AI, sử dụng quy trình sản xuất 3nm của TSMC và thiết kế song Chiplet, tích hợp 136 lõi hiệu năng cao Arm Neoverse V3 trên một CPU, trang bị bộ nhớ đệm L2 2MB, hỗ trợ tần số xung nhịp 3,7GHz, cung cấp băng thông bộ nhớ 6GB/s mỗi lõi, độ trễ bộ nhớ dưới 100ns, sử dụng giao diện PCIe Gen 6 với 96 kênh và hỗ trợ giao thức CXL 3, TDP đạt 300W.

Các đối tác của Arm AGI CPU bao gồm OpenAI, Meta, Cerebras, SAP, SK telecom, Rebellions và các công ty khác. Rene Haas tuyên bố rằng nhu cầu thị trường đối với chip này mạnh mẽ hơn so với lúc mới ra mắt, với sự gia nhập của Oracle và ByteDance, xác nhận rằng Arm AGI CPU có thể giải quyết các vấn đề thực tế.

Tất nhiên, không phải tất cả các doanh nghiệp đều muốn mua Arm AGI CPU. Đối với các doanh nghiệp quan tâm đến việc tự phát triển chip, Arm cung cấp nhiều IP và hệ thống con tính toán (CSS), cam kết mang đến cho khách hàng bất kỳ giải pháp nào họ mong muốn.

ByteDance

Tại trung tâm dữ liệu, Axion CPU được kết nối với chip AI mới nhất của Google là TPU 8t và TPU 8i là một chip sử dụng công nghệ Arm Neoverse, giúp giảm 60% công suất tiêu thụ so với CPU x86 mà không làm giảm hiệu năng.

Amazon cũng sử dụng kiến trúc Arm cho CPU tự phát triển Graviton. CEO của Amazon, Andy Jassy, từng tiết lộ: “Hai khách hàng lớn đã hỏi liệu họ có thể mua toàn bộ các phiên bản Graviton của chúng tôi trong năm 2026 không.”

NVIDIA cũng vừa công bố CPU thế hệ mới Vera dựa trên Arm vào tuần này.

ByteDance

Arm kế hoạch biến CPU tự phát triển thành một sự nghiệp dài hạn và trình bày lộ trình 3 năm.

ByteDance

CPU AGI thế hệ thứ hai của Arm đang được phát triển, với nhiều lõi hơn, hiệu suất năng lượng cao hơn và hiệu năng tốt hơn so với thế hệ trước.

CPU AGI thế hệ thứ ba của Arm cũng sắp ra mắt.

Tất cả đều dựa trên hệ thống con tính toán mà Arm định gửi kèm cùng chip.

04. Kết luận: Sau sự bùng nổ của tác nhân thông minh, ánh đèn chiếu vào CPU trong cuộc đua về sức mạnh tính toán

Các bài phát biểu của các nhà lãnh đạo ngành chip như Huang Renxun, Chen Liwu, Rene Haas trong tuần này đã phản ánh một số xu hướng chung trong ngành CPU – các tác nhân thông minh thay đổi logic tính toán, mở ra một cánh cửa cơ hội thị trường hoàn toàn mới cho CPU.

Trong vài năm qua, trọng tâm của cuộc cạnh tranh về công suất tính toán chủ yếu tập trung vào GPU, vốn không thể thiếu trong việc huấn luyện AI. Tuy nhiên, sau khi các ứng dụng tác nhân thông minh bùng nổ trong năm nay, nhu cầu suy luận của tác nhân ngày càng gia tăng, đòi hỏi nhiều quản lý trạng thái, gọi công cụ và sắp xếp quy trình — những nhiệm vụ này là dạng tập trung vào CPU.

Intel và AMD vẫn đang củng cố lợi thế của bộ xử lý x86 trong lĩnh vực trung tâm dữ liệu. Trong khi đó, các người chơi mới nổi, bao gồm Amazon, Google và NVIDIA, cơ bản đều đang đầu tư vào tuyến đường CPU Arm. Ngay cả Arm cũng đã đưa ra “quyết định đi ngược lại truyền thống” khi chính thức gia nhập thị trường CPU trung tâm dữ liệu năm nay.

Một hiện tượng rất thú vị là ngành bán dẫn đang hình thành xu hướng tích hợp dọc mới.

Các ông lớn chip với danh mục sản phẩm phong phú như NVIDIA, Intel, AMD ngày càng nhấn mạnh tính toàn diện của mình, và việc tôn vinh lợi thế của các giải pháp riêng đều dẫn đến một mục tiêu chung: hiệu suất năng lượng cao hơn, có đủ mọi thứ cần thiết, tiết kiệm chi phí nhiều hơn.

Các doanh nghiệp hàng đầu trong các ngành khác nhau cũng lần lượt "bước sang lĩnh vực khác": các ông lớn điện toán đám mây mở rộng xuống dưới để tự nghiên cứu và phát triển chip, các doanh nghiệp chip mở rộng lên trên để cung cấp giải pháp thiết bị hoàn chỉnh, và các doanh nghiệp IP bán dẫn mở rộng lên trên để nghiên cứu và phát triển chip.

Trong bối cảnh token trở thành đồng tiền cạnh tranh mới và nhu cầu về sức mạnh tính toán tăng đột biến, cách thức để tạo ra nhiều tính toán hiệu quả hơn trên mỗi watt sẽ là trục chính của cuộc cạnh tranh chip trong tương lai.

Bài viết này đến từ tài khoản WeChat “Tâm Đồ Tây”, tác giả: ZeR0, biên tập: Mạc Ảnh