Báo cáo Stanford HAI: Việc áp dụng AI vượt qua PC và Internet, khoảng cách 2,7% giữa Mỹ và Trung Quốc

icon MarsBit
Chia sẻ
AI summary iconTóm tắt

Trung tâm Con người và Trí tuệ Nhân tạo Stanford vừa công bố Báo cáo AI Index 2026, đây là bản kiểm tra sức khỏe hàng năm uy tín nhất trong lĩnh vực AI. Trong năm qua, các nhà nghiên cứu của Stanford đã đưa ra kết luận cốt lõi thông qua một loạt quan sát: AI đang được toàn cầu tiếp nhận với tốc độ nhanh hơn cả PC và Internet, nhưng các thể chế xã hội, thị trường lao động và công cụ đo lường của con người đều đang tụt hậu.

AI đang nước rút, con người vẫn đang tìm giày. Mười hình ảnh này sẽ cho bạn thấy những nơi nào AI chạy nhanh hơn con người.

1

Việc sử dụng bài kiểm tra để đánh giá AI vốn dĩ không có ý nghĩa.

Claude Opus

Các tiêu đề như “AI vượt qua con người” đều dựa trên độ tin cậy của các benchmark. Tuy nhiên, báo cáo của Stanford phát hiện rằng trong benchmark toán học GSM8K được sử dụng rộng rãi, gần 42% các câu hỏi là không hợp lệ. Các bài kiểm tra khác cũng bị nghi ngờ bị “luyện đề”; các mô hình có thể đạt điểm cao sau khi được huấn luyện trên dữ liệu kiểm tra, nhưng điều đó không có nghĩa là chúng trở nên thông minh hơn. Nhiều công ty từ chối công bố kết quả benchmark liên quan. Một trong những tác giả của báo cáo, Gil, nói: “Việc không công bố kết quả bản thân nó đã có thể nói lên một số điều.”

2

Sự khác biệt thực chất giữa Trung Quốc và Mỹ đã biến mất, chỉ còn 2,7%

Claude Opus

Tính đến tháng 3 năm 2026, mô hình mạnh nhất của Mỹ, Claude Opus 4.6, có điểm Elo là 1503, trong khi mô hình mạnh nhất của Trung Quốc theo sát ngay sau với khoảng cách chỉ 2,7%. Trong năm qua, các mô hình của hai nước nhiều lần luân phiên dẫn đầu, và vào tháng 2 năm 2025, DeepSeek R1 từng bằng điểm với mô hình mạnh nhất của Mỹ.

Tuy nhiên, lợi thế AI của hai nước hoàn toàn khác nhau. Mỹ có các mô hình mạnh hơn, nhiều vốn hơn và sở hữu 5.427 trung tâm dữ liệu, gấp hơn 10 lần bất kỳ quốc gia nào khác. Trung Quốc lại dẫn đầu về số lượng bài báo AI, bằng sáng chế và triển khai robot. Nói đơn giản, Mỹ thắng nhờ năng lực tính toán và tiền bạc, còn Trung Quốc thắng nhờ nghiên cứu và sản xuất.

3

Các mô hình tiên tiến đang hội tụ, mức độ thông minh tương đương nhau

Claude Opus

Tính đến tháng 3 năm 2026, Anthropic (1503), xAI (1495), Google (1494) và OpenAI (1481) đang nằm trong một khoảng cực hẹp. Điều này có nghĩa là "mô hình nào mạnh hơn" đã không còn là trọng tâm cạnh tranh. Trọng tâm đang chuyển sang chi phí, độ tin cậy và tối ưu hóa theo lĩnh vực cụ thể—điều này cũng giải thích tại sao Anthropic đang phát triển Advisor Tool (giảm chi phí), Google đang mua Wiz (an ninh đám mây), và OpenAI đang mua các công ty cấp ứng dụng khác nhau (mở rộng bối cảnh). Trong bối cảnh hiệu suất trí tuệ của các mô hình ngày càng trở nên đồng nhất, cần tạo sự khác biệt ở những khía cạnh khác.

4

Việc làm của các nhà phát triển từ 22 đến 25 tuổi giảm gần 20%

Claude Opus

Trong ba năm, AI sinh thành đã đạt tỷ lệ chấp nhận trên quy mô dân số vượt quá 53%, và 88% các tổ chức đang sử dụng AI. Tuy nhiên, tác động đến việc làm không đồng đều. Nghiên cứu năm 2025 của các nhà kinh tế học tại Stanford phát hiện rằng số lượng nhân viên phát triển phần mềm ở độ tuổi 22-25 đã giảm gần 20% kể từ năm 2022, trong khi các nhóm tuổi lớn hơn vẫn tiếp tục tăng trưởng. Khảo sát năm 2025 của McKinsey cho thấy 1/3 các tổ chức dự kiến trong năm tới sẽ giảm nhân sự do AI, với các đợt cắt giảm tập trung vào vận hành dịch vụ, chuỗi cung ứng và kỹ sư phần mềm.

Dữ liệu tổng thể chưa cho thấy tình trạng thất nghiệp quy mô lớn, nhưng điều này đủ để cho thấy thị trường lao động đang như ếch luộc trong nước ấm, khủng hoảng đang dần hình thành.

5

Tốc độ tiếp nhận vượt quá PC và internet, Hoa Kỳ chỉ xếp thứ 24

Claude Opus

Trong ba năm, tỷ lệ chấp nhận quy mô dân số của AI tạo sinh đạt 53%, tốc độ này nhanh hơn cả máy tính cá nhân và internet. Nhưng điểm dữ liệu phản trực giác nhất là: Mỹ dẫn đầu toàn cầu về đầu tư AI và phát triển mô hình, nhưng tỷ lệ chấp nhận quy mô dân số chỉ là 28,3%, xếp thứ 24 toàn cầu. Các tiểu vương quốc Ả Rập thống nhất đạt 64%, Singapore đạt 60,9%. Quốc gia chi nhiều tiền nhất lại sử dụng ít nhất.

6

Đầu tư toàn cầu vào AI đạt 581,7 tỷ USD, Mỹ gấp 23 lần Trung Quốc, nhưng...

Claude Opus

Tổng đầu tư toàn cầu vào các doanh nghiệp AI năm 2025 đạt 581,7 tỷ USD, tăng 129,9% so với cùng kỳ năm trước. Đầu tư tư nhân vào AI tại Mỹ đạt 285,9 tỷ USD, gấp 23 lần Trung Quốc và 48,5 lần Anh. Riêng bang California đã chiếm hơn 75% tổng đầu tư của Mỹ. Các giao dịch lớn cũng rất sôi động: OpenAI huy động được 40 tỷ USD với định giá 3.000 tỷ USD; Anthropic huy động được 13 tỷ USD với định giá 1.830 tỷ USD; Cursor huy động được 2,3 tỷ USD với định giá 29,3 tỷ USD.

Tuy nhiên, có một thông tin ẩn ở đây: tại Trung Quốc, các quỹ nhà nước đã rót khoảng 184 tỷ USD vào các doanh nghiệp AI từ năm 2000 đến năm 2023, số tiền này không được tính vào thống kê đầu tư tư nhân. Khi cộng thêm phần này, khoảng cách vốn giữa Trung Quốc và Mỹ có thể nhỏ hơn nhiều so với con số trên giấy tờ.

7

Agent AI: Từ khả năng trò chuyện sang khả năng thực hiện việc, nhưng vẫn có tỷ lệ thất bại 1/3

Claude Opus

Năm 2025 là năm của AI Agent. Độ chính xác của OSWorld (kiểm tra khả năng AI hoàn thành nhiệm vụ trên hệ điều hành) tăng vọt từ 12% lên 66,3%, chỉ kém 6 điểm phần trăm so với hiệu suất con người. WebArena đạt 74,3%, Cybench (nhiệm vụ an ninh mạng) tăng từ 15% lên 93%.

Tuy nhiên, nhìn chung, Agent vẫn có tỷ lệ thất bại khoảng 1/3. Hơn nữa, việc triển khai thực tế trong doanh nghiệp vẫn chỉ ở con số đơn vị—hơn 2/3 số người được hỏi trong hầu hết các kịch bản kinh doanh cho biết hoàn toàn không sử dụng AI Agent. Còn một khoảng cách lớn giữa tiến bộ trên Benchmark và việc triển khai thực tế.

8

89% robot sống trong phòng thí nghiệm

Claude Opus

AI đã rất mạnh trong thế giới ảo, nhưng vẫn còn yếu trong thế giới vật lý. Tỷ lệ thành công trong thao tác robot trong môi trường mô phỏng phần mềm là 89,4%, nhưng trong các nhiệm vụ gia đình thực tế, tỷ lệ này chỉ đạt 12,4%. Một bên là phòng thí nghiệm sạch sẽ, bên kia là ngôi nhà bừa bộn — trong môi trường thực tế như vậy, sự tham gia của robot vẫn còn rất hạn chế.

Tuy nhiên, xe tự lái là ngoại lệ: Waymo thực hiện khoảng 450.000 chuyến đi mỗi tuần, Apollo Go hoàn thành khoảng 11 triệu chuyến đi hoàn toàn không người lái trong năm 2025.

9

Chuyên gia so với công chúng: Khoảng cách nhận thức 73% so với 23%

Claude Opus

Báo cáo trích dẫn khảo sát của Pew tiết lộ một sự chia rẽ đáng kinh ngạc: 73% chuyên gia AI cho rằng AI sẽ có tác động tích cực đến công việc, nhưng chỉ có 23% công chúng Mỹ đồng ý—hoàn toàn phân cực.

Một dữ liệu thú vị khác: Trong tất cả các quốc gia được khảo sát, người Mỹ có mức độ tin tưởng thấp nhất vào việc chính phủ quản lý AI. Các chuyên gia cũng lạc quan hơn về triển vọng của AI trong giáo dục và y tế, nhưng cả hai bên đều cho rằng AI sẽ gây hại cho bầu cử và các mối quan hệ cá nhân.

10

GPT-4o một năm dùng nước vượt quá 12 triệu người, điện năng tiêu thụ có thể duy trì toàn bộ tiểu bang New York

Claude Opus

Sự tiến bộ của AI đi kèm với chi phí môi trường. Các trung tâm dữ liệu AI toàn cầu hiện nay có thể tiêu thụ 29,6 GW điện, một mức độ đủ để cung cấp điện cho toàn bang New York trong giờ cao điểm. Chỉ riêng mô hình GPT-4o của OpenAI, lượng nước tiêu thụ hàng năm có thể vượt quá nhu cầu nước uống của 12 triệu người.

Những khoản chi tiêu khổng lồ này được đổ vào từng mô hình huấn luyện, nhưng đồng thời, chuỗi cung ứng chip phía sau các mô hình này cực kỳ mong manh. Hoa Kỳ sở hữu phần lớn trung tâm dữ liệu AI toàn cầu, nhưng gần như mọi con chip AI tiên tiến đều được sản xuất bởi một công ty duy nhất ở Đài Loan — TSMC. Tất cả sức mạnh tính toán, tất cả đầu tư và mọi tiến bộ của mô hình đều dựa trên nền tảng vật lý này.

Đây chỉ là một phần nhỏ của báo cáo, nhưng đủ để thấy rằng chúng ta đang đón nhận một công nghệ mà mình vẫn chưa hoàn toàn hiểu rõ với tốc độ nhanh nhất trong lịch sử.

Báo cáo đầy đủ còn bao gồm nhiều khía cạnh khác như an toàn AI, động thái quản lý, xu hướng nghiên cứu khoa học, v.v. Rất khuyến nghị những bạn quan tâm đọc toàn bộ báo cáo gốc, đường dẫn 👉🏻: https://hai.stanford.edu/ai-index

Bài viết này đến từ tài khoản WeChat “APPSO”, tác giả: APPSO – Khám phá sản phẩm của tương lai

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.