Biên tập viên: Các phòng thí nghiệm AI của Trung Quốc đang trở thành một lực lượng ngày càng không thể bỏ qua trong cuộc cạnh tranh mô hình lớn toàn cầu. Lợi thế của họ không chỉ đến từ số lượng nhân tài dồi dào, năng lực kỹ thuật mạnh mẽ và tốc độ lặp lại nhanh, mà còn xuất phát từ một cách tổ chức rất thực tế: ít nói về khái niệm, nhiều làm mô hình; ít nhấn mạnh vào cá nhân nổi bật, nhiều chú trọng vào thực thi đội nhóm; ít phụ thuộc vào các dịch vụ bên ngoài, và có xu hướng tự kiểm soát toàn bộ nền tảng công nghệ cốt lõi.

Sau khi thăm hỏi nhiều phòng thí nghiệm AI hàng đầu Trung Quốc, tác giả Nathan Lambert nhận thấy hệ sinh thái AI của Trung Quốc không hoàn toàn giống với của Mỹ. Mỹ chú trọng hơn vào các mô hình sáng tạo, đầu tư vốn và ảnh hưởng cá nhân của các nhà khoa học hàng đầu; trong khi Trung Quốc lại giỏi trong việc nhanh chóng bắt kịp các hướng đã có, thông qua việc mở nguồn, tối ưu hóa kỹ thuật và sự đóng góp của một lượng lớn nhà nghiên cứu trẻ, giúp nâng cao năng lực mô hình lên ngưỡng前沿 một cách nhanh chóng.

Điều đáng quan tâm nhất không phải là AI của Trung Quốc đã vượt qua Mỹ chưa, mà là hai con đường phát triển khác nhau đang hình thành: Mỹ giống như một cuộc đua前沿 do vốn và các phòng thí nghiệm nổi bật thúc đẩy, trong khi Trung Quốc giống như một cuộc đua công nghiệp được thúc đẩy bởi năng lực kỹ thuật, hệ sinh thái mã nguồn mở và ý thức tự chủ công nghệ.

Điều này có nghĩa là, trong tương lai, cuộc cạnh tranh AI không chỉ là cuộc đua trên bảng xếp hạng mô hình, mà còn là cuộc cạnh tranh về năng lực tổ chức, hệ sinh thái nhà phát triển và khả năng thực thi ngành công nghiệp. Sự thay đổi thực sự của AI Trung Quốc nằm ở chỗ nó không còn chỉ đơn thuần sao chép Thung lũng Silicon, mà đang tham gia vào các ranh giới toàn cầu theo cách riêng của mình.

Dưới đây là bản gốc:

Ngồi trên chuyến tàu cao tốc mới chạy từ Hàng Châu đến Thượng Hải, tôi nhìn ra ngoài cửa sổ, thấy những dãy núi uốn lượn rõ rệt, trên đỉnh núi điểm xuyết những tuabin gió tạo thành bóng đổ dưới ánh hoàng hôn. Những ngọn núi tạo thành nền cảnh, trước mắt là những cánh đồng rộng lớn xen kẽ với những tòa nhà cao tầng.

Tôi trở về Trung Quốc với sự khiêm tốn sâu sắc. Việc đến một nơi hoàn toàn xa lạ nhưng lại nhận được sự chào đón nồng nhiệt là một trải nghiệm ấm áp và đầy tính nhân văn. Tôi đã may mắn gặp gỡ nhiều người trong hệ sinh thái AI, những người trước đây tôi chỉ biết đến từ xa; và họ đã chào đón tôi bằng những nụ cười rạng rỡ và sự nhiệt tình, giúp tôi thêm một lần nữa nhận ra rằng công việc của tôi, cũng như toàn bộ hệ sinh thái AI, đều mang tính toàn cầu.

Tâm trạng của các nhà nghiên cứu Trung Quốc

Các công ty Trung Quốc đang phát triển mô hình ngôn ngữ có thể được xem là rất phù hợp để trở thành “người đi sau nhanh chóng” trong công nghệ này. Chúng dựa trên truyền thống văn hóa giáo dục và làm việc lâu đời của Trung Quốc, đồng thời có cách xây dựng công ty công nghệ khác biệt một chút so với phương Tây.

Nếu chỉ xem xét đầu ra — tức là các mô hình mới nhất và lớn nhất, cùng các luồng công việc dạng tác nhân mà chúng hỗ trợ — và các yếu tố đầu vào như các nhà khoa học xuất sắc, dữ liệu quy mô lớn và tài nguyên tính toán được tăng tốc, thì các phòng thí nghiệm Trung Quốc và Mỹ nhìn chung trông khá tương đồng. Sự khác biệt thực sự kéo dài chỉ xuất hiện ở cách các yếu tố này được tổ chức và định hình.

Tôi luôn cho rằng, một trong những lý do các phòng thí nghiệm Trung Quốc rất giỏi trong việc bắt kịp và duy trì vị trí gần hàng đầu là do văn hóa của họ rất phù hợp với nhiệm vụ này. Tuy nhiên, trước khi trao đổi trực tiếp với con người, tôi cảm thấy mình không đủ tư cách để gán sự trực giác này cho một ảnh hưởng quan trọng nào đó. Sau khi nói chuyện với nhiều nhà khoa học xuất sắc, khiêm tốn và cởi mở tại các phòng thí nghiệm hàng đầu của Trung Quốc, nhiều suy nghĩ của tôi đã trở nên rõ ràng hơn.

Để xây dựng mô hình ngôn ngữ lớn tốt nhất hôm nay, phần lớn phụ thuộc vào công việc tỉ mỉ xuyên suốt toàn bộ kỹ thuật栈: từ dữ liệu, chi tiết kiến trúc, đến việc triển khai các thuật toán học tăng cường. Mỗi khâu trong mô hình đều có thể mang lại một số cải tiến, và cách kết hợp những cải tiến này lại với nhau là một quá trình phức tạp. Trong quá trình này, những công việc do những cá nhân rất thông minh thực hiện có thể phải được tạm gác lại để đảm bảo mô hình tổng thể đạt tối đa trong tối ưu đa mục tiêu.

Các nhà nghiên cứu Mỹ rõ ràng cũng rất giỏi trong việc giải quyết các vấn đề của từng thành phần riêng lẻ, nhưng Mỹ còn có văn hóa “tự lên tiếng vì chính mình”. Khi là một nhà khoa học, bạn thường thành công hơn nếu chủ động tranh thủ sự chú ý cho công việc của mình; và văn hóa đương đại đang thúc đẩy một con đường nổi tiếng mới, đó là trở thành “nhà khoa học AI hàng đầu”. Điều này sẽ dẫn đến xung đột trực tiếp.

Có tin đồn rộng rãi rằng tổ chức Llama đã sụp đổ sau khi những yêu cầu lợi ích được đưa vào cấu trúc tổ chức phân cấp do áp lực chính trị. Tôi cũng đã nghe các phòng thí nghiệm khác nói rằng đôi khi cần phải “an ủi” một nhà nghiên cứu hàng đầu để họ ngừng phàn nàn vì ý tưởng của họ không được đưa vào mô hình cuối cùng. Dù điều này có hoàn toàn đúng hay không, thì ý nghĩa rõ ràng là: ý thức tự thân và khát vọng thăng tiến nghề nghiệp thực sự cản trở việc xây dựng các mô hình tốt nhất. Ngay cả sự khác biệt văn hóa nhỏ bé giữa Mỹ và Trung Quốc cũng có thể tạo ra ảnh hưởng đáng kể đến sản phẩm cuối cùng.

Một phần sự khác biệt liên quan đến việc ai ở Trung Quốc đang xây dựng các mô hình này. Trong tất cả các phòng thí nghiệm, một thực tế rất rõ ràng là: một tỷ lệ lớn các đóng góp chính là sinh viên đang theo học. Các phòng thí nghiệm này đều khá trẻ, điều này khiến tôi nhớ đến cách chúng tôi tổ chức tại Ai2: sinh viên được coi là đồng nghiệp và được tích hợp trực tiếp vào các đội ngũ mô hình ngôn ngữ lớn.

Điều này hoàn toàn khác với các phòng thí nghiệm hàng đầu của Mỹ. Tại Mỹ, các công ty như OpenAI, Anthropic, Cursor hoàn toàn không cung cấp cơ hội thực tập. Các công ty khác như Google tuy danh nghĩa có cung cấp thực tập liên quan đến Gemini, nhưng nhiều người lo ngại rằng thực tập của họ có thể bị cô lập ngoài những công việc cốt lõi thực sự.

Nói chung, sự khác biệt văn hóa nhẹ nhàng này có thể nâng cao khả năng xây dựng mô hình theo những cách sau: để cải thiện mô hình cuối cùng, mọi người sẵn sàng thực hiện những công việc ít nổi bật hơn; những người mới tham gia vào việc xây dựng AI có thể không bị ảnh hưởng bởi các chu kỳ thổi phồng AI trước đó, do đó có thể nhanh chóng thích nghi với các phương pháp kỹ thuật hiện đại mới. Thực tế, một nhà khoa học Trung Quốc mà tôi từng trao đổi đã rõ ràng coi đây là một lợi thế; mức độ tự thức thấp hơn giúp cấu trúc tổ chức dễ mở rộng hơn một phần vì ít người cố gắng “lợi dụng hệ thống”; nguồn nhân lực dồi dào rất phù hợp để giải quyết những vấn đề đã có bằng chứng khái niệm ở nơi khác, v.v.

Điều này phù hợp hơn với xu hướng năng lực của các mô hình ngôn ngữ hiện tại, trái ngược với một định kiến đã biết: mọi người thường cho rằng các nhà nghiên cứu Trung Quốc ít tạo ra những nghiên cứu học thuật mang tính sáng tạo cao, có khả năng mở ra các lĩnh vực mới “từ 0 đến 1”.

Trong một số buổi tham quan phòng thí nghiệm mang tính học thuật hơn trong chuyến đi này, nhiều nhà lãnh đạo đã nói rằng họ đang nuôi dưỡng nền văn hóa nghiên cứu đầy tham vọng hơn. Đồng thời, một số nhà quản lý kỹ thuật mà chúng tôi đã trao đổi cho rằng việc tái định hình cách tiếp cận khoa học này có thể không thể thực hiện được trong ngắn hạn, vì nó đòi hỏi phải thiết kế lại hệ thống giáo dục và hệ thống động lực, một sự thay đổi quá lớn để có thể xảy ra trong bối cảnh cân bằng kinh tế hiện tại.

Văn hóa này dường như đang đào tạo ra một thế hệ sinh viên và kỹ sư rất giỏi trong việc xây dựng trò chơi với mô hình ngôn ngữ lớn. Tất nhiên, số lượng của họ cũng cực kỳ dồi dào.

Những sinh viên này cho tôi biết, Trung Quốc cũng đang chứng kiến hiện tượng chảy máu chất xám tương tự như Mỹ: nhiều người trước đây từng cân nhắc theo đuổi con đường học thuật giờ đây định ở lại khu vực doanh nghiệp. Câu nói thú vị nhất đến từ một nhà nghiên cứu vốn muốn trở thành giáo sư, người nói rằng anh ấy muốn trở thành giáo sư vì mong muốn gần gũi với hệ thống giáo dục; nhưng sau đó anh ấy lại bình luận rằng giáo dục đã được các mô hình ngôn ngữ lớn giải quyết — “Tại sao sinh viên còn phải tìm đến tôi để trò chuyện!”

Sinh viên bước vào lĩnh vực mô hình ngôn ngữ lớn với ánh mắt mới mẻ, đây là một lợi thế. Trong những năm qua, chúng ta đã chứng kiến sự thay đổi liên tục trong các mô hình then chốt của mô hình ngôn ngữ lớn: từ mở rộng MoE, đến mở rộng học tăng cường, rồi đến hỗ trợ tác nhân. Để thực hiện bất kỳ điều nào trong số này một cách xuất sắc, đều cần hấp thụ một lượng lớn thông tin nền tảng một cách cực kỳ nhanh chóng, bao gồm cả tài liệu rộng rãi hơn lẫn hạ tầng kỹ thuật nội bộ của công ty.

Sinh viên quen với việc làm những việc như vậy và sẵn sàng buông bỏ mọi giả định về “điều gì nên hiệu quả” với tâm thế khiêm tốn. Họ lao vào, dồn toàn bộ cuộc sống vào đó chỉ để có cơ hội cải thiện mô hình.

Các sinh viên này cũng rất trực tiếp và không có những cuộc trò chuyện triết học khiến các nhà khoa học bị phân tâm. Khi tôi hỏi họ về quan điểm đối với tác động kinh tế của mô hình hoặc các rủi ro xã hội dài hạn, những nhà nghiên cứu Trung Quốc có quan điểm phức tạp và mong muốn ảnh hưởng đến các vấn đề này rõ ràng ít hơn nhiều. Họ cho rằng vai trò của mình là xây dựng những mô hình tốt nhất.

Sự khác biệt này rất tinh tế và dễ bị phủ nhận. Nhưng nó dễ dàng được cảm nhận nhất khi bạn trò chuyện lâu dài với một nhà nghiên cứu thanh lịch, thông minh, có khả năng diễn đạt rõ ràng bằng tiếng Anh: khi bạn đặt những câu hỏi mang tính triết học sâu hơn về AI, những vấn đề nền tảng này sẽ lơ lửng trong không khí, và người đối diện bộc lộ một sự bối rối đơn giản. Với họ, đó là một sai lầm về phạm trù.

Ngay cả một nhà nghiên cứu đã trích dẫn nhận định nổi tiếng của Dan Wang: khác với Hoa Kỳ do luật sư dẫn dắt, Trung Quốc được quản lý bởi các kỹ sư. Khi bàn đến những vấn đề này, anh ta sử dụng phép so sánh này để nhấn mạnh mong muốn xây dựng của họ. Ở Trung Quốc, không có một con đường hệ thống nào có thể nuôi dưỡng ảnh hưởng ngôi sao của các nhà khoa học Trung Quốc, giống như các podcast siêu phổ biến như Dwarkesh hay Lex.

Tôi cố gắng để các nhà khoa học Trung Quốc bình luận về những bất định kinh tế tương lai do AI gây ra, những vấn đề vượt quá khả năng đơn thuần của AGI, hoặc những tranh luận đạo đức về cách các mô hình nên hành xử; tất cả những vấn đề này cuối cùng đều cho tôi thấy bối cảnh lớn lên và nền giáo dục của những nhà khoa học này (đã chỉnh sửa 1). Họ cực kỳ tập trung vào công việc của mình, nhưng họ lớn lên trong một hệ thống không khuyến khích thảo luận và bày tỏ cách xã hội nên được tổ chức, nên thay đổi như thế nào.

Khi nhìn từ xa, đặc biệt là Bắc Kinh, tôi cảm thấy nó rất giống với Vịnh San Francisco: một phòng thí nghiệm cạnh tranh, có thể chỉ cách vài phút đi bộ hoặc đi xe taxi. Sau khi hạ cánh, tôi đã ghé qua khu vực Bắc Kinh của Alibaba trên đường đến khách sạn. Trong 36 giờ tiếp theo, chúng tôi đã đến Zhipu AI, Moonshot AI, Đại học Thanh Hoa, Meituan, Xiaomi và 01.ai.

Ở Trung Quốc, sử dụng DiDi rất tiện lợi. Nếu bạn chọn xe loại XL, thường sẽ được phân bổ vào xe điện nhỏ dạng bánh mì có ghế mát-xa. Chúng tôi đã hỏi các nhà nghiên cứu về cuộc chiến cạnh tranh nhân tài, và họ cho biết điều này rất giống với những gì chúng tôi từng trải nghiệm tại Mỹ. Việc các nhà nghiên cứu chuyển việc là điều bình thường, và mọi người chọn nơi đi đến chủ yếu dựa vào môi trường đang hấp dẫn nhất hiện nay.

Ở Trung Quốc, cộng đồng mô hình ngôn ngữ lớn mang cảm giác như một hệ sinh thái, chứ không phải những bộ lạc đối đầu lẫn nhau. Trong nhiều cuộc trò chuyện không công khai, tôi gần như luôn nghe thấy sự tôn trọng dành cho các đồng nghiệp. Tất cả các phòng thí nghiệm Trung Quốc đều e ngại ByteDance và mô hình DouBao phổ biến của họ, vì đây là phòng thí nghiệm đóng nguồn tiên tiến duy nhất ở Trung Quốc. Đồng thời, tất cả các phòng thí nghiệm đều rất tôn trọng DeepSeek, coi đây là phòng thí nghiệm có gu nghiên cứu xuất sắc nhất về mặt thực thi. Ở Mỹ, khi bạn trao đổi không công khai với các thành viên trong phòng thí nghiệm, những tia lửa thường nhanh chóng bùng lên.

Điều khiến tôi ấn tượng nhất trong sự khiêm tốn của các nhà nghiên cứu Trung Quốc là họ thường gạt tay và nói rằng đó không phải là vấn đề của họ. Trong khi đó, ở Mỹ, dường như mọi người đều đắm chìm trong các xu hướng ngành công nghiệp ở mọi cấp độ sinh thái, từ nhà cung cấp dữ liệu, đến năng lực tính toán, cho đến huy động vốn.

Sự khác biệt và tương đồng giữa ngành công nghiệp AI của Trung Quốc và các phòng thí nghiệm phương Tây

Việc xây dựng một mô hình AI hôm nay thật thú vị vì nó không còn chỉ là việc tập hợp một nhóm các nhà nghiên cứu xuất sắc cùng trong một tòa nhà để cùng tạo ra một kỳ tích kỹ thuật. Trước đây, nó quả thực giống như vậy, nhưng để duy trì hoạt động AI, các mô hình ngôn ngữ lớn đang trở thành một dạng lai tạp: bao gồm việc xây dựng, triển khai, huy động vốn và thúc đẩy sự chấp nhận của sản phẩm sáng tạo này.

Các công ty AI hàng đầu tồn tại trong một hệ sinh thái phức tạp. Những hệ sinh thái này cung cấp vốn, năng lực tính toán, dữ liệu và nhiều nguồn lực khác để liên tục thúc đẩy ranh giới tiến bộ.

Trong hệ sinh thái phương Tây, cách thức tích hợp các yếu tố đầu vào cần thiết để tạo ra và duy trì các mô hình ngôn ngữ lớn đã được định hình và mô tả tương đối đầy đủ. Anthropic và OpenAI là những đại diện tiêu biểu. Do đó, nếu chúng ta có thể phát hiện ra rằng các phòng thí nghiệm Trung Quốc có cách suy nghĩ khác biệt rõ rệt về những vấn đề này, chúng ta sẽ thấy được các công ty khác nhau có thể sẽ đầu tư vào những sự khác biệt mang tính ý nghĩa nào trong tương lai. Tất nhiên, những tương lai này cũng sẽ bị ảnh hưởng mạnh mẽ bởi các ràng buộc về tài trợ và/hoặc năng lực tính toán.

Tôi tổng hợp một số điểm thu hoạch lớn nhất ở cấp độ công nghiệp « AI » sau khi trao đổi với các phòng thí nghiệm này:

Đầu tiên, nhu cầu AI trong nước đã xuất hiện những dấu hiệu ban đầu.
Có một giả định được thảo luận rộng rãi cho rằng thị trường AI của Trung Quốc sẽ nhỏ hơn, vì các công ty Trung Quốc thường không sẵn sàng trả tiền cho phần mềm, do đó sẽ không bao giờ tạo ra một thị trường suy luận đủ lớn để hỗ trợ các phòng thí nghiệm.

Tuy nhiên, phán đoán này chỉ áp dụng cho chi phí phần mềm tương ứng với hệ sinh thái SaaS, vốn từ trước đến nay luôn nhỏ bé ở Trung Quốc. Mặt khác, Trung Quốc rõ ràng vẫn có một thị trường điện toán đám mây khổng lồ.

Một câu hỏi then chốt và vẫn chưa được trả lời là: chi tiêu của các doanh nghiệp Trung Quốc vào AI sẽ giống thị trường SaaS – quy mô nhỏ hơn – hay giống thị trường điện toán đám mây – chi tiêu mang tính nền tảng? Câu hỏi này thậm chí đang được thảo luận trong nội bộ các phòng thí nghiệm Trung Quốc. Nhìn chung, tôi cảm thấy AI đang ngày càng tiến gần hơn đến thị trường điện toán đám mây, và không ai thực sự lo ngại rằng thị trường xung quanh các công cụ mới sẽ không thể tăng trưởng.

Thứ hai, đa số các nhà phát triển đều bị ảnh hưởng sâu sắc bởi Claude.
Mặc dù Claude chính thức bị cấm ở Trung Quốc, nhưng hầu hết các nhà phát triển AI Trung Quốc đều rất đam mê Claude và cách nó thay đổi cách họ xây dựng phần mềm. Việc Trung Quốc trước đây không sẵn sàng mua phần mềm không có nghĩa là tôi cho rằng Trung Quốc sẽ không chứng kiến một đợt tăng trưởng lớn về nhu cầu suy luận.

Các kỹ thuật viên Trung Quốc rất thực tế, khiêm tốn và có động lực. Điều này để lại cho tôi ấn tượng mạnh hơn bất kỳ thói quen lịch sử nào về việc "không trả tiền để mua phần mềm".

Một số nhà nghiên cứu Trung Quốc nhắc đến việc họ sử dụng các công cụ riêng của mình để xây dựng, chẳng hạn như công cụ dòng lệnh của Kimi hoặc GLM, nhưng tất cả đều nhắc đến việc họ sử dụng Claude. Điều đáng ngạc nhiên là rất ít người nhắc đến Codex, trong khi Codex rõ ràng đang trở nên phổ biến nhanh chóng ở Vùng Vịnh.

Thứ ba, các công ty Trung Quốc có tâm lý sở hữu công nghệ.
Văn hóa Trung Quốc đang kết hợp với một động cơ kinh tế vận hành ầm ầm, tạo ra những kết quả khó dự đoán. Một ấn tượng sâu sắc mà tôi để lại là số lượng lớn các mô hình AI phản ánh sự cân bằng thực tế của nhiều doanh nghiệp công nghệ tại đây. Không có một kế hoạch tổng thể nào cả.

Ngành công nghiệp này được định nghĩa bởi sự tôn trọng dành cho ByteDance và Alibaba. Chúng là những người chơi lớn được cho là sẽ giành chiến thắng trong nhiều thị trường nhờ nguồn lực mạnh mẽ. DeepSeek là một nhà lãnh đạo công nghệ được tôn trọng, nhưng xa mới là người dẫn đầu thị trường. Chúng đặt ra định hướng, nhưng không có cấu trúc về mặt kinh tế để giành chiến thắng trên thị trường.

Điều này để lại những công ty như Meituan hoặc Ant Group. Người phương Tây có thể ngạc nhiên vì sao những công ty này cũng đang xây dựng các mô hình này. Nhưng thực tế, chúng rõ ràng coi các mô hình ngôn ngữ lớn là cốt lõi của các sản phẩm công nghệ tương lai, do đó chúng cần một nền tảng mạnh mẽ.

Khi họ tinh chỉnh một mô hình tổng quát mạnh mẽ, phản hồi từ cộng đồng mã nguồn mở sẽ giúp nền tảng công nghệ của họ trở nên vững chắc hơn, đồng thời họ cũng có thể giữ lại các phiên bản tinh chỉnh nội bộ cho sản phẩm của mình. Tư duy “mở trước tiên” trong ngành này phần lớn được định nghĩa bởi chủ nghĩa thực dụng: nó giúp mô hình nhận được phản hồi mạnh mẽ, đóng góp trở lại cộng đồng mã nguồn mở và hỗ trợ sứ mệnh của chính họ.

Thứ tư, sự hỗ trợ của chính phủ là có thật, nhưng quy mô vẫn chưa rõ ràng.
Người ta thường khẳng định rằng chính phủ Trung Quốc đang tích cực hỗ trợ mở rộng cuộc cạnh tranh về các mô hình ngôn ngữ lớn. Nhưng đây là một hệ thống chính phủ tương đối phi tập trung với nhiều cấp bậc, và mỗi cấp không có một hướng dẫn vận hành rõ ràng về việc mình nên làm gì.

Các khu phố ở Bắc Kinh cạnh tranh với nhau để thu hút các công ty công nghệ đặt văn phòng tại đó. Những sự “hỗ trợ” cung cấp cho các công ty này gần như chắc chắn bao gồm việc loại bỏ các thủ tục hành chính rườm rà như cấp phép. Nhưng sự hỗ trợ này có thể đi xa đến đâu? Các cấp chính quyền khác nhau có thể giúp thu hút nhân tài không? Họ có thể giúp vận chuyển chip lậu không?

Trong suốt quá trình khảo sát, thực sự có nhiều đề cập đến sự quan tâm hoặc hỗ trợ của chính phủ, nhưng thông tin liên quan远远不足以让我以断言的方式报告细节，也不足以让我对政府究竟能如何改变中国 AI 发展轨迹形成一个自信的世界观。

Tất nhiên, hoàn toàn không có dấu hiệu nào cho thấy cấp cao nhất của chính phủ Trung Quốc đang ảnh hưởng đến bất kỳ quyết định kỹ thuật nào của mô hình.

Thứ năm, ngành công nghiệp dữ liệu chưa phát triển bằng phương Tây.
Chúng tôi từng nghe nói rằng Anthropic hoặc OpenAI chi hơn 10 triệu đô la Mỹ cho một môi trường đơn lẻ, với tổng chi tiêu hàng năm nhằm thúc đẩy ranh giới của học tăng cường lên tới hàng trăm triệu đô la Mỹ. Vì vậy, chúng tôi rất tò mò liệu các phòng thí nghiệm Trung Quốc có đang mua cùng những môi trường này từ các công ty Mỹ hay không, hay có một hệ sinh thái trong nước tương đương đang hỗ trợ chúng.

Câu trả lời không phải là “không có ngành công nghiệp dữ liệu” theo nghĩa đầy đủ, mà là theo kinh nghiệm của họ, chất lượng ngành công nghiệp dữ liệu tương đối kém, do đó nhiều khi cách tốt hơn là tự xây dựng môi trường hoặc dữ liệu nội bộ. Các nhà nghiên cứu thường dành rất nhiều thời gian để tạo môi trường huấn luyện học tăng cường, trong khi các công ty lớn như ByteDance hay Alibaba có thể sở hữu đội ngũ ghi nhãn dữ liệu nội bộ để hỗ trợ việc này. Tất cả những điều này đều phù hợp với tư duy “tự xây dựng thay vì mua” đã đề cập ở trên.

Thứ sáu, nhu cầu đối với nhiều chip NVIDIA hơn rất mạnh mẽ.
Độ tính toán của NVIDIA là tiêu chuẩn vàng để huấn luyện, và tiến độ của mọi người đều bị giới hạn bởi việc không có đủ độ tính toán. Nếu nguồn cung dồi dào, rõ ràng họ sẽ mua. Các bộ tăng tốc khác, bao gồm nhưng không giới hạn ở Huawei, đã nhận được đánh giá tích cực trong lĩnh vực suy luận. Vô số phòng thí nghiệm có thể sử dụng chip của Huawei.

Những điểm này mô tả một hệ sinh thái AI hoàn toàn khác biệt. Việc áp dụng nhanh chóng cách thức vận hành của các phòng thí nghiệm phương Tây vào các đồng nghiệp Trung Quốc thường dẫn đến sai lầm về phạm trù. Vấn đề then chốt là liệu những hệ sinh thái khác nhau này có tạo ra các loại mô hình có sự khác biệt thực chất hay không; hay nói cách khác, các mô hình Trung Quốc có luôn bị giải thích như là các mô hình tiên tiến của Mỹ cách đây 3 đến 9 tháng không.

Kết luận: Cân bằng toàn cầu

Trước chuyến đi này, tôi hiểu quá ít về Trung Quốc; và khi rời đi, tôi cảm thấy mình mới chỉ bắt đầu học hỏi. Trung Quốc không phải là một nơi có thể diễn đạt bằng các quy tắc hay công thức, mà là một nơi có những động lực và phản ứng hóa học hoàn toàn khác biệt. Văn hóa của nó cổ xưa và sâu sắc đến mức vẫn hoàn toàn đan xen với cách thức xây dựng công nghệ trong nước. Tôi còn rất nhiều điều cần học.

Nhiều bộ phận trong cơ cấu quyền lực hiện tại của Hoa Kỳ coi quan điểm hiện tại của họ về Trung Quốc như một công cụ tâm lý then chốt trong quá trình ra quyết định. Sau khi có các cuộc trao đổi trực tiếp, chính thức hoặc không chính thức với gần như mọi phòng thí nghiệm AI hàng đầu của Trung Quốc, tôi nhận thấy Trung Quốc sở hữu nhiều phẩm chất và bản năng mà cách tiếp cận ra quyết định của phương Tây khó có thể mô phỏng.

Ngay cả khi tôi trực tiếp hỏi những phòng thí nghiệm này tại sao lại công khai phát hành mô hình mạnh nhất của họ, tôi vẫn rất khó để kết nối hoàn toàn sự giao thoa giữa "tư duy sở hữu" và "sự hỗ trợ chân thành đối với hệ sinh thái".

Phòng thí nghiệm ở đây rất thực tế, không nhất thiết là những người theo chủ nghĩa tuyệt đối về mã nguồn mở, và không phải mọi mô hình mà chúng xây dựng đều được công bố mở. Tuy nhiên, chúng có ý định sâu sắc trong việc hỗ trợ các nhà phát triển, hỗ trợ hệ sinh thái, và coi việc mở là cách để hiểu rõ hơn về chính các mô hình của mình.

Hầu hết các công ty công nghệ lớn của Trung Quốc đều đang xây dựng mô hình ngôn ngữ lớn tổng quát của riêng mình. Chúng ta đã thấy các công ty dịch vụ nền tảng như Meituan và các công ty công nghệ tiêu dùng lớn như Xiaomi đều đã phát hành các mô hình có trọng số mở. Các công ty tương tự tại Mỹ thường chỉ mua dịch vụ.

Các công ty này xây dựng các mô hình ngôn ngữ lớn không phải để tạo sự hiện diện trong những xu hướng mới nổi, mà xuất phát từ một khát vọng sâu sắc và cốt lõi: kiểm soát nền tảng công nghệ của riêng mình và phát triển công nghệ quan trọng nhất hiện nay. Khi tôi ngẩng đầu lên từ máy tính xách tay, tôi luôn thấy những cụm cần cẩu trên đường chân trời, điều này rõ ràng phù hợp với văn hóa và năng lượng xây dựng rộng lớn hơn của Trung Quốc.

Các nhà nghiên cứu Trung Quốc mang đến sự ấm áp, quyến rũ và chân thành, khiến người ta cảm thấy rất gần gũi. Về mặt cá nhân, những cuộc thảo luận địa chính trị khắc nghiệt mà chúng ta thường gặp ở Mỹ hoàn toàn không thấm nhập vào họ. Thế giới này cần nhiều hơn nữa những sự tích cực đơn giản như vậy. Là một thành viên của cộng đồng AI, hiện tôi càng lo lắng hơn về việc những vết nứt đang xuất hiện giữa các thành viên và nhóm dựa trên nhãn hiệu quốc tịch.

Nếu tôi nói rằng tôi không mong muốn các phòng thí nghiệm Mỹ trở thành người dẫn đầu rõ ràng trong mọi khía cạnh của nền tảng công nghệ AI, thì đó là một lời nói dối. Đặc biệt trong lĩnh vực mô hình mở mà tôi đã dành rất nhiều thời gian, tôi là người Mỹ, và đây là một sự ưu tiên trung thực.

Trong khi đó, tôi hy vọng hệ sinh thái mở sẽ phát triển thịnh vượng trên toàn cầu, vì điều này có thể tạo ra những AI an toàn hơn, dễ tiếp cận hơn và hữu ích hơn cho thế giới. Vấn đề hiện tại là các phòng thí nghiệm của Mỹ có sẽ hành động để chiếm vị trí dẫn đầu này hay không.

Khi tôi hoàn thành bài viết này, những tin đồn mới về ảnh hưởng của sắc lệnh hành chính đối với các mô hình mở đang tiếp tục lan truyền. Điều này có thể làm phức tạp thêm mối quan hệ hợp tác giữa lãnh đạo Hoa Kỳ và hệ sinh thái toàn cầu — điều này không khiến tôi cảm thấy tự tin hơn.

Cảm ơn tất cả những người xuất sắc mà tôi đã có cơ hội trao đổi cùng tại Moonshot AI, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai và các tổ chức khác. Mỗi người đều vô cùng nhiệt tình và sẵn sàng dành thời gian của mình một cách hào phóng. Khi ý tưởng của tôi dần hình thành, tôi sẽ tiếp tục chia sẻ những quan sát về Trung Quốc, bao gồm cả các khía cạnh văn hóa rộng hơn cũng như bản thân lĩnh vực AI.

Rõ ràng, những kiến thức này sẽ trực tiếp liên quan đến câu chuyện đang diễn ra trong sự phát triển前沿 của AI.

Tại sao AI của Trung Quốc lại phát triển nhanh đến vậy? Những hiểu biết từ các phòng thí nghiệm

Tâm trạng của các nhà nghiên cứu Trung Quốc

Sự khác biệt và tương đồng giữa ngành công nghiệp AI của Trung Quốc và các phòng thí nghiệm phương Tây

Kết luận: Cân bằng toàn cầu