Ở phần kết thúc bài phát biểu của Huang Renxun tại Trung tâm Âm nhạc Phổ biến Đài Bắc, người lên sân khấu lại là một robot.
Không biết từ khi nào, mọi người bắt đầu gọi robot là “thực vật”. Có lẽ vì nó chưa đủ linh hoạt, nên cách gọi này dường như cũng không sai.
01
Hãy xem Huang Renxun giới thiệu con robot này thế nào: cao 1,8 mét, nặng 68 kg, toàn thân có 75 bậc tự do; ông ấy đã đùa trên sân khấu rằng chiều cao và cân nặng này “gần giống tôi”. Rất thú vị.
Robot này có tên Isaac GR00T, định nghĩa chính thức từ NVIDIA là thiết kế tham chiếu, ba nhà cung cấp mỗi bên phụ trách một phần.
Thân người đến từ Unitree H2 Plus, tay đến từ năm ngón tay linh hoạt Sharpa của Singapore, bộ não là chip Jetson Thor của NVIDIA, kèm theo toàn bộ phần mềm Isaac GR00T.
Tôi đã để ý một chi tiết:
Yingzi cho biết, mục tiêu người dùng của thiết kế tham khảo này là các tổ chức giáo dục đại học và nhà nghiên cứu đại học; các khách hàng đầu tiên bao gồm Stanford và Viện Công nghệ Liên bang Zurich.
Nền tảng phát triển và mã mô hình đi kèm sẽ sớm được đăng lên GitHub và Hugging Face; toàn bộ stack phần mềm sẵn sàng sử dụng ngay, thời gian chuẩn bị của nhóm nghiên cứu đã được rút ngắn từ vài ngày xuống còn vài giờ.
Nói cách khác, NVIDIA không chỉ làm một robot.
Đây là một giải pháp hoàn chỉnh; cơ thể, não bộ, công cụ tạo dữ liệu, khung đào tạo và môi trường mô phỏng, tất cả đều được đóng gói sẵn, bạn chỉ cần cắm nguồn là có thể bắt đầu thí nghiệm.
I checked their data generation capabilities.
Yingzi cho biết, sử dụng Cosmos 3 và Isaac GR00T Blueprint, trong 11 giờ có thể tạo ra 780.000 quỹ đạo chuyển động tổng hợp. 780.000 quỹ đạo là gì? Tương đương với 6.500 giờ dữ liệu minh họa của con người; gần như một kỹ sư liên tục dạy robot các động tác trong 9 tháng.
Sau đó, vào buổi chiều hôm nay, Ủy ban審核上市 của Sở Giao dịch Chứng khoán Thượng Hải đã công bố kết quả, cho biết Yushu Technology đã vượt qua cuộc thẩm định đợt phát hành đầu tiên và đáp ứng các điều kiện phát hành.
73 ngày, từ tiếp nhận đến thông qua, huy động được 4,202 tỷ, định giá tổng thể 42 tỷ. Cổ phiếu robot hình người đầu tiên trên thị trường A đã được xác định, tôi muốn dùng cụm từ “song hỷ lâm môn” để miêu tả cả trước và sau sự kiện này.
Nhưng có một chi tiết đáng chú ý,
Trong bài phát biểu của Huang Renxun, tên Yushu xuất hiện trong cột “cơ thể”; Sharpa xuất hiện trong cột “tay”; NVIDIA tự chiếm trọn cả đoạn “bộ não, sức mạnh tính toán, mô hình, mô phỏng, tạo dữ liệu”.
Vào buổi chiều, trong cuộc xem xét tại Thượng Hải, Unitree đạt định giá 42 tỷ nhân dân tệ. Sổ đăng ký công khai ghi rõ ràng, khoản đầu tư lớn nhất trong số tiền huy động được dành cho mô hình lớn thể chất. Đó là bộ não.
NVIDIA nói bạn là cơ thể tôi, cùng ngày đó, Unitree nói tôi sẽ tạo ra bộ não của riêng mình. Chuyện gì đang xảy ra vậy?
02
Tôi đã nghĩ ra một từ, tham khảo thiết kế. Từ này khá trung tính, giống như một tài liệu kỹ thuật, một giải pháp, bạn tham khảo nhé.
Từ này đã xuất hiện rất nhiều lần trong giới công nghệ, mỗi lần ra mắt, cốt truyện sau đó đều tương tự nhau.
Lần tiêu biểu nhất trong ngành điện thoại di động.
Vào khoảng năm 2010, Qualcomm bắt đầu thực hiện một việc. Họ đóng gói toàn bộ chip Snapdragon, modem, hệ điều hành Android, lớp trình điều khiển và giao diện phần cứng thành một thiết kế tham chiếu điện thoại hoàn chỉnh.
Trong ngành được gọi là turnkey, dịch ra là giao chìa khóa.
Ý nghĩa là gì? Bạn là một nhà sản xuất thương hiệu điện thoại di động, không cần có năng lực thiết kế chip, điều chỉnh hệ thống, cũng không cần duy trì đội ngũ nghiên cứu và phát triển phần cứng. Chỉ cần lấy bộ giải pháp của Qualcomm, tìm một nhà sản xuất ODM, thay đổi vỏ ngoài, dán logo của bạn lên, là đã có một chiếc điện thoại rồi.
Chính vì vậy mà thế hệ đầu tiên của Redmi ra đời. Năm đó, Xiaomi tìm WenTai gia công, sử dụng giải pháp của Qualcomm, và năm đó, WenTai đã xuất xưởng 65,5 triệu thiết bị.
Nghe có vẻ cùng có lợi: Qualcomm bán được chip, các thương hiệu tiết kiệm được chi phí nghiên cứu và phát triển, các nhà máy ODM nhận được đơn hàng.
Sau đó, tôi đã tra cứu những việc xảy ra tiếp theo.
Huachin Technology, công ty ODM điện thoại lớn nhất Trung Quốc, doanh thu chín tháng đầu năm 2024 vượt quá 70 tỷ nhân dân tệ, lợi nhuận ròng thuộc về cổ đông công ty là 2 tỷ nhân dân tệ. Longqi Technology, doanh thu 35 tỷ nhân dân tệ, lợi nhuận dưới 500 triệu nhân dân tệ.
Doanh thu 70 tỷ USD, lợi nhuận 2 tỷ USD, biên lợi nhuận ròng dưới 3%.
Tỷ suất lợi nhuận gộp của các công ty gia công điện thoại này lâu nay luôn dao động trong khoảng 5% đến 11%. Người trong ngành gọi đây là tiền vất vả; bị các nhà cung cấp chip ép giá từ trên, bị các thương hiệu so sánh giá từ dưới, và bị đối thủ cạnh tranh khốc liệt ở giữa. Làm càng lớn thì lợi nhuận càng mỏng.
WenTai Technology, từng là nhà sản xuất ODM có sản lượng dẫn đầu, đã thực hiện một hành động vào đầu năm 2025: bán toàn bộ hoạt động ODM cho Luxshare Precision, hoàn toàn rút lui khỏi lĩnh vực gia công điện thoại; sau khi bán đi, công ty chuyển trọng tâm hoàn toàn sang ngành bán dẫn, với biên lợi nhuận gộp của hoạt động bán dẫn đạt 37,47%, cao hơn bảy lần so với hoạt động gia công điện thoại.
Xem đó, làm đến mức số một toàn cầu, cuối cùng lại chọn không làm nữa.
Câu chuyện này có liên quan gì đến hôm nay? Tôi đã so sánh những gì Qualcomm đã làm cách đây nhiều năm với những gì NVIDIA đang làm hôm nay.
Qualcomm đã ra mắt chip, Android và thiết kế tham chiếu, và tất cả mọi người trong ngành điện thoại di động đều sử dụng. Kết quả là? Phần cứng trở nên giống nhau như nhau, lợi nhuận dần dần chảy từ các thương hiệu và nhà sản xuất sang các nhà sản xuất chip và hệ điều hành.
NVIDIA hôm nay đã ra mắt chip Jetson Thor, mô hình Isaac GR00T và thiết kế tham chiếu. Mã mô hình đã được mở nguồn, khung mô phỏng cũng đã được mở nguồn và công cụ tạo dữ liệu đã được đóng gói sẵn.
Tôi đã xem danh sách đối tác hiện tại của NVIDIA, Unitree đang sử dụng Jetson Thor, Zhiji, Galaxy General và UBTECH cũng đều đang sử dụng. Ngay cả Figure AI và Boston Dynamics cũng đang sử dụng, cùng với Amazon và Meta.
Unitree là một trong hơn chục nhà cung cấp thân máy.
Giám đốc bộ phận robot của NVIDIA từng nói: “Chúng tôi không sản xuất robot, cũng không chế tạo xe hơi; chúng tôi cung cấp hỗ trợ kỹ thuật cho toàn ngành thông qua máy tính và phần mềm hạ tầng.”
This statement, Qualcomm said almost the exact same version fifteen years ago.
Khi một công ty nói: “Chúng tôi không làm sản phẩm cuối cùng, chỉ cung cấp nền tảng và công cụ,” thực chất họ đang tuyên bố một điều: Tôi sẽ đặt ra các quy tắc.
Mô hình GR00T đã được mở nguồn, cùng logic với thời điểm Google mở nguồn Android. Phần mềm miễn phí cho bạn, nhằm khiến bạn không thể rời xa phần cứng của tôi. Khi sử dụng mô hình và nền tảng mô phỏng của tôi, bạn phải chạy trên chip của tôi.
The way I see it:
Tham khảo thiết kế, giống như một thỏa thuận phân phối quyền lực, ai đưa ra thiết kế tham khảo, người đó đang xác định giá trị của bộ não và cơ thể trong ngành này là bao nhiêu.
Ngành điện thoại di động đã từng trả lời một lần rồi: công ty làm thân thể, doanh thu 70 tỷ USD, biên lợi nhuận dưới 3%; công ty làm não bộ, mỗi năm chỉ riêng phí cấp phép bằng sáng chế đã thu được hàng chục tỷ USD. Giờ đây, thật tình cờ, ngành robot cũng đã đạt được thỏa thuận tương tự.
03
Tôi đã xem xét hồ sơ niêm yết của Unitree. Trong số 4,2 tỷ nhân dân tệ huy động được, 2,022 tỷ sẽ được đầu tư vào nghiên cứu và phát triển mô hình robot thông minh, chiếm 48%, là khoản đầu tư lớn nhất trong tất cả các dự án; 1,11 tỷ đầu tư vào nghiên cứu và phát triển thân robot, 445 triệu đầu tư vào sản phẩm mới và 624 triệu xây dựng cơ sở sản xuất.
Nơi đầu tư nhiều tiền nhất là bộ não. Unitree chắc chắn hiểu rõ trò này.
Wang Xingxing từng nói rằng sai lầm lớn nhất trong thập kỷ qua là đã đánh giá thấp sự tiến bộ công nghệ của AI; đội ngũ ban đầu của ông tập trung chủ yếu vào ontology và điều khiển chuyển động, cho đến hai năm gần đây mới bắt đầu tăng cường đầu tư vào mô hình lớn thể chất.
Đồng thời cung cấp thân máy cho thiết kế tham chiếu của NVIDIA, lại dùng 2 tỷ đô la để tự chế tạo bộ não của mình. Đây là cuộc chiến độc lập dưới vỏ bọc hợp tác.
Tôi đã kiểm tra chi tiết, GR00T N1.5 của NVIDIA đã được chạy thành công trên robot Unitree G1; các nhà phát triển trong cộng đồng mã nguồn mở đã sử dụng mã để triển khai và trình diễn các tác vụ trên G1. Có hướng dẫn triển khai đầy đủ trên GitHub.
Nói cách khác, bộ não của Eiko đã được đưa vào cơ thể của Unitree. Và quá trình này là công khai, bất kỳ ai cũng có thể sao chép nó.
Na Uki đang làm gì vậy?
Tháng 9 năm 2025, Unitree đã mở nguồn mô hình thế giới tự phát triển UnifoLM-WMA-0. Tháng 1 năm 2026, họ tiếp tục ra mắt mô hình thị giác - ngôn ngữ - hành động UnifoLM-VLA-0.
Đến ngày 25 tháng 5, tức là ngày công bố thông báo hội nghị, Yushu đã phát hành mô hình lớn thể chất WVLA2.0, cho phép robot G1 tự chủ hoàn thành việc sắp xếp và phân loại đồ đạc trong phòng họp trong môi trường phức tạp có người đi lại gây nhiễu, hoàn toàn không cần điều khiển từ xa.
Hai bộ não chạy trên cùng một cơ thể, một bộ là của NVIDIA, mã nguồn mở, toàn thế giới đều có thể sử dụng, một bộ là của Unitree, mới bắt đầu và vẫn đang cố gắng đuổi theo. Bạn让我怎么形容?
Còn một vai trò khác đáng để ý.
Tôi tra cứu được một công ty tên là Zhongke Fifth Epoch, được thành lập vào tháng 9 năm 2024, với đội ngũ cốt lõi đến từ Viện Hàn lâm Khoa học Trung Quốc và Đại học Thanh Hoa; năm nay đã huy động được ba vòng gọi vốn liên tiếp, vòng Pre-A do Sequoia Capital Trung Quốc dẫn đầu, vòng A mới nhất do Fu Teng Capital và Shanghai Semiconductor Industry Investment đầu tư.
Nó là nhà cung cấp bộ não điều hành thể chất số 001 của Unitree Technologies.
Hai bên đã phát triển giải pháp tích hợp phần mềm và phần cứng dựa trên nền tảng robot hình người Unitree G1 trong ngành điện; Zhongke Fifth Generation cũng đang hợp tác với Midea, và robot của họ đã được triển khai thực tế trên dây chuyền sản xuất của Midea tại Quảng Châu.
Bạn đã phát hiện ra vấn đề chưa?
Trên cơ thể của Unitree có ba bộ não, không chỉ hai: GR00T của NVIDIA, UnifoLM do Unitree tự phát triển, và chuỗi mô hình FAM của Zhongke Fifth Epoch.
Tại sao một công ty làm về cơ thể lại phải kết nối cùng lúc ba bộ não? Vì nó chưa có bộ não riêng của mình.
Tỷ lệ chi phí nghiên cứu và phát triển của Unitree năm 2025 là 8,53%, tương đương 145 triệu nhân dân tệ; trong khi đối thủ cạnh tranh UBTECH là 25%, tương đương 507 triệu nhân dân tệ. Unitree là một trong những công ty có tỷ lệ đầu tư vào nghiên cứu và phát triển thấp nhất trong nhóm dẫn đầu ngành.
2 tỷ này là tiền bù đắp. Vấn đề là, có thời gian cửa sổ để bù đắp.
GR00T của NVIDIA là mã nguồn mở và có tốc độ cập nhật nhanh. Chỉ sau chưa đầy ba tháng đã từ N1 lên N1.5; chỉ cần GR00T đủ tiện dụng, ngày càng nhiều nhà phát triển và khách hàng sẽ tự động chọn nó.
Giống như sau khi Android được phổ biến rộng rãi, việc bạn phát triển một hệ điều hành điện thoại riêng của mình không phải là không thể, mà là ngày càng khó khăn.
Việc Yushu đang làm hiện nay tương đương với việc vừa cài chip Qualcomm lên điện thoại Android để xuất hàng và kiếm tiền, vừa bí mật phát triển chip và hệ điều hành riêng của mình trong phòng thí nghiệm.
Tôi tin rằng trạng thái tồn tại đồng thời của hai bộ não sẽ không kéo dài lâu, kết cục chỉ có hai khả năng: либо bộ não tự phát triển sẽ bắt kịp, khiến bộ não của An Tử trở nên không cần thiết; либо không bắt kịp, thì bộ não của NVIDIA sẽ trở thành lựa chọn duy nhất, và khi đó Yushu sẽ thực sự chỉ còn lại cơ thể.
04
Nói đến đây, có một vấn đề không thể bỏ qua: Có ai thực sự không dùng bộ não của NVIDIA mà tự mình xử lý mọi thứ không?
Có, một công ty. Tesla. Và hiện tại chỉ có công ty này.
Chip được sử dụng trong robot hình người Optimus là chip FSD do Tesla tự phát triển, cùng hệ thống được lắp trên xe để thực hiện chức năng lái tự động.
Cùng một hệ thống đào tạo, hệ thống gán nhãn dữ liệu và kiến trúc mạng nơ-ron, được mang trực tiếp từ xe. Phần cứng suy luận cũng tương thích, hiện đang chạy trên HW4, thế hệ tiếp theo sẽ được nâng cấp lên AI5.
Tôi đã kiểm tra các cập nhật mới nhất, trong cuộc gọi báo cáo quý I năm nay, Musk đã xác nhận một số mốc thời gian.
Optimus V3 sẽ được ra mắt giữa năm, nhà máy Fremont sẽ bắt đầu sản xuất hàng loạt vào tháng 7 đến tháng 8. Dây chuyền này trước đây là dây chuyền sản xuất Model S và Model X, sau khi ngừng sản xuất vào tháng 5 đang được chuyển đổi thành dây chuyền chuyên dụng cho Optimus, với mục tiêu công suất hàng năm là 1 triệu đơn vị.
1 triệu đơn vị. Yushu dự kiến giao 5.500 robot hình người trong năm 2025.
Chênh lệch 180 lần.
Đồng thời, chip suy luận AI5 của Tesla đã hoàn thành quá trình sản xuất, hệ thống cung cấp chip tự phát triển đã hình thành; điều này có nghĩa là từ giai đoạn huấn luyện đến suy luận, từ đám mây đến thiết bị đầu cuối robot, toàn bộ chuỗi không có bất kỳ sản phẩm nào của NVIDIA.
Tôi cho rằng, Tesla thực hiện được điều này nhờ ba lá bài.
Đầu tiên, vòng quay dữ liệu FSD. Hàng triệu xe Tesla chạy trên đường mỗi ngày, liên tục gửi về dữ liệu hình ảnh từ thế giới thực.
Dữ liệu này được sử dụng để huấn luyện xe tự lái, đồng thời cũng đang huấn luyện khả năng cảm nhận và ra quyết định của robot; nhóm Optimus không cần thu thập dữ liệu robot từ đầu vì dữ liệu từ xe có thể được tái sử dụng.
Thứ hai, chip tự nghiên cứu và phát triển.
Từ Dojo đến HW4 đến AI5, Tesla đã luôn tự phát triển kiến trúc tính toán của riêng mình. Mặc dù Dojo gặp không ít trở ngại và AI5 vừa mới được sản xuất, nhưng hướng đi này chưa bao giờ thay đổi—Tesla không muốn giao phần cứng nền tảng cho bộ não của mình cho người khác.
Thứ ba, siêu nhà máy.
Hệ thống sản xuất mà Tesla đã sử dụng để chế tạo hơn một triệu chiếc xe có thể được sử dụng trực tiếp để sản xuất robot; quản lý chuỗi cung ứng, kiểm soát chất lượng, tăng công suất sản xuất—những điều này không thể mua nhanh chóng bằng tiền.
Bây giờ nhìn lại Yushu, ba lá bài này đều không có. Điều này có nghĩa là Yushu nhất định sẽ trở thành Wentai? Không nhất thiết.
Vì Yushu có một lá bài mà Tesla không có, tỷ lệ tự nghiên cứu và tự sản xuất các linh kiện cốt lõi vượt quá 90%. Động cơ, hộp giảm tốc và bộ điều khiển đều được tự làm.
Thuật toán điều khiển chuyển động của robot bốn chân được phát triển từ đầu, robot hình người H1 đã ra sản phẩm sau sáu tháng khởi động, chỉ có ba người tham gia toàn thời gian, điều này cho thấy công nghệ thân thể của Unitree có hàm lượng kỹ thuật cao.
Có một sự khác biệt quan trọng mà nhiều người đã bỏ qua khi so sánh điện thoại di động với robot.
Hình thái vật lý của điện thoại di động đã trở nên tương đồng.
Một màn hình, một con chip, một viên pin, chỉ khác nhau về vỏ ngoài. Về mặt phần cứng, gần như không còn không gian để phân biệt. Vì vậy, khi nhà sản xuất chip đưa ra thiết kế tham chiếu, tất cả điện thoại đều trông giống nhau, các thương hiệu chỉ có thể cạnh tranh thông qua tiếp thị và giá cả.
Các robot không giống nhau; liệu chúng có thể đi lại ổn định, đứng bằng một chân mà không ngã khi bị đạp, hay dùng năm ngón tay mở nắp chai không—những khả năng này đến hôm nay, khoảng cách giữa các công ty vẫn rất lớn.
Điều này có nghĩa là, ít nhất ở giai đoạn hiện tại, việc làm body chưa hẳn là con đường cùng; bản thân body vẫn còn không gian để tăng giá và chưa bị tiêu chuẩn hóa nuốt chửng.
Tuy nhiên, trong ngành đang xuất hiện những xu hướng mới. Tôi nhận thấy nhu cầu về chip trí tuệ nhúng đang chuyển từ mua sản phẩm tiêu chuẩn sang thiết kế SoC tùy chỉnh chuyên dụng.
Nghĩa là, trong tương lai, có thể mỗi công ty robot sẽ hợp tác đầu tư với công ty chip để phát triển chip chuyên dụng riêng; nếu xu hướng này đúng, hiệu ứng khóa của thiết kế tham chiếu của英子 sẽ bị suy yếu.
Hiện tại, cánh cửa này vẫn còn mở, vượt qua bên kia là Tesla. Không vượt qua được, đó là Wentai, dự án mà Yushu đang dùng 2 tỷ nhân dân tệ để đánh cược.
Cửa sổ sẽ không mở mãi, mỗi khi GR00T cập nhật một phiên bản, cửa sổ này sẽ hạ xuống một chút. Từ N1 đến N1.5, trong ba tháng, thời gian còn lại cho Unitree có thể là hai đến ba năm.
Đương nhiên, cũng đừng quá bi quan. Đó chỉ là một số quan điểm cá nhân.
Bài viết này đến từ tài khoản WeChat “Wang Zhiyuan” (ID: Z201440), tác giả: Wang Zhiyuan

