Robot variabel bebas membuka sumber sistem kotak hitam pengumpulan data tubuh pertama di Tiongkok, XRZero-G0. Projek ini mengintegrasikan keseluruhan rantai pengumpulan data tanpa tubuh, pemeriksaan kualiti, latihan, dan penilaian mesin sebenar, dilengkapi dengan set data multimodal lebih daripada 2.000 jam yang merangkumi 3.000 tugas. Penyelesaian utama melibatkan operator memakai peranti VR dan beberapa kamera untuk penangkapan gerakan, tanpa memerlukan robot di tempat kejadian. Sistem memastikan kualiti data melalui tiga pemeriksaan keselamatan—pandangan tiga kamera, pengesahan IK pembatas maya, dan putaran semula mesin sebenar—dengan keberkesanan data melebihi 85%. Eksperimen menunjukkan bahawa dengan nisbah data tanpa tubuh kepada data mesin sebenar 10:1 untuk latihan, hasilnya setara dengan 500 data mesin sebenar semata-mata, dengan kos pengumpulan berkurang hingga satu dua puluh daripada asalnya. Sistem ini juga menyokong pemindahan silang tubuh tanpa sampel, menyelesaikan masalah perbezaan tubuh dalam pelaksanaan robot.Penulis artikel, sumber: Leifengwang
Industri agen terkini sedang dibanjiri oleh satu projek sumber terbuka.
Awalnya hanya beredar dalam kalangan kecil bahawa "seseorang telah membuka sumber keseluruhan set data embodi". Saya pergi melihat dengan niat "menonton keramaian", tetapi semakin saya lihat, semakin saya rasa ada yang tidak kena—ini bukan sekadar set data biasa, ini adalah sistem pengumpulan data tanpa ontologi sepenuhnya.
Dengan kata lain, orang lain membuka sumber kodnya adalah "sepotong kod", tetapi yang dibuka sumber ini adalah seluruh rantai lengkap tanpa badan pengumpulan data + kualiti + latihan + penilaian mesin sebenar, bersama dengan set data multimodal tanpa badan lebih daripada 2000 jam yang meliputi 3000 tugas, semuanya telah dikemas secara lengkap.


Alamat kertas: https://arxiv.org/abs/2604.13001
Ini adalah pertama kalinya di dalam negara, jadi saya teliti lebih dalam kertas kajian yang berkaitan:
Secara ringkas, kertas kerja XRZero-G0 melakukan dua perkara: pertama, membuka "kotak hitam" pengumpulan data robotik dan menunjukkan secara langkah demi langkah bagaimana mengumpulkan satu set data berkualiti tinggi dengan kos yang sangat rendah. Kedua, mengajar anda secara langkah demi langkah bagaimana melatih data.
Pertama, pengumpulan data. Sebelum ini, mungkin anda pernah mendengar bahawa "mengumpul data untuk industri embodi sukar dan mahal", bahkan ada yang mengeluarkan pernyataan ekstrem, menyatakan bahawa perkembangan embodi perlahan kerana dihambat oleh pengumpulan data.
Anda lihat model besar, ia makan teks, yang tersebar di mana-mana di internet. Robot makan data fizikal, setiap butirnya harus dibeli dengan bayaran sebenar. Selain itu, dalam pengumpulan data sebelum ini, industri menghadapi tiga perangkap besar: mahal, kotor, dan tidak boleh digunakan semula, yang membentuk "segitiga mustahil" dalam lapisan data badan.

Dalam kertas XRZero-G0, satu penyelesaian yang cemerlang diberikan, intinya hanya satu ayat: Orang memakai peralatan untuk bekerja, robot tidak diperlukan di lokasi.
Jalan ini sebenarnya telah dilalui oleh orang lain (contohnya, paradigma UMI), tetapi sebelum ini, kaedah ini mempunyai kelemahan maut: data yang dikumpulkan seperti sebuah "kotak hitam", di mana anda tidak tahu sama ada mesin sebenar boleh berjalan dengan lancar. Namun, XRZero-G0 kali ini telah mengubah kotak hitam menjadi kotak putih yang telus melalui tiga "semakan keselamatan".
Pemeriksaan keselamatan pertama: tiga kamera.
Peranti genggam pengambilan data sebelum ini hanya mempunyai sudut pandang tunggal atau dwi-sudut, yang mempunyai kelemahan: apabila kedua tangan bersilang atau objek tertutup oleh lengan, data menjadi rosak. Pendekatan XRZero-G0 adalah sangat langsung: memakai headgear PICO VR kepada operator, menempatkan kamera global di atas kepala, dan memasang kamera di setiap pergelangan tangan kiri dan kanan.

Dengan tiga sudut pandang ini ditambah maklumat pose enam darjah kebebasan, ditambah pengiraan tepi ransel untuk penyelarasan masa-ruang, ketepatan terus ≤4 mm, tanpa mengira bagaimana anda berpusing, membongkok, atau berjalan, masalah halangan dan longgokan tidak akan berlaku.

Pemeriksaan keselamatan kedua: Pasang penghad virtual.
Orang tahu bahawa sendi manusia fleksibel dan boleh melakukan yoga, tetapi robot tidak boleh. Semasa pengendalian jauh sebelum ini, saya melakukan gerakan yang tidak boleh dilakukan oleh robot, dan akibatnya motor terbakar. XRZero-G0 sangat pintar, dengan memperkenalkan pengesahan kinematik songsang automatik (IK) untuk menyaring gerakan yang melampaui had sendi.
Pemeriksaan keselamatan ketiga: Pemutaran semula peranti asli.
Selepas dua langkah penyaringan pertama, sistem akan secara rawak memilih sebahagian data dan menghantarnya terus kepada robot lengan ganda sebenar untuk "pemutaran terbuka". Hanya apabila robot berjaya menyelesaikan tugas tersebut, data ini akan dianggap sebagai data yang disimpan.
Setelah melalui saringan tiga tingkat, keberkesanan data yang dimasukkan ke dalam gudang ditingkatkan kepada lebih daripada 85%, ketersediaannya setara dengan data peranti asli, dan kelajuan pengumpulan lebih pantas.
Melihat data dalam kertas, tugas ringan dikurangkan dari 35 saat kepada 15 saat, mempercepat 2.33 kali; tugas kompleks juga boleh lebih cepat 1.71 kali. Kelajuan pengumpulan puncak mencapai 93.2 trajektori setiap jam. Bukankah ini lebih baik daripada mesin sebenar?

Namun, semua ini hanya mengajar "bagaimana mengumpulkan data dengan lebih baik"; yang lebih penting dalam kertas XRZero-G0 ialah mengajar orang "bagaimana melatih" data.
Dalam latihan embodied, semua orang tahu bahawa perlu mencampurkan "data tanpa badan yang murah" dengan "data mesin sebenar yang mahal", tetapi bagaimana nisbahnya? Dahulu, ia bergantung sepenuhnya pada seni sihir.
Tidak ada terjemahan yang diperlukan.
Sebelum ini, mereka membandingkan tiga pilihan:
▪ 500 data bot murni (garis dasar)
▪ 500 peranti asli + 500 tanpa badan (1:1)
▪ 50 peranti asli + 500 tanpa badan (10:1)
Hasilnya mengejutkan: skema 10:1 mencapai kejayaan yang sama, bahkan lebih tinggi, berbanding garis dasar 500 mesin asli. Dengan kata lain: anda mengurangkan penggunaan data mesin asli sebanyak 90%, menurunkan kos keseluruhan kepada satu perdua puluh kaedah tradisional, dan model yang dilatih tetap secerdas sebelumnya. Peningkatan kecekapan kos sebanyak 20 kali.
Kertas kerja itu menjelaskan sebab di sebaliknya, iaitu "kesan pengikat fizikal berdasarkan contoh sedikit".

Belum selesai lagi, model yang dilatih dengan data ini mampu melakukan perpindahan lintas entiti tanpa sampel.
Seperti yang telah disebutkan sebelumnya, operasi jarak jauh perangkat keras tradisional paling takut akan perpindahan tubuh asli. Jika meja naik sepuluh sentimeter atau menukar robot, sistem langsung gagal. Namun, XRZero-G0 adalah jenis ransel, di mana operator berjalan-jalan, dan selama proses pengumpulan, sudut pandang, ketinggian, serta pencahayaan secara alami mengalami perubahan dinamis. Kebisingan yang kaya ini justru membuat model menjadi sangat tangguh.
Kertas kerja tersebut menunjukkan butiran yang sangat mengesankan: model yang dilatih dengan data campuran ini, apabila diletakkan pada EX001 dan CX001 tanpa pernah melihat data mesin sebenar, berjaya dideploy secara langsung—hasilnya, ia mampu menata bunga, melipat tuala, dan memasukkan sosis tanpa sebarang masalah.

Bincang ringkas tentang ulasan XRZero-G0, esei ini pada intinya membongkar dan menjelaskan secara terperinci kepada para profesional mengenai dua perkara: "bagaimana mengumpulkan data dengan kos rendah" dan "bagaimana menggunakan data secara efisien", seperti panduan penggunaan.
Semua orang dapat merasakan bahawa industri embodied sedang beralih daripada "bertanding dengan demo" kepada "bertanding dengan data". Namun, bagaimana cara meningkatkan durasi, industri ini masih kekurangan konsensus dan arah yang jelas. XRZero-G0 telah mengajar industri ini seluruh rantai proses: "mengumpul data dengan lebih mudah", "mencari nisbah data yang sempurna", dan akhirnya mencapai "perpindahan lintas-entiti tanpa sampel".
Kerja kejuruteraan seperti ini tidak mungkin dilakukan oleh satu laboratorium universiti atau seorang akademik terkenal secara berasingan; ia mesti dilakukan oleh pasukan industri yang memahami both akademik dan industri.
Syarikat di sebalik XRZero-G0 ialah X-Square Robot.
Untuk memahami mengapa Zi Dong Liang boleh membuat XRZero-G0, lihat saja pilihan jalan mereka: syarikat memilih model end-to-end sejak hari pertama, sambil menyelidiki tiga lintasan iaitu VLA, WM, dan WUM. Semua orang dalam industri tahu bahawa lintasan ini tidak mungkin berjaya tanpa kemampuan infrastruktur yang kukuh, oleh itu sejak awal, dari WALL-OSS hingga XRZero-G0, Zi Dong Liang terus membina infrastruktur berkaitan infrastruktur.
Jalan ini memang sukar, tetapi betul. Lihat modalnya—dalam kurang dari dua tahun, ia telah menjalani sembilan putaran pendanaan, dengan valuasi melebihi sepuluh miliar. Empat syarikat besar—ByteDance, Meituan, Alibaba, dan Xiaomi—semuanya berada dalam senarai pemegang saham.
Mengenai sebab XRZero-G0 dibuka sumber sepenuhnya, ia lebih ringkas dan terus terang.
Momen "ChatGPT" yang berwujud tidak mungkin dihasilkan oleh satu syarikat sahaja. Apabila universiti, pasukan kecil dan sederhana, serta pembangun peribadi boleh menggunakan rangka kerja standard XRZero-G0 untuk menghasilkan data secara besar-besaran, roda data seluruh industri baru benar-benar bermula, dan pada masa itu, parit perlindungan pemboleh ubah bebas akan dibina.
Lampiran halaman GitHub XRZero-G0 di akhir teks, disarankan agar semua orang mencobanya:
https://github.com/X-Square-Robot/XRZero-G0
