XRZero-G0, sistem blackbox pengumpulan data tubuh nyata pertama di Tiongkok yang bersifat open-source. Proyek ini mengintegrasikan seluruh rantai proses pengumpulan data tanpa tubuh, pemeriksaan kualitas, pelatihan, dan evaluasi mesin nyata, dilengkapi dengan dataset multimodal lebih dari 2.000 jam yang mencakup 3.000 tugas. Solusi intinya melibatkan operator yang memakai perangkat VR dan beberapa kamera untuk menangkap gerakan, tanpa memerlukan robot di lokasi. Sistem memastikan kualitas data melalui tiga pemeriksaan keamanan—perspektif tiga kamera, verifikasi IK dengan virtual limiter, dan replay mesin nyata—dengan efisiensi data melebihi 85%. Eksperimen menunjukkan bahwa pelatihan dengan rasio data tanpa tubuh terhadap data mesin nyata 10:1 menghasilkan performa setara dengan 500 data mesin nyata murni, sementara biaya pengumpulan turun hingga satu dua puluh dari sebelumnya. Sistem ini juga mendukung迁移 tanpa sampel antar tubuh, menyelesaikan masalah perbedaan tubuh dalam penerapan robot.Penulis artikel, sumber: Leifengwang
Baru-baru ini, industri embodied dipenuhi oleh sebuah proyek open source.
Awalnya hanya beredar di kalangan kecil bahwa "seseorang telah melepaskan secara open source seluruh rangkaian dataset embodiment". Saya penasaran dan ingin melihat-lihat sekadar iseng, tetapi semakin saya teliti, semakin terasa tidak biasa—ini bukan sekadar dataset biasa, melainkan sebuah sistem pengumpulan data tanpa ontologi yang utuh.
Dengan kata lain, orang lain meng-open-source "sepotong kode", sementara yang ini meng-open-source seluruh rantai lengkap tanpa entitas: pengumpulan data + kualitas kontrol + pelatihan + evaluasi perangkat nyata, ditambah dengan dataset multimodal tanpa entitas sebanyak lebih dari 2.000 jam yang mencakup 3.000 tugas, semuanya telah dikemas secara utuh.


Alamat makalah: https://arxiv.org/abs/2604.13001
Ini pertama kalinya terjadi di dalam negeri, jadi saya telusuri lebih dalam makalah yang terkait:
Secara sederhana, makalah XRZero-G0 melakukan dua hal: pertama, membuka "black box" pengumpulan data robotik dan secara langkah demi langkah menunjukkan cara mengumpulkan satu set data berkualitas tinggi dengan biaya sangat rendah. Kedua, secara langkah demi langkah mengajarkan cara melatih data.
Pertama, pengumpulan data. Sebelumnya, mungkin Anda pernah mendengar bahwa "mengumpulkan data untuk industri embodiment sulit dan mahal," bahkan ada yang mengeluarkan pernyataan ekstrem bahwa perkembangan embodiment lambat karena terhambat oleh pengumpulan data.
Lihat model besar, makan teks, yang tersebar di mana-mana di internet. Robot makan data fisik, setiap data harus dibeli dengan biaya nyata. Selain itu, dalam pengumpulan data sebelumnya, industri menghadapi tiga lubang besar: mahal, kotor, dan tidak dapat digunakan ulang, yang membentuk "trilema" lapisan data tubuh.

Dalam paper XRZero-G0, diberikan solusi cerdas, intinya satu kalimat: orang memakai perangkat untuk bekerja, tidak perlu robot di lokasi.
Jalan ini sebenarnya sudah pernah ditempuh oleh orang lain (misalnya, paradigma UMI), tetapi cara ini sebelumnya memiliki kelemahan mematikan: data yang dikumpulkan seperti "kotak hitam", sehingga Anda tidak tahu apakah mesin asli benar-benar dapat berjalan. Namun, XRZero-G0 kali ini mengubah kotak hitam menjadi kotak putih yang transparan melalui tiga "pemeriksaan keamanan".
Pemeriksaan keamanan pertama: tiga kamera.
Perangkat genggam pengambilan data sebelumnya hanya memiliki satu atau dua sudut pandang, yang memiliki kelemahan: ketika kedua tangan saling silang atau objek terhalang oleh lengan, data langsung rusak. Pendekatan XRZero-G0 sangat langsung: operator memakai headset VR PICO, dengan kamera global di atas kepala, dan kamera terpasang di pergelangan tangan kiri dan kanan.

Dengan tiga sudut pandang ini ditambah informasi pose enam derajat kebebasan, ditambah edge computing pada ransel untuk sinkronisasi spasial-temporal, akurasi langsung ≤4 milimeter, tanpa mempedulikan bagaimana Anda berputar, membungkuk, atau berjalan, masalah occlusion dan drift tidak akan terjadi.

Pemeriksaan keamanan kedua: Pasang virtual limit switch.
Orang tahu bahwa sendi manusia fleksibel dan bisa melakukan yoga, tetapi robot tidak bisa. Sebelumnya, saat mengoperasikan jarak jauh, saya melakukan gerakan yang tidak bisa dilakukan robot, dan akhirnya motor terbakar. XRZero-G0 sangat cerdas, dengan memperkenalkan verifikasi kinematika terbalik otomatis (IK) untuk menyaring gerakan yang melebihi batas sendi.
Pemeriksaan keamanan ketiga: Rekaman perangkat asli.
Setelah dua tahap penyaringan pertama, sistem akan secara acak memilih sebagian data dan langsung mengirimkannya ke robot lengan ganda nyata untuk "putaran terbuka". Hanya ketika robot berhasil menyelesaikan tugas tersebut, data ini baru dianggap tersimpan di database.
Setelah melewati tiga tingkat saringan kerucut, efisiensi data yang dimasukkan ke dalam gudang ditingkatkan menjadi lebih dari 85%, dengan ketersediaan yang setara dengan data perangkat asli dan kecepatan pengumpulan yang lebih cepat.
Melihat data dalam makalah, tugas sederhana dikompresi dari 35 detik menjadi 15 detik, mempercepat 2,33 kali; tugas kompleks juga bisa lebih cepat 1,71 kali. Kecepatan pengambilan puncak mencapai 93,2 jejak per jam. Bukankah ini lebih baik daripada perangkat asli?

Namun, hal di atas hanya mengajarkan "cara mengumpulkan data dengan lebih baik", sedangkan yang lebih penting dalam paper XRZero-G0 adalah mengajarkan "cara melatih" data.
Dalam pelatihan berwujud, semua orang tahu bahwa harus mencampurkan "data tanpa badan yang murah" dengan "data mesin nyata yang mahal", tetapi bagaimana rasio yang tepat? Dulu, semuanya bergantung pada sihir.
Tim XRZero-G0 melakukan sesuatu yang sangat solid: eksperimen sistematis secara menyeluruh, dan akhirnya menemukan "rasio emas".
Sebelum ini, mereka membandingkan tiga solusi:
▪ 500 data mesin asli (baseline)
▪ 500 perangkat asli + 500 tanpa tubuh (1:1)
▪ 50 perangkat asli + 500 tanpa tubuh (10:1)
Hasilnya tak terduga: solusi rasio 10:1 mencapai tingkat keberhasilan yang setara, bahkan lebih tinggi, dibandingkan baseline 500 mesin asli. Dengan kata sederhana: Anda mengurangi penggunaan data mesin asli sebesar 90%, menekan total biaya hingga satu dua puluh dari metode tradisional, sementara model yang dilatih tetap cerdas sama. Peningkatan efisiensi biaya sebesar 20 kali.
Paper menjelaskan alasan di baliknya, yang disebut "efek fisik anchoring berbasis sampel sedikit".

Belum selesai, model yang dilatih dengan data ini juga dapat melakukan transfer lintas entitas "zero-shot".
Seperti yang telah disebutkan sebelumnya, operasi jarak jauh pada mesin fisik tradisional paling takut terhadap migrasi tubuh. Jika meja naik sepuluh sentimeter atau diganti dengan robot lain, sistem langsung gagal. Namun, XRZero-G0 dirancang sebagai ransel, sehingga operator dapat berjalan-jalan, dan selama proses pengambilan data, sudut pandang, ketinggian, serta pencahayaan secara alami mengalami perubahan dinamis. "Kebisingan" yang kaya ini justru membuat model menjadi sangat robust.
Paper tersebut menunjukkan detail yang sangat mengesankan: model yang dilatih dengan data campuran ini, ketika dijalankan di EX001 dan CX001 tanpa pernah melihat data mesin asli, langsung dapat dideploy—hasilnya, menyusun bunga, melipat handuk, dan mengisi sosis semuanya berjalan lancar.

Bicara sedikit tentang refleksi XRZero-G0, inti makalah ini adalah menjelaskan secara rinci, seperti panduan, kepada para praktisi tentang "bagaimana mengumpulkan data dengan biaya rendah" dan "bagaimana memanfaatkan data secara efisien".
Semua orang dapat merasakan bahwa industri embodied sedang beralih dari "kompetisi demo" menjadi "kompetisi data". Namun, bagaimana cara menambah durasi, industri ini masih kekurangan konsensus dan arah yang jelas. XRZero-G0 telah mengajarkan seluruh rantai ini kepada industri: mengumpulkan data dengan lebih mudah, menemukan rasio data yang sempurna, hingga akhirnya mencapai "zero-shot cross-ontology transfer".
Pekerjaan teknis semacam ini tidak bisa diselesaikan oleh satu laboratorium universitas atau seorang akademisi terkenal secara sendirian; ia harus dilakukan oleh tim industri yang memahami both akademik dan industri.
Perusahaan di balik XRZero-G0 adalah X-Square Robot.
Untuk memahami mengapa Zidongbian bisa mengembangkan XRZero-G0, lihat saja pilihan jalurnya: sejak hari pertama, perusahaan memilih model besar end-to-end, sekaligus mengeksplorasi tiga jalur: VLA, WM, dan WUM. Orang-orang di industri paham bahwa jalur semacam ini tidak mungkin berjalan tanpa kemampuan infrastruktur yang kuat, sehingga sejak awal, dari WALL-OSS hingga XRZero-G0, Zidongbian terus membangun infrastruktur terkait infrastruktur.
Jalan ini memang sulit, tetapi benar. Lihat saja modalnya: dalam waktu kurang dari dua tahun, telah melakukan sembilan putaran pendanaan, dengan valuasi melebihi 10 miliar, dan empat perusahaan besar—ByteDance, Meituan, Alibaba, dan Xiaomi—semuanya ada dalam daftar pemegang saham.
Mengenai alasan XRZero-G0 di-open source secara penuh, lebih sederhana dan langsung.
Momen "ChatGPT" berwujud tidak mungkin diciptakan oleh satu perusahaan saja. Ketika universitas, tim kecil dan menengah, serta pengembang perorangan dapat menggunakan rangkaian alat terstandarisasi XRZero-G0 untuk memproduksi data secara massal, roda data seluruh industri baru benar-benar mulai berputar, dan pada saat itulah parit perlindungan variabel independen akan dibangun.
Lampirkan halaman GitHub XRZero-G0 di akhir teks, disarankan agar semua orang mencobanya:
https://github.com/X-Square-Robot/XRZero-G0
