自変数ロボットは、国内初のエムボディードデータ収集ブラックボックスシステムXRZero-G0をオープンソース化しました。このプロジェクトは、ボディーレスデータ収集、品質検査、トレーニング、実機評価の完全なワークフローを統合し、2000時間以上、3000以上のタスクをカバーするマルチモーダルデータセットを提供します。コアソリューションは、オペレーターがVRデバイスと複数のカメラを装着して動作をキャプチャするもので、現場にはロボットは不要です。システムは、三眼カメラの視点、仮想リミッターIK検証、実機再生の3段階のセキュリティチェックを通じてデータ品質を保証し、データ有効率は85%以上です。実験では、ボディーレスデータと実機データを10:1の比率でトレーニングした場合、500件の純粋な実機データと同等の効果が得られ、収集コストは従来の20分の1に削減されました。また、このシステムはゼロショットでのクロスボディ移行をサポートし、ロボット導入におけるボディ差異の問題を解決します。記事作成者、出典:雷峰網
最近、具身業界は一つのオープンソースプロジェクトで話題になっています。
最初は小さなコミュニティで「誰かがコミュニティで一式のエムボディーデータセットをオープンソースにした」と噂されていた。私は「見ておこう」という軽い気持ちで確認したが、見れば見るほどおかしいと感じた。これは単なるデータセットではなく、まったくのオントロジーなしのデータ収集システムだったのだ。
言い換えれば、他の人がオープンソースにしているのは「一連のコード」ですが、こちらはボディーレスのデータ収集から品質検査、トレーニング、実機評価に至るまでの完全なパイプラインをオープンソース化しており、さらに2000時間以上、3000以上のタスクをカバーするマルチモーダル・ボディーレスデータセットもすべてパッケージ化して公開しています。


論文のアドレス:https://arxiv.org/abs/2604.13001
これは国内では初めてのことだったので、関連する論文を詳しく調べました。
簡単に言えば、論文『XRZero-G0』は二つのことを実現しています。第一に、ロボットのデータ収集の「ブラックボックス」を開き、高品質なデータセットを超低コストで収集する方法を段階的に実演しています。第二に、データを用いたトレーニング方法を丁寧に解説しています。
まず第一点として、データ収集について述べます。これまで、「エムボディド業界でのデータ収集は難しく、高価だ」という話は多く耳にしたかと思います。中には、エムボディドの発展が遅れているのはデータ収集が原因だという極端な主張まであります。
大規模モデルはテキストを消費し、インターネット上にはあらゆる場所にそれらが存在する。一方、ロボットは物理的データを消費し、その1つ1つを実際の資金をかけて収集しなければならない。かつてデータ収集を行った際、業界には3つの大きな課題があった:高コスト、不純、再利用不可能。これらはエムボディーデータレイヤーの「不可能な三角形」を構成している。

XRZero-G0の論文では、巧妙な解決策が提示されており、その核心は一文だけです:人がデバイスを装着して作業にあたり、現場にはロボットは不要です。
この道は以前にも誰かが歩んだことがある(例えばUMIパラダイムなど)。しかし、従来の方法には致命的な欠点があり、収集したデータは「ブラックボックス」のように、実機で本当に動作するかどうかが分からなかった。一方、XRZero-G0は今回、3つの「セキュリティチェック」を経ることで、このブラックボックスを透明なホワイトボックスに変えた。
最初のセキュリティチェック:3台のカメラ。
過去の数年間、携帯型デバイスは単一視点または二視点しか備えておらず、両手が交差したり、物体が腕に隠れたりすると、データが即座に無効になるという欠点があった。XRZero-G0のアプローチは非常にシンプルだ:オペレーターにPICO VRヘッドセットを装着し、頭上にグローバルカメラを設置し、左右の手首にそれぞれカメラを装着する。

この3つの視点に6自由度の姿勢情報とバックパック型エッジコンピューティングによる時空間アライメントを組み合わせることで、精度は4ミリメートル以下となり、どんなに体を回転させたり、かがんだり、歩いたりしても、遮蔽やドリフトの問題は発生しません。

第二のセキュリティチェック:仮想リミッターをインストールしてください。
人間の関節は柔軟でヨガができるが、ロボットはできない。以前、リモート操作中にロボットができない動きをしたところ、モーターが焼けてしまった。XRZero-G0は賢く、関節限界を超える動きをフィルタリングするため、自動逆運動学(IK)検証を導入している。
第三のセキュリティチェック:実機再生。
最初の二つのフィルターを通過した後、システムはランダムに一部のデータを抽出し、実際の二腕ロボットに「オープンループ再生」を実行させます。ロボットがタスクをスムーズに完了した場合、ようやくそのデータがデータベースに保存されます。
三段の漏斗フィルターを適用した結果、入库データの有効率が85%以上に向上し、実機データと同等の可用性を実現しながら、収集速度もさらに速くなりました。
論文のデータを見ると、簡単なタスクは35秒から15秒に圧縮され、2.33倍の高速化を実現。複雑なタスクでも1.71倍速くなります。ピークの収集速度は毎時93.2トラジェクトリーに達します。これ、実機より魅力的じゃないですか?

しかし、上記はあくまで「どのようにデータをより効果的に収集するか」を教えたにすぎず、XRZero-G0論文のより重要な点は、「どのようにデータを学習させるか」を教えることです。
具身学習では、皆が「安価なシミュレーションデータ」と「高価な実機データ」を混ぜて使うことを知っていますが、比率はどのように設定すればよいでしょうか?以前はすべて経験則に頼っていました。
XRZero-G0チームは、体系的な実験を徹底的に実施し、最終的に「黄金比」を発見しました。
在此之前、彼らは3つの方案を比較しました:
▪ 500件の純粋な機械データ(ベースライン)
▪ 500台の実機+500台の本体なし(1:1)
▪ 実機50本+本体なし500本(10:1)
予想外の結果:10:1のスキームでは、成功率が500台の本物のデバイスを用いたベースラインと同等、甚至それ以上だった。要するに、本物のデバイスデータ使用量を90%削減し、総コストを従来方式の20分の1に抑えながら、同じくらい賢いモデルを訓練できるということだ。コスト効率が20倍向上した。
論文は、その背後にある理由を「少数サンプル物理アンカー効果」と呼んでいる。

まだ終わりではありません。このデータで訓練されたモデルは、ゼロショットでオントロジー間の移行を実現できます。
前述の通り、従来のリアルマシンリモート操作では、本体の移動が最も恐れられる。机の高さが10cm変わったり、ロボットを交換したりすると、即座に機能しなくなる。しかし、XRZero-G0はバックパック型であり、オペレーターが歩き回ることで、収集プロセス中に視点、高さ、照明が自然にダイナミックに変化する。このような豊かな「ノイズ」は、むしろモデルに非常に高いロバスト性を身につけさせる。
論文は非常に衝撃的な詳細を示している:このハイブリッドデータで訓練されたモデルを、EX001およびCX001にデプロイし、実機データを一切見せずにそのまま実行したところ、花を飾ったり、タオルを折ったり、ソーセージを詰めたりするタスクにすべて成功した。

XRZero-G0の読書感想を簡単に述べると、この論文の核心は、「どのように低コストでデータを収集するか」と「どのように効率的にデータを利用するか」の2つの課題を、マニュアルのように丁寧に解説し、業界関係者に伝えることです。
誰もが、エムボディ業界が「デモの競争」から「データの競争」へと移行していることを感じ取っている。しかし、どのように時間を積み重ねるかについては、業界全体で合意や方向性が欠けている。XRZero-G0は、「データ収集をより簡単に」し、「最適なデータ比率を見つける」ことから、最終的に「ゼロショット跨本体移行」を実現するまでの全プロセスを業界に提示した。
このようなエンジニアリング作業は、単一の大学の研究室や有名人の学者が単独で達成できるものではなく、学術と産業の両方を理解する産業界チームである必要があります。
XRZero-G0の開発会社は、自変数ロボット(X-Square Robot)です。
自変量がなぜXRZero-G0を実現できるのかを理解するには、その道筋を見ればわかる。同社は創業当初からエンドツーエンドの大規模モデルを選択し、同時にVLA、WM、WUMの3つの路線を探索してきた。業界内では、このような路線は堅固なインフラ能力がなければ実現できないことが広く知られているため、自変量は早期からWALL-OSSからXRZero-G0に至るまで、インフラ関連の基盤を構築し続けてきた。
この道は難しいが、正しい。資本を見れば明らかだ。自变量は2年不到で9回の資金調達を実施し、評価額は100億元を超え、バイトダンス、メイツゥ、アリババ、小米の四大企業が株主リストに名を連ねている。
XRZero-G0が完全にオープンソースとなった理由は、さらにシンプルで直截的だ。
具現化された「ChatGPTの瞬間」は、1社だけで生み出せるものではない。大学、中小チーム、個人開発者がすべてXRZero-G0という標準化されたツールチェーンを使ってデータを大量に生成できるようになると、業界全体のデータの飛輪が真正に回り始める。そのとき、自変数の競争優位が築かれる。
XRZero-G0のGitHubページを末尾に掲載していますので、ぜひお試しください:
https://github.com/X-Square-Robot/XRZero-G0
