Bağımsız değişken robotu, Türkiye'nin ilk vücutlu veri toplama kara kutu sistemi olan XRZero-G0'ı açık kaynak hale getirdi. Bu proje, vücutsuz veri toplama, kalite kontrolü, eğitim ve gerçek cihaz değerlendirme süreçlerini tek bir zincirde birleştiriyor ve 2000 saatten fazla, 3000 görevi kapsayan çok modlu bir veri seti sunuyor. Temel çözüm, operatörün VR cihazı ve birden fazla kamera takarak hareket yakalamasıdır; bu süreçte robot gerekmez. Sistem, üç kamera açısı, sanal limitler IK doğrulaması ve gerçek cihaz geri oynatma olmak üzere üç güvenlik kontrolüyle veri kalitesini garanti altına alır ve veri etkinliği %85'in üzerindedir. Deneyler, 10:1 vücutsuz ile gerçek cihaz verisi oranıyla eğitildiğinde, 500 adet sadece gerçek cihaz verisiyle elde edilen sonuçlara eşdeğer performans sağlandığını göstermiştir; veri toplama maliyeti önceki seviyenin yirmide birine düşürülmüştür. Sistem ayrıca sıfır örnekli vücutlar arası taşınımı destekler ve robot dağıtımındaki vücut farklılıklarını çözer.Yazan: LeiFeng.com
Son zamanlarda gövdeli endüstri, bir açık kaynak projesiyle doldu.
İlk başta sadece küçük bir dairede “kimse toplulukta tam bir vücut veri kümesini açık kaynak yaptı” diye söyleniyordu. “Sadece izleyeyim” diye baktım, ama ne kadar bakarsam bakayım, bu basit bir veri kümesi değil, tamamen ontolojisiz bir veri toplama sistemiymiş.
Yani başkaları开源 edilen bir "kod parçası", bu ise tamamen vücutsuz veri toplama, kalite kontrolü, eğitim ve gerçek cihaz değerlendirme zincirini içeren bir sistem; ayrıca 2000 saatten fazla, 3000 görevi kapsayan çok modalli vücutsuz veri kümesi de tamamen paketlenmiş şekilde sunulmuştur.


Kağıt adresi: https://arxiv.org/abs/2604.13001
Bu, ülkede ilk kezdi, bu yüzden ilgili makaleyi derinlemesine inceledim:
Kısaca, XRZero-G0 makalesi iki şey yaptı: ilk olarak, robotik veri toplamanın "kara kutusunu" açtı ve yüksek kaliteli bir veri setini çok düşük maliyetle nasıl toplayacağınızı adım adım gösterdi. İkincisi, verilerle nasıl eğitim yapılacağını adım adım anlattı.
İlk nokta veri toplama. Daha önce "bedensel endüstride veri toplamak hem zor hem de pahalı" gibi ifadeleri duymuş olabilirsiniz; hatta bazıları bedensel gelişimin yavaşlamasının nedeninin veri toplama olduğunu iddia ettiler.
Büyük modeller metinlerle beslenir, bunlar internetin her yerinde mevcuttur. Robotlar fiziksel verilerle beslenir, her biri gerçek para ile toplanmalıdır. Ayrıca geçmişte veri toplama konusunda sektörde üç büyük tuzağı vardı: pahalı, kirli ve yeniden kullanılamaz. Bu da gövdeli veri katmanının "imkânsız üçgenini" oluşturur.

XRZero-G0 makalesinde, temel olarak şu cümleyle özetlenebilen akıllı bir çözüm sunuldu: İnsanlar cihazları takarak iş yapar, sahada robotlara gerek yoktur.
Bu yol aslında daha önce de geçilmişti (örneğin UMI paradigm), ancak bu yöntem önceki versiyonlarda kritik bir soruna sahipti: toplanan veriler bir "kara kutu" gibiydi ve gerçek cihazın çalışıp çalışmayacağını bilmiyordunuz. XRZero-G0, bu sefer üç adet "güvenlik kontrolleri" aracılığıyla kara kutuyu şeffaf bir beyaz kutuya dönüştürdü.
İlk güvenlik kontrolleri: üç kamera.
Geçmişte, elde taşınabilir veri toplama cihazları yalnızca tek açılı veya çift açılıydı; bu, eller kesiştiğinde veya nesneler kollarla engellendiğinde verilerin tamamen bozulmasına neden oluyordu. XRZero-G0, çözümü oldukça doğrudan: operatöre PICO VR gözlük takır ve başının üzerinde bir genel kamera, her iki bileğinde de bir kamera yerleştirir.

Bu üç açıdan görünüm, altı serbestlik dereceli pozisyon bilgisi ve sırt çantası kenar hesaplama ile zaman-zaman hizalama eklenerek doğruluk doğrudan ≤4 mm’ye düşer; ne kadar dönerseniz, eğilirseniz veya hareket ederseniz edin, engellenme ve kayma sorunu yaşanmaz.

İkinci güvenlik kontrolü: Bir sanal limit ayarlayıcı kurun.
İnsanların eklemleri esnek olup yoga yapabiliyor, ancak robotlar yapamıyor. Önceki uzaktan kumanda sırasında, robotun yapamayacağı bir hareket yaptım ve motor yanmış oldu. XRZero-G0 akıllı, otomatik ters kinematik (IK) doğrulamasını kullanarak eklemlerin sınırlarını aşan hareketleri filtreliyor.
Üçüncü güvenlik kontrolü: Gerçek cihaz geri oynatma.
İki ilk filtre tamamlandıktan sonra, sistem rastgele bir miktar veriyi doğrudan gerçek iki kollu robotlara "açık döngü geri oynatma" için gönderir. Robotlar görevi başarıyla tamamladığında, bu veri kütüphanesine eklenir.
Üç katlı funel filtresinden geçirildikten sonra, veri girişi geçerlilik oranı %85'in üzerinde yükseldi, kullanılabilirliği gerçek cihaz verileriyle aynıdır ve veri toplama hızı daha hızlıdır.
Kağıttaki verilere göre, basit görevler 35 saniyeden 15 saniyeye indirildi ve 2,33 kat hızlanma sağlandı; karmaşık görevlerde de 1,71 kat hızlanma sağlandı. Zirve veri alma hızı saatte 93,2 yolculuk oldu. Bu gerçek cihazlardan daha iyi değil mi?

Ancak yukarıdakiler sadece "veri nasıl daha iyi toplanır" konusunu öğretir; XRZero-G0 makalesinde daha da önemli olan, "veri nasıl eğitilir" konusunu öğretmektir.
Gövdeli eğitimde, herkes "ucuz gerçek veri" ve "pahalı gerçek makine verisi"ni birlikte kullanmak gerektiğini bilir, ancak oran nasıl ayarlanır? Eskiden bunun için sadece deneme yanılma yöntemi kullanılırdı.
XRZero-G0 ekibi, sistematik bir deney dizisi gerçekleştirdi ve nihayetinde bir "altın oran" keşfetti.
Bu önce, üç farklı方案 karşılaştırdılar:
▪ 500 adet saf veri (taban)
▪ 500 gerçek cihaz + 500 cihazsız (1:1)
▪ 50 gerçek cihaz + 500 vücutsuz (10:1)
Sonuç beklenenin dışındaydı: 10:1 senaryosu, 500 gerçek cihaz temel verisiyle aynı veya daha yüksek başarı oranına sahipti. Yani: Gerçek cihaz veri kullanımınızı %90 azaltın, toplam maliyeti geleneksel yöntemlerin yirmide birine düşürün ve ortaya çıkan model aynı derecede akıllı olacak. 20 kat maliyet verimliliği artışı.
Makale, bunun arkasındaki nedeni "az örneklilik fiziksel sabitleme etkisi" olarak açıklıyor.

Henüz bitmedi, bu veri setiyle eğitilen model, "sıfır örnek" üzerinden farklı varlıklar arasında geçiş yapabiliyor.
Daha önce de belirtildiği gibi, geleneksel gerçek makine uzaktan kontrolünde en büyük korku, ana nesnenin taşınmasıdır. Masanın yüksekliği on santim artarsa veya başka bir robotla değiştirilirse, sistem hemen bozulur. Ancak XRZero-G0, sırt çantası tipindedir ve operatör hareket halindeyken, veri toplama süreci boyunca görüş açısı, yükseklik ve ışık doğal olarak sürekli değişir. Bu zengin "gürültü", modelin son derece güçlü bir direnç kazanmasına neden olur.
Makale, çok etkileyici ayrıntılar sunuyor: Bu karışık veriyle eğitilen model, EX001 ve CX001'e yüklendiğinde, gerçek cihaz verileriyle hiç karşılaşmamış olmasına rağmen doğrudan dağıtılıyor ve çiçek düzenleme, havluları katlama, sosis yerleştirme gibi görevleri sorunsuzca gerçekleştiriyor.

XRZero-G0 hakkında basit bir değerlendirme: Bu makale, "veri nasıl düşük maliyetle toplanır" ve "veri nasıl verimli şekilde kullanılır" gibi iki temel konuyu, bir kullanım kılavuzu gibi mesleki kişiler için ayrıntılı ve anlaşılır bir şekilde sunuyor.
Herkes, gövdeli endüstrinin "Demo yarışından" veri yarışına geçtiğini fark ediyor. Ancak süre nasıl birikir, endüstri bunun konusunda hemfikir değil ve yönü belirsiz. XRZero-G0, "veri toplamayı daha kolay hale getirmeyi", "mükemmel veri oranını bulmayı" ve nihayetinde "sıfır örnekli çapraz varlık aktarımını" gerçekleştirmeyi içeren tüm süreci endüstriye öğretti.
Bu tür mühendislik temelli bir çalışma, tek bir üniversite laboratuvarı ya da ünlü bir akademisyen tarafından tek başına tamamlanamaz; bu, hem akademik hem de endüstriyel bilgiye sahip bir endüstri ekibi olmalıdır.
XRZero-G0'nun arkasındaki şirket, bağımsız değişken robotları (X-Square Robot)dir.
XRZero-G0'nun neden mümkün olduğunu anlamak için yol seçimlerine bakmak yeterli: Şirket, ilk günden itibaren uçtan uca büyük modelleri seçti ve aynı zamanda VLA, WM ve WUM üç yolunu keşfetti. Sektör içi herkes bilir ki, bu yol, sağlam bir altyapı kapasitesi olmadan tamamen mümkün değildir; bu nedenle, WALL-OSS'tan XRZero-G0'a kadar, 自变量 her zaman altyapı ile ilgili altyapılar inşa etti.
Bu yol zor olsa da doğru. Sermaye bakıldığında, bağımsız değişken iki yıldan az bir sürede 9 finansman turu gerçekleştirdi, değerlemesi 10 milyarın üzerinde ve ByteDance, Meituan, Alibaba ve Xiaomi gibi dört büyük şirket hissedar listesinde yer alıyor.
XRZero-G0'un tamamen açık kaynak olma nedeni daha basit ve direkt.
Bir şirketin tek başına "vücutlu ChatGPT anını" yaratması mümkün değil. Üniversiteler, küçük ve orta ölçekli takımlar, bireysel geliştiriciler XRZero-G0 standart araç zincirini kullanarak veri üretmeye başladığında, tüm endüstrinin veri döngüsü gerçekten harekete geçer ve o zaman bağımsız değişkenin koruma duvarı inşa edilir.
XRZero-G0 için GitHub sayfası aşağıda verilmiştir, denemek için ziyaret edin:
https://github.com/X-Square-Robot/XRZero-G0
