خود متعین روبوٹ کا خود مفتوح پہلا جسمانی ڈیٹا کلیکشن بلاک سسٹم XRZero-G0۔ اس منصوبے میں بے جسم ڈیٹا کلیکشن، معیار کی جانچ، تربیت اور اصل روبوٹ کی جانچ کا مکمل لینک ایک ساتھ جمع کیا گیا ہے، جس کے ساتھ 2000 سے زائد گھنٹوں اور 3000 کاموں پر مشتمل بہ متعدد ماڈل ڈیٹا سیٹ دستیاب ہے۔ مرکزی حل میں آپریٹر VR ڈیوائس اور کئی کیمرے پہن کر حرکت کو کیپچر کرتا ہے، جس میں مقامی طور پر روبوٹ کی ضرورت نہیں ہوتی۔ سسٹم تین سیکورٹی چیکس — تین کیمرہ نظریہ، ورچوئل لِمٹر IK ویریفکیشن، اور اصل روبوٹ ری پلے — کے ذریعے ڈیٹا کے معیار کو یقینی بناتا ہے، جس کی اثرات کی شرح 85% سے زائد ہے۔ تجربات سے پتہ چلتا ہے کہ 10:1 کے بے جسم اور اصل ڈیٹا کے تناسب سے تربیت دینے سے 500 صرف اصل ڈیٹا کے برابر نتائج حاصل ہوتے ہیں، جبکہ کلیکشن لاگت پچاسویں حصے تک کم ہو جاتی ہے۔ اس سسٹم میں صفر نمونہ کراس-بادی مائگریشن بھی شامل ہے، جو روبوٹ ڈپلومنٹ کے بادی فرق کا حل فراہم کرتا ہے۔مضمون کا مصنف، ذریعہ: Leifengwang
حالیہ وقت میں جسمانی صنعت ایک اوپن سورس پراجیکٹ کے ذریعے سرخیوں میں رہی۔
شروع میں صرف ایک چھوٹے سے گروپ میں یہ بات گھوم رہی تھی کہ "کسی نے کمیونٹی میں ایک مکمل جسمانی ڈیٹا سیٹ کو اوپن سورس کر دیا ہے۔" میں نے "دیکھنے کے لیے" جانے کا فیصلہ کیا، لیکن جتنا دیکھا، اتنا ہی محسوس ہوا کہ یہ صرف ایک عام ڈیٹا سیٹ نہیں ہے، یہ تو ایک مکمل بے وجود ڈیٹا اکٹھا کرنے کا نظام ہے۔
دوسرے الفاظ میں، دوسرے لوگوں کی طرف سے اوپن سورس کیا گیا "کوڈ کا ایک ٹکڑا" ہے، جبکہ یہ اوپن سورس ایک مکمل لینک ہے جس میں بدن کے بغیر ڈیٹا اکٹھا کرنا، معیار کی جانچ، تربیت اور اصل مشین کا جائزہ لینا شامل ہے، ساتھ ہی 2000 سے زائد گھنٹوں اور 3000 کاموں پر مشتمل بہ متعدد ماڈل بدن کے بغیر ڈیٹا سیٹ بھی مکمل طور پر شائع کردیا گیا ہے۔


کاغذ کا لنک: https://arxiv.org/abs/2604.13001
یہ ملک میں پہلی بار تھا، اس لیے میں نے متعلقہ تحقیقی مقالہ کو گہرا جانچا:
بس اس کا مطلب یہ ہے کہ XRZero-G0 کے پیپر نے دو کام کیے: پہلا، روبوٹکس ڈیٹا کلیکشن کے "بلاک باکس" کو کھولا اور ایک اعلیٰ معیار کے ڈیٹا کو بہت کم لاگت پر کیسے جمع کیا جائے، اس کا مرحلہ وار طریقہ دکھایا۔ دوسرا، آپ کو ڈیٹا ٹریننگ کیسے کرنی ہے، اس کا مرحلہ وار طریقہ سکھایا۔
سب سے پہلا نقطہ، ڈیٹا کلیکشن۔ پہلے آپ نے شاید سنا ہو کہ "جسمانی صنعت میں ڈیٹا جمع کرنا مشکل اور مہنگا ہے"، اور کچھ لوگوں نے یہ بھی کہا ہے کہ جسمانی ترقی کا دیر ہونا ڈیٹا جمع کرنے کی وجہ سے ہے۔
آپ بڑے ماڈلز کو دیکھیں، ان کے لیے ٹیکسٹ دستیاب ہے، انٹرنیٹ پر ہر جگہ۔ لیکن روبوٹس کو فزیکل ڈیٹا کی ضرورت ہوتی ہے، جس کا ہر ڈیٹا اصل پیسہ خرچ کر کے حاصل کیا جاتا ہے۔ اور پچھلے زمانے میں ڈیٹا جمع کرنے کے لیے صنعت میں تین بڑے جال ہیں: مہنگا، گندہ، اور دوبارہ استعمال نہ ہونا، جو جسمانی ڈیٹا لیئر کا "ناممکن تھلیا" بن گیا۔

XRZero-G0 کے مقالے میں، ایک چالاک حل پیش کیا گیا ہے، جس کا مرکزی جملہ یہ ہے: انسان ڈیوائس پہن کر کام کرتا ہے، جہاں کام ہو رہا ہے وہاں روبوٹ کی ضرورت نہیں۔
اس راستے کو پہلے بھی کسی نے چل لیا ہے (مثلاً UMI پیرادائم)، لیکن اس طریقہ کار کا ایک مہلک عیب یہ تھا کہ جمع کیے گئے ڈیٹا ایک "بلاک باکس" کی طرح ہوتے تھے، آپ نہیں جانتے تھے کہ اصل مشین کام کرے گی یا نہیں۔ لیکن XRZero-G0 نے تین "سیکورٹی چیکس" کے ذریعے اس بلاک باکس کو شفاف سفید باکس میں تبدیل کر دیا ہے۔
پہلا سیکورٹی چیک: تین کیمرے۔
پچھلے کئی سیمپلز میں ہینڈ ہیلڈ ڈیوائسز صرف ایک یا دو نظریں رکھتے تھے، جس کا ایک نقص یہ تھا کہ جب دونوں ہاتھ آپس میں کراس ہو جائیں یا کوئی شے بازو سے ڈھک جائے، تو ڈیٹا فوراً برباد ہو جاتا تھا۔ XRZero-G0 کا طریقہ بہت سیدھا ہے: آپریٹر کو PICO VR ہیڈسیٹ پہنایا جاتا ہے، سر کے اوپر ایک گلوبل کیمرہ لگایا جاتا ہے، اور دونوں کلائیوں پر الگ الگ کیمرے لگائے جاتے ہیں۔

ان تین نظروں کے زاویے کے ساتھ چھ آزادی کے درجہ حرارت کی معلومات، اور بیگ میں ایڈج کمپیوٹنگ کے ساتھ زمانی اور مکانی تطابق، درستگی فوراً ≤ 4 ملی میٹر ہو جاتی ہے، چاہے آپ کسی بھی طرح گھومیں، جھکیں یا چلیں، اوڑھنے اور بھٹکنے کا مسئلہ نہیں ہوگا۔

دوسرا سیکورٹی چیک: ایک ورچوئل لِمٹر انسٹال کریں۔
لوگ جانتے ہیں کہ انسانی جوڑے لچکدار ہوتے ہیں اور وہ یوگا کر سکتے ہیں، لیکن روبوٹ نہیں کر سکتے۔ پہلے ریموٹ آپریشن کے دوران، میں نے ایک ایسا حرکت کی جو روبوٹ نہیں کر سکتا تھا، جس کے نتیجے میں موٹر جل گیا۔ XRZero-G0 بہت ذکی ہے، جس نے خودکار اِنورس کائنی میٹکس (IK) تصدیق شامل کی ہے، جو جوڑوں کی حد سے باہر کے حرکات کو فلٹر کرتی ہے۔
تیسری سیکورٹی چیک: اصل ڈیوائس کا ریکارڈڈ ری پلے۔
دو فلٹرز کے بعد، سسٹم کچھ ڈیٹا کو براہ راست اصل دو بازو والے روبوٹ کو "اپنے آپ کو دہرانے" کے لیے دے دیا جائے گا۔ صرف اسی صورت میں یہ ڈیٹا ڈیٹا بیس میں شامل ہوگا جب روبوٹ کامیابی کے ساتھ کام مکمل کر لے۔
تین طبقات کے فلٹر سے گزرنے کے بعد، انٹری ڈیٹا کی موثر شرح 85% سے زیادہ ہو گئی، جس کی استعمال کی صلاحیت اصل ڈیوائس کے ڈیٹا کے برابر ہے اور کلکشن کی رفتار بھی تیز ہے۔
کاغذ میں دی گئی ڈیٹا کے مطابق، آسان کام 35 سیکنڈ سے 15 سیکنڈ تک کم ہو گیا، جس سے 2.33 گنا تیزی آئی؛ پیچیدہ کام بھی 1.71 گنا تیز ہو گئے۔ اس کی اعلیٰ ڈیٹا جمع کرنے کی رفتار 93.2 ٹریکس فی گھنٹہ ہے۔ کیا یہ اصل مشین سے زیادہ اچھا نہیں؟

لیکن اوپر صرف "ڈیٹا کو بہتر طریقے سے کیسے جمع کریں" سکھایا گیا، XRZero-G0 پیپر میں زیادہ اہم بات یہ ہے کہ یہ لوگوں کو "ڈیٹا کو کیسے ٹرین کریں" سکھاتا ہے۔
جس میں جسمانی تربیت، سب جانتے ہیں کہ "سستا بے جسم ڈیٹا" اور "مہنگا اصل ڈیٹا" کو ملا کر استعمال کرنا چاہیے، لیکن نسبت کیا ہونی چاہیے؟ پہلے تو صرف جادو کی بھرپوری پر انحصار کیا جاتا تھا۔
XRZero-G0 ٹیم نے ایک خاص طور پر مزیدار کام کیا، جس میں نظام مند طریقے سے تمام ممکنہ تجربات کیے گئے اور آخرکار ایک "سونے کا تناسب" دریافت کیا گیا۔
اس سے پہلے، انہوں نے تین منصوبوں کا موازنہ کیا:
▪ 500 خالص ماشینی ڈیٹا (بنیادی)
▪ 500 اصل ڈیوائسز + 500 بے جسم (1:1)
▪ 50 اصل ڈیوائسز + 500 بے جسم (10:1)
نتیجہ حیران کن تھا: 10:1 کا منصوبہ، صرف 500 سچے ڈیوائسز کی بنیادی سطح کے برابر یا اس سے بھی زیادہ کامیابی دکھاتا ہے۔ سادہ الفاظ میں: آپ سچے ڈیوائسز کے ڈیٹا استعمال کو 90 فیصد تک کم کر دیتے ہیں، مجموعی لاگت کو روایتی طریقے کے بیسویں حصے تک کم کر دیتے ہیں، اور تربیت دیا گیا ماڈل اتنے ہی ذہین نکلتا ہے۔ 20 گنا لاگت کی کارکردگی میں اضافہ۔
یہ تحقیقی مقالہ اس کی وجوہات کو "کم نمونہ فزیکل اینکر ایفیکٹ" کے نام سے سمجھاتا ہے۔

ابھی ختم نہیں ہوا، اس ڈیٹا سے تربیت یافتہ ماڈل "زیرو شاٹ" کراس-اونٹولوجی تبدیلی بھی کر سکتا ہے۔
پہلے بتایا گیا تھا کہ روایتی حقیقی مشین کی ریموٹ آپریشن میں سب سے بڑا خدشہ جسم کا منتقل ہونا ہے۔ اگر میز دس سینٹی میٹر زیادہ بلند ہو جائے یا روبوٹ بدل دیا جائے، تو فوراً خراب ہو جاتا ہے۔ لیکن XRZero-G0 بیگ کی شکل کا ہے، جس میں آپریٹر گھومتے رہتے ہیں، اور اس عمل کے دوران نظارہ، اونچائی اور روشنی خود بخود متغیر ہوتی رہتی ہے۔ اس سے پیدا ہونے والا امیر "شوخ" ماحول، ماڈل کو انتہائی مضبوط استحکام فراہم کرتا ہے۔
یہ تحقیقی مقالہ بہت متاثر کن تفصیلات پیش کرتا ہے: اس مخلوط ڈیٹا سے تربیت یافتہ ماڈل کو EX001 اور CX001 پر ڈال دیا گیا، جس نے اصل مشین ڈیٹا نہیں دیکھا تھا، لیکن براہ راست ڈپلویمنٹ کے بعد، پھول لگانا، تولیے طوڑنا اور سوسیج ڈالنا سب ٹھیک کام کیا۔

XRZero-G0 کی تفصیل پر مختصر بات چیت، اس تحقیقی مقالے کا مرکزی نقطہ یہ ہے کہ وہ "کم لاگت پر ڈیٹا کیسے جمع کیا جائے" اور "ڈیٹا کو کیسے موثر طریقے سے استعمال کیا جائے" — دونوں معاملات کو ایک ہدایات نامے کی طرح، مکمل طور پر اور واضح انداز میں صنعت کے ماہرین کے لیے پیش کرتا ہے۔
سب کو محسوس ہو رہا ہے کہ جسمانی صنعت "ڈیمو کی ترقی" سے "ڈیٹا کی ترقی" کی طرف منتقل ہو رہی ہے۔ لیکن وقت کو کیسے بڑھایا جائے، اس بارے میں صنعت میں ابھی تک اتفاق رائے اور رہنمائی کی کمی ہے۔ XRZero-G0 نے "ڈیٹا جمع کرنا آسان بنانا"، "بہترین ڈیٹا کا تناسب تلاش کرنا"، اور آخرکار "صفر نمونہ کراس اوبجیکٹ ٹرانسفر" تک کی پوری سلسلہ وار عمل کو صنعت کو سکھا دیا ہے۔
اس طرح کا انژینئرنگ کام کسی ایک یونیورسٹی کے لیب یا ستارہ ماہر کے لیے اکیلے ممکن نہیں ہے؛ اس کے لیے ایک� ایسی صنعتی ٹیم درکار ہے جو اکادمیک اور صنعت دونوں کو سمجھتی ہو۔
XRZero-G0 کے پیچھے کی کمپنی، خود متغیر روبوٹ (X-Square Robot) ہے۔
XRZero-G0 کیوں ممکن ہے، اس کو سمجھنے کے لیے ان کے راستوں کو دیکھیں: کمپنی نے پہلے دن سے ہی اینڈ تو اینڈ بڑے ماڈل کا انتخاب کیا، اور VLA، WM، اور WUM کے تین راستوں کا جائزہ لیا۔ صنعت کے لوگ جانتے ہیں کہ ایسا راستہ بنا نہیں جا سکتا جب تک کہ آپ کے پاس مضبوط Infra کی صلاحیت نہ ہو، اس لیے WALL-OSS سے لے کر XRZero-G0 تک، متغیر نے ہمیشہ Infra سے متعلقہ بنیادی ڈھانچہ تعمیر کیا ہے۔
یہ راستہ مشکل تو ہے، لیکن درست ہے۔ سرمایہ دیکھیں، کم سے کم دو سال میں 9 فنڈنگ راؤنڈز، اقدار 10 ارب سے زائد، بائٹڈانس، میونگ، علی بابا اور میئو کے چار بڑے کمپنیاں شیئر ہولڈرز کی فہرست میں ہیں۔
XRZero-G0 کو مکمل طور پر اوپن سورس کرنے کا سبب اور بھی سادہ اور براہ راست ہے۔
ایک کمپنی کے ذریعے جسمانی "ChatGPT لمحہ" نہیں بنایا جا سکتا۔ جب یونیورسٹیاں، چھوٹی اور درمیانی ٹیمیں، اور انفرادی ڈویلپرز XRZero-G0 کے معیاری ٹول چین کا استعمال کرکے ڈیٹا کی بڑی مقدار پیدا کر سکیں، تو پورے صنعت کا ڈیٹا فل وہیل اصل میں گھومنا شروع ہو جائے گا، اور اس وقت خود متغیر کا تحفظ بن جائے گا۔
آخر میں XRZero-G0 کا GitHub پیج دیا گیا ہے، اسے آزمائیں:
https://github.com/X-Square-Robot/XRZero-G0
