المؤلف: Will Douglas Heaven
DeepChain TechFlow
مقدمة شينتشاو: حولت Niantic أكثر من 30 مليار صورة لمدن التقطها لاعبو Pokémon Go إلى عمل جديد. استخدمت شركة Niantic Spatial الفرعية للذكاء الاصطناعي هذه البيانات لتدريب نظام تحديد موقع بصري يمكنه تحقيق دقة في التحديد على مستوى السنتيمتر، وهي دقة تفوق بكثير أداء نظام GPS في وديان المدن. أول عميل رئيسي هو شركة روبوتات التسليم Coco Robotics. من التقاط بيكاشو إلى توصيل البيتزا، قد تكون هذه واحدة من أكثر مسارات التجارة الإلكترونية للبيانات الجماعية غير المتوقعة.
النص الكامل كالتالي:
بوكيمون غو هي أول لعبة AR ظاهرة عالميًا. أطلقتها نيانتيك، وهي شركة تابعة لجوجل، في عام 2016، وسرعان ما انتشرت هذه اللعبة التي تدمج لعب الواقع المعزز على أساس عالم بوكيمون عبر جميع أنحاء العالم. من شيكاغو إلى أوسلو إلى جي no شima، امتلأت الشوارع باللاعبين الذين يتطلعون للقبض على بابي، أو سكواتل، أو (إذا حالفهم الحظ) على غاليلاي سيلكتريك – وهي تطفو فوق العالم الحقيقي، على بعد خطوة واحدة فقط من الوصول إليها.
ببساطة، هذا يعني أن عددًا هائلاً من الأشخاص يلتقطون صورًا لعدد هائل من المباني باستخدام هواتفهم. يقول براين مكليندون، الرئيس التنفيذي للتقنية في Niantic Spatial: "تم تثبيت هذا التطبيق من قبل 500 مليون شخص خلال 60 يومًا". Niantic Spatial هي شركة ذكاء اصطناعي انفصلت عن Niantic في مايو الماضي. وفقًا لبيانات شركة الألعاب Scopely (التي اشترت Pokémon Go من Niantic في نفس الفترة)، لا يزال لدى هذه اللعبة أكثر من 100 مليون لاعب نشط في عام 2024، أي بعد مرور 8 سنوات على إطلاقها.
الآن، تستخدم Niantic Spatial هذا المخزن الاستثنائي للبيانات المجمعة من قبل الجمهور — صور معالم حضرية من هواتف مئات الملايين من لاعبي Pokémon Go، مصحوبة بعلامات موقع فائقة الدقة — لبناء نموذج عالمي (World Model). هذه هي اتجاه تقني رائج حاليًا، بهدف تثبيت ذكاء نماذج اللغة الكبيرة (LLM) في البيئات الحقيقية.
أحدث منتج للشركة هو نموذج يتيح تحديد موقعك على الخريطة بدقة تصل إلى بضعة سنتيمترات باستخدام بضع صور لمباني أو معالم أخرى. إنهم يرغبون في استخدامه لمساعدة الروبوتات على تحقيق ملاحة أكثر دقة في المناطق التي تكون فيها إشارات GPS غير موثوقة.
كأول تحقق واسع النطاق للتكنولوجيا، وقعت Niantic Spatial شراكة مع Coco Robotics. Coco هي شركة ناشئة تقوم بتشغيل روبوتات توصيل الوجبات في آخر ميل في عدة مدن في الولايات المتحدة وأوروبا. يقول ماكليندون: "كان الجميع يعتقد أن الواقع المعزز هو المستقبل، وأن نظارات الواقع المعزز ستظهر قريبًا، لكن الروبوتات أصبحت أول المستخدمين."
من بيكاشو إلى توصيل البيتزا
نشرت Coco Robotics حوالي 1000 روبوت بحجم حقيبة سفر في لوس أنجلوس، شيكاغو، جيرسي سيتي، ميامي وهيلسينكي، قادرة على حمل ما يصل إلى 8 بيتزا ضخمة أو 4 أكياس من البقالة. وفقًا للرئيس التنفيذي زاك راش، أكملت هذه الروبوتات أكثر من 500,000 عملية توصيل حتى الآن، وسافرت ملايين الأميال في ظروف طقس متنوعة.
لكن لمنافسة راكبي البشر، يجب أن يكون روبوتات كوكو (التي تسير على الأرصفة بسرعة حوالي 5 أميال في الساعة) موثوقة بدرجة كافية. قال راش: "أفضل طريقة عملنا هي الوصول في الوقت المحدد الذي نخبرك به". وهذا يعني عدم الضياع.
المشكلة التي تواجهها Coco هي عدم القدرة على الاعتماد على نظام تحديد المواقع العالمي (GPS). في المدن، تنعكس إشارات الراديو بين المباني وتتعارض مع بعضها، مما يجعل إشارة GPS ضعيفة. "نقوم بالتسليم في العديد من المناطق الكثيفة التي تحتوي على مباني شاهقة وأنفاق تحت الأرض وجسور مرتفعة، حيث لا يعمل نظام تحديد المواقع العالمي تقريبًا أبدًا"، كما يقول راش.
قال ماكليندون: "إن وادي المدينة هو المكان الذي يظهر فيه نظام تحديد المواقع العالمي أسوأ أداء له في جميع أنحاء العالم. فترى النقطة الزرقاء على هاتفك، وغالبًا ما تنحرف بمسافة 50 مترًا، وتضعك مباشرة في شارع آخر، وفي اتجاه مختلف، على الجانب الآخر من الطريق." وهذا هو ما تهدف إليه Niantic Spatial لحله.
على مدار السنوات القليلة الماضية، جمعت Niantic Spatial بيانات من لاعبي Pokémon Go وIngress (اللعبة المحمولة المعتمدة على الواقع المعزز التي أطلقتها Niantic في عام 2013) لبناء نظام تحديد موضعي بصري (Visual Positioning System) — يحدد موقعك بناءً على ما تراه. قال جون هانك، الرئيس التنفيذي لـ Niantic Spatial: "جعل بيكاشو يجري حقًا في الشوارع، وجعل روبوتات Coco تتحرك بأمان ودقة عبر المدينة، هما في جوهرهما نفس المشكلة."
"التحديد البصري ليس تقنية جديدة"، كما يقول كونراد فينزل من شركة الخرائط الرقمية والتحليل المكاني ESRI، "لكن من الواضح أنه كلما زاد عدد الكاميرات الخارجية، أصبح أكثر فعالية."
درّب Niantic Spatial النموذج باستخدام 30 مليار صورة ملتقطة في البيئات الحضرية. هذه الصور تتركز بشكل خاص بكثافة حول "نقاط ساخنة" — المواقع المهمة التي تشجع ألعاب Niantic اللاعبين على زيارتها، مثل قاعات معارك بوكيمون. قال ماكليندون: "لدينا أكثر من مليون موقع حول العالم يمكنها تحديد موقعك بدقة، نحن نعرف أين تقف، بدقة تصل إلى بضعة سنتيمترات. والأهم من ذلك، نحن نعرف في أي اتجاه تنظر."
وبالتالي، فإن Niantic Spatial تمتلك آلاف الصور لكل من هذه المواقع المائة ألف، التُقطت من زوايا مختلفة وأوقات مختلفة وظروف جوية مختلفة في مواقع شبه متطابقة. وتُرفق كل صورة ببيانات تعريفية مفصلة: الموقع الدقيق للهاتف في الفضاء، والاتجاه، والوضعية، وما إذا كان الهاتف يتحرك، والسرعة والاتجاه، وغيرها.
درّبت الشركة النموذج باستخدام مجموعة البيانات هذه ليتمكن من التنبؤ بدقة بموقعه من خلال "ما يراه"، حتى في المناطق خارج المليون نقطة ساخنة حيث تكون البيانات البصرية وبيانات الموقع نادرة.
بالإضافة إلى نظام تحديد المواقع العالمي (GPS)، يستخدم روبوت كوكو (المزود بأربع كاميرات) الآن هذا النموذج لتحديد موقعه الحالي وجهته. تم تثبيت كاميرات الروبوت على ارتفاع الورك، وتوجه في جميع الاتجاهات، مما يوفر زاوية رؤية تختلف قليلاً عن تلك التي يراها لاعبو Pokémon Go، لكن راش يقول إن تكييف البيانات ليس معقدًا.
المنافسون يستخدمون أيضًا أنظمة التحديد البصري. على سبيل المثال، شركة Starship Technologies التي تأسست في إستونيا عام 2014، تقول إن روبوتاتها تستخدم أجهزة استشعار لبناء خريطة ثلاثية الأبعاد للبيئة المحيطة، وتحديد حواف المباني ومواقع أعمدة الإنارة.
لكن راش راهن على أن تقنية Niantic Spatial ستمنح Coco ميزة. فهو يعتقد أن هذا سيسمح للروبوتات بالوقوف بدقة في المواقع الصحيحة لاستلام الوجبات خارج المطاعم، دون عرقلة أي شخص، وبالتحديد أمام أبواب العملاء وليس على بعد خطوات قليلة — وهو ما كان يحدث أحيانًا في الماضي.
الانفجار الكامبري للروبوتات
عندما بدأت Niantic Spatial في تطوير نظام التحديد المكاني البصري، كان الهدف هو استخدامه في الواقع المعزز، كما يقول هانك. "إذا كنت ترتدي نظارات الواقع المعزز وترغب في أن يكون العالم الافتراضي ثابتًا في الاتجاه الذي تنظر إليه، فستحتاج إلى طريقة ما لتحقيق ذلك. لكننا حاليًا نشهد انفجارًا كمبريًا في مجال الروبوتات."
بعض الروبوتات تحتاج إلى مشاركة المساحات مع البشر، مثل مواقع البناء والأرصفة. قال هانك: "إذا أرادت الروبوتات الاندماج في هذه البيئات دون إزعاج البشر، فعليها امتلاك قدرات فهم مكاني مشابهة لقدرات البشر". "عندما يتم دفع الروبوتات أو اصطدامها، يمكننا مساعدتها على تحديد موقعها بدقة."
الشراكة مع Coco Robotics هي مجرد البداية. يقول هانك إن Niantic Spatial تبني أول مكونات ما يسميه "الخريطة الحية": محاكاة افتراضية فائقة الدقة تتغير مع تغير العالم الحقيقي. مع سير الروبوتات الخاصة بـ Coco وشركات أخرى حول العالم، ستقدم مصادر جديدة لبيانات الخرائط، مما يجعل النسخة الرقمية من العالم أكثر دقة تدريجيًا.
في رأي هانك وماكليندون، لا تصبح الخرائط أكثر دقة فحسب، بل تُستخدم أيضًا بشكل متزايد من قبل الآلات. وهذا يغيّر استخدامات الخرائط. فقد ساعدت الخرائط البشرية لفترة طويلة على تحديد مواقعهم. ومن 2D إلى 3D ثم إلى 4D (فكّر في المحاكاة الزمنية الحية مثل التوائم الرقمية)، فإن المبدأ الأساسي لم يتغير: النقاط على الخريطة تتوافق مع نقاط في الفضاء أو الزمن.
لكن الخرائط الموجهة للآلات قد تحتاج إلى أن تصبح أكثر شبهاً بدليل السياح، مليئة بالمعلومات التي يراها البشر أمراً مسلماً به. ترغب شركات مثل Niantic Spatial و ESRI في إضافة وصف إلى الخرائط، لإخبار الآلات بما تراه فعلاً، مع تسمية كل كائن بمجموعة من الخصائص. يقول هانك: "مهمة هذا العصر هي بناء وصف عالمي مفيد للآلات. البيانات التي نمتلكها تمثل نقطة انطلاق جيدة لفهم كيفية عمل بنية الاتصالات في العالم."
النماذج العالمية حاليةً في قمة شعبيتها، وNiantic Spatial يدرك هذا جيدًا. تبدو نماذج LLM وكأنها تعرف كل شيء، لكنها تفتقر إلى الحدس العام عند تفسير البيئة اليومية والتفاعل معها. والهدف من النماذج العالمية هو حل هذه المشكلة. بعض الشركات، مثل Google DeepMind وWorld Labs، تعمل على تطوير نماذج تُنشئ عوالم خيالية افتراضية فورًا، ثم تستخدمها كمختبرات تدريب للوكلاء الذكاء الاصطناعي.
يقول Niantic Spatial إنهم يتعاملون مع هذه المسألة من زاوية مختلفة. قال ماكليندون: "إذا جعلت الخريطة كافية في التفاصيل، فستلتقط في النهاية كل شيء. لم نصل إلى تلك المرحلة بعد، لكننا نسعى للوصول إليها. أنا الآن أركز بشدة على محاولة إعادة بناء العالم الحقيقي."
