Niantic Menggunakan 3 Bilion Gambar Pokémon Go untuk Melatih Sistem Pelayaran Robot

iconTechFlow
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Niantic Spatial menggunakan 3 bilion gambar dari Pokémon Go dan Ingress untuk melatih sistem penentuan posisi visual dengan ketepatan setinggi sentimeter. Teknologi ini, yang lebih baik daripada GPS di bandar, kini digunakan oleh Coco Robotics untuk penghantaran. Pelaburan nilai dalam kripto sering memberi ganjaran terhadap kesabaran, dan inovasi sebegini boleh mengubah nisbah risiko-keuntungan bagi syarikat-syarikat yang menggunakan AI dalam logistik. Sistem ini membantu robot menavigasi kawasan padat di mana GPS gagal, meningkatkan kebolehpercayaan penghantaran.

Penulis: Will Douglas Heaven

DeepOcean TechFlow

Panduan DeepCha: Niantic menjadikan 30 miliar gambar bandar yang diambil oleh pemain Pokémon Go sebagai perniagaan baharu. Anak syarikat AI-nya, Niantic Spatial, menggunakan data ini untuk melatih sistem penentuan lokasi visual yang mampu mencapai ketepatan sentimeter, jauh melebihi prestasi GPS di kawasan lembah bandar. Pelanggan besar pertama ialah syarikat robot penghantaran makanan, Coco Robotics. Dari menangkap Pikachu hingga menghantar pizza, ini mungkin salah satu laluan komersialasi data penglibatan awam yang paling tidak disangka.

Seluruh teks adalah seperti berikut:

Pokémon Go ialah permainan AR pertama di dunia yang menjadi fenomena. Dikeluarkan pada tahun 2016 oleh Niantic, anak syarikat Google, permainan yang menggabungkan elemen augmented reality ke dalam IP Pokémon ini dengan cepat menyebar ke seluruh dunia. Dari Chicago hingga Oslo hingga Pulau Enoshima, pemain membanjiri jalan-jalan, berharap dapat menangkap seorang Pidgey, Squirtle, atau (jika beruntung besar) seekor Galarian Zapdos yang sangat jarang—mereka mengambang di atas dunia nyata, hanya tinggal sedikit lagi untuk dapat meraihnya.

Secara ringkas, ini bermaksud ramai orang mengambil gambar bangunan yang banyak menggunakan telefon bimbit. “Lima ratus juta orang memasang aplikasi ini dalam 60 hari,” kata Brian McClendon, CTO Niantic Spatial. Niantic Spatial ialah syarikat AI yang dipisahkan daripada Niantic pada Mei tahun lepas. Menurut data daripada syarikat permainan Scopely (yang pada masa yang sama membeli Pokémon Go daripada Niantic), permainan ini masih mempunyai lebih daripada 100 juta pemain aktif pada tahun 2024, walaupun telah berlalu 8 tahun sejak pelancarannya.

Sekarang, Niantic Spatial sedang memanfaatkan perpustakaan data kolaboratif yang tak tertandingi ini—gambar tanda-tanda bandar dari ratusan juta peminat Pokémon Go di seluruh dunia, dilengkapi dengan penanda lokasi yang sangat tepat—untuk membina satu model dunia (World Model). Ini adalah arah teknologi terkini yang bertujuan untuk menetapkan kecerdasan LLM dalam persekitaran dunia nyata.

Produk terbaru syarikat ini adalah sebuah model: hanya dengan beberapa gambar pantas bangunan atau tanda tempat lain, ia dapat menentukan lokasi anda di peta dengan ketepatan beberapa sentimeter. Mereka ingin menggunakannya untuk membantu robot mencapai navigasi yang lebih tepat di kawasan di mana GPS tidak boleh dipercayai.

Sebagai pengesahan besar pertama bagi teknologi, Niantic Spatial baru-baru ini bekerja sama dengan Coco Robotics. Coco adalah sebuah syarikat rintisan yang telah melancarkan robot penghantaran makanan hingga ke pintu di pelbagai bandar di Amerika Syarikat dan Eropah. “Semua orang percaya AR adalah masa depan, dan kacamata AR akan segera tiba,” kata McClendon, “tetapi robotlah yang menjadi pengguna pertama.”

Dari Pikachu hingga penghantaran pizza

Coco Robotics telah menghimpun sekitar 1.000 robot sebesar koper di Los Angeles, Chicago, Jersey City, Miami, dan Helsinki, yang mampu membawa hingga 8 pizza ukuran besar atau 4 beg galas. Menurut CEO Zach Rash, robot-robot ini telah menyelesaikan lebih dari 500.000 penghantaran dan telah melintasi jutaan batu dalam pelbagai keadaan cuaca.

Namun, untuk bersaing dengan pengendara manusia, robot Coco (yang bergerak di trotoar pada kelajuan sekitar 5 batu sejam) mesti cukup boleh dipercayai. “Cara terbaik kami berfungsi ialah tiba pada masa yang telah diberitahu kepada anda,” kata Rash. Ini bermakna tidak boleh tersesat.

Masalah yang dihadapi Coco ialah tidak dapat bergantung kepada GPS. Di bandar, isyarat radio memantul dan saling mengganggu di antara bangunan-bangunan, menyebabkan isyarat GPS lemah. "Kami melakukan penghantaran di banyak kawasan padat dengan bangunan tinggi, terowong bawah tanah, dan jalan layang, di mana GPS hampir selalu tidak berfungsi," kata Rash.

“Kawasan lembah bandar adalah tempat di mana GPS berprestasi paling buruk di seluruh dunia,” kata McClendon. “Anda melihat titik biru di telefon anda, ia sering bergerak sejauh 50 meter, secara langsung meletakkan anda di blok lain, arah lain, di seberang jalan.” Inilah masalah yang ingin diselesaikan oleh Niantic Spatial.

Dalam beberapa tahun terakhir, Niantic Spatial telah mengumpulkan data yang dihasilkan oleh pemain Pokémon Go dan Ingress (permainan AR mudah alih pertama Niantic yang dilancarkan pada 2013) untuk membina sistem penentuan posisi visual (Visual Positioning System) — yang menentukan di mana anda berada berdasarkan apa yang anda lihat. “Membuat Pikachu berlari-lari secara nyata di jalan-jalan, dan membuat robot Coco melintasi bandar dengan selamat dan tepat, pada dasarnya adalah masalah yang sama,” kata CEO Niantic Spatial, John Hanke.

“Visual positioning bukanlah teknologi baharu,” kata Konrad Wenzel dari ESRI, syarikat peta digital dan analisis geospasial, “tetapi jelas semakin banyak kamera di luar sana, semakin baik ia berfungsi.”

Niantic Spatial melatih model dengan 30 miliar gambar yang diambil dari persekitaran bandar. Gambar-gambar ini terkumpul terutamanya di sekeliling "titik panas" — lokasi penting yang mendorong pemain ke arahnya dalam permainan Niantic, seperti pusat pertarungan Pokémon. "Kami mempunyai lebih daripada satu juta lokasi di seluruh dunia yang boleh menentukan lokasi anda dengan tepat," kata McClendon, "Kami tahu di mana anda berdiri, dengan ketepatan beberapa sentimeter. Lebih penting lagi, kami tahu arah yang anda lihat."

Hasilnya, untuk setiap satu juta lokasi tersebut, Niantic Spatial memiliki ribuan gambar yang diambil dari posisi yang hampir sama, tetapi dari sudut yang berbeza, pada masa yang berbeza, dan dalam keadaan cuaca yang berbeza. Setiap gambar dilengkapi dengan metadata terperinci: posisi tepat telefon dalam ruang, arah,姿态, sama ada ia bergerak, kelajuan, dan arah, dan sebagainya.

Perusahaan melatih model ini menggunakan set data ini, membolehkannya meramal kedudukannya dengan tepat berdasarkan "apa yang dilihatnya"—walaupun di luar 1 juta titik panas di mana data gambar dan lokasi相对 jarang.

Selain GPS, robot Coco (yang dilengkapi 4 kamera) kini juga menggunakan model ini untuk menentukan di mana ia berada dan ke mana ia akan pergi. Kamera robot dipasang pada ketinggian pinggul dan menghadap ke segala arah, dengan sudut pandang yang sedikit berbeza daripada pemain Pokémon Go, tetapi Rash mengatakan penyesuaian data tidak rumit.

Pesaing juga menggunakan sistem penentuan posisi visual. Sebagai contoh, syarikat penghantaran robot Starship Technologies yang ditubuhkan di Estonia pada tahun 2014, menyatakan bahawa robot mereka menggunakan sensor untuk membina peta 3D persekitaran, menandakan tepi bangunan dan lokasi lampu jalan.

Namun, Rash bertaruh bahawa teknologi Niantic Spatial akan memberikan kelebihan kepada Coco. Beliau percaya ia membolehkan robot berhenti dengan tepat di lokasi pengambilan makanan di luar restoran, tidak menghalang sesiapa pun, dan berhenti di depan pintu pelanggan, bukan beberapa langkah jauhnya—keadaan yang pernah berlaku sebelum ini.

Ledakan Kambrium robot

Semasa Niantic Spatial memulakan sistem penentuan posisi visual, tujuannya adalah untuk digunakan dalam realiti tertambah, kata Hanke. "Jika anda memakai kacamata AR dan ingin dunia maya terkunci pada arah yang anda lihat, anda memerlukan kaedah tertentu untuk melakukannya. Tetapi sekarang kita sedang menyaksikan ledakan Kambrium dalam bidang robotik."

Beberapa robot perlu berkongsi ruang dengan manusia, seperti tapak pembinaan dan trotoar. “Jika robot ingin menyatu dalam persekitaran ini tanpa mengganggu manusia, mereka mesti memiliki kemampuan memahami ruang yang serupa dengan manusia,” kata Hanke. “Ketika robot didorong atau ditabrak, kami boleh membantu ia menentukan lokasinya dengan tepat.”

Kerjasama dengan Coco Robotics hanyalah permulaan. Hanke mengatakan bahawa apa yang sedang dibina oleh Niantic Spatial ialah komponen-komponen pertama daripada apa yang disebutnya sebagai "Peta Hidup" (Living Map): satu simulasi dunia maya presisi ultra-tinggi yang berubah seiring dengan perubahan dunia nyata. Semasa robot-robot Coco dan syarikat-syarikat lain bergerak di seluruh dunia, mereka akan menyediakan sumber data peta baharu yang membuat salinan dunia digital menjadi semakin halus.

Menurut Hanke dan McClendon, peta tidak hanya menjadi lebih halus, tetapi juga semakin banyak digunakan oleh mesin. Ini mengubah tujuan peta. Peta telah lama membantu manusia menentukan posisi mereka. Dari 2D ke 3D hingga 4D (pertimbangkan simulasi real-time seperti digital twin), prinsip dasarnya tetap sama: titik-titik di peta sesuai dengan titik-titik dalam ruang atau waktu.

Namun, peta yang ditujukan kepada mesin mungkin perlu menjadi lebih seperti panduan pelancong, penuh dengan maklumat yang dianggap manusia sebagai perkara biasa. Syarikat-syarikat seperti Niantic Spatial dan ESRI ingin menambahkan huraian kepada peta, memberitahu mesin apa yang sebenarnya dilihatnya, dengan setiap objek diberi label serangkaian atribut. “Tugas zaman ini adalah membina perihalan dunia yang berguna untuk mesin,” kata Hanke. “Data yang kita miliki adalah permulaan yang baik dalam memahami bagaimana struktur sambungan dunia berfungsi.”

Model dunia kini sangat popular, dan Niantic Spatial sangat sedar akan hal ini. LLM kelihatan tahu segalanya, tetapi hampir tidak mempunyai akal sehat semasa mentafsir dan berinteraksi dengan persekitaran harian. Model dunia ditujukan untuk menyelesaikan masalah ini. Beberapa syarikat, seperti Google DeepMind dan World Labs, sedang membangunkan model yang mampu menjana dunia fantasi maya secara serta-merta, kemudian menggunakannya sebagai medan latihan untuk agen AI.

Niantic Spatial mengatakan mereka mendekati masalah ini dari sudut yang berbeza. Dengan membuat peta sehingga sangat halus, akhirnya anda akan menangkap segalanya, kata McClendon: "Kami belum sampai ke tahap itu, tetapi kami ingin sampai ke sana. Saya kini sangat fokus pada cubaan untuk membangun semula dunia nyata."

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.