CEO DeepMind dan bapa AlphaGo, Demis Hassabis, telah menggunakan permainan untuk penyelidikan AI selama lebih daripada sepuluh tahun.
Kali ini, dia memasukkan AI ke dalam "Alam Semesta Hidup" yang telah berjalan selama 23 tahun: permainan maya luar angkasa EVE Online yang panduan pemula pun boleh mengecewakan pemain.
Permainan catur mempunyai akhir, tetapi EVE tidak.
Pada awal Mei, DeepMind mengumumkan kerjasama penyelidikan dengan EVE Online, kerana alam semesta EVE yang kompleks dan digerakkan oleh pemain merupakan kotak pasir selamat yang sempurna untuk menguji ingatan AI, pembelajaran berterusan, dan perancangan jangka panjang.

DeepMind bekerjasama dengan EVE, bukan untuk mengejar pengalaman permainan yang menarik atau memberdayakan mekanik permainan, tetapi untuk mengatasi tiga cabaran paling sukar yang diakui dalam penyelidikan agen AI hari ini; Hassabis meletakkan jawapannya pada permainan lama yang telah beroperasi selama 23 tahun.

Fenris Creations (sebelum ini CCP Games) mengumumkan kerjasama dengan DeepMind
Syarikat di sebalik EVE Online, pada 6 Mei, mengumumkan empat perkara pada hari yang sama:
- Dipisahkan semula daripada sistem induk Pearl Abyss;
- Dinamakan semula sebagai Fenris Creations;
- Menyelesaikan transaksi sebanyak US$120 juta;
- Sebagai sebahagian daripada pemisahan ini, Google memegang saham minoriti di Fenris Creations dan secara serentak melancarkan kerjasama penyelidikan dengan Google DeepMind.
Fenris Creations CEO Hilmar Veigar Pétursson menyatakan dalam pengumuman tersebut:
Peralihan ini tidak melibatkan pemecatan atau penstrukturan semula, pasukan, produk, dan pelan pembangunan kekal tidak berubah. EVE berterusan.
Dari segi data operasi, syarikat ini membawa "senjata sebenar" untuk berunding kerjasama, bukan menjual aset untuk bertahan hidup.
EVE Online menghasilkan lebih dari US$70 juta pada tahun 2025, dengan November mencatat pendapatan tertinggi sepanjang sejarah, dan Q4 menjadi kuartal dengan pendapatan tertinggi kedua dalam 20 tahun sejarah permainan ini.
Pemisahan Fenris Creations bermakna EVE kini mempunyai induk syarikat yang boleh membuat keputusan sendiri mengenai kerjasama penyelidikan, tanpa terikat dengan matlamat strategik syarikat pengeluar permainan yang lebih besar.

Kotak permainan meja yang diterbitkan oleh Fenris pada tahun 1997. Nama "Fenris" sudah wujud 6 tahun sebelum EVE Online; perubahan nama kepada Fenris Creations adalah tindakan balik, bukan permulaan baru.
Mengapa DeepMind memilih EVE?
2023 "Masyarakat Buatan"
Ujian piawai AI sukar ditiru
Banyak orang yang mendengar “permainan + penyelidikan AI” akan segera teringat kepada AlphaGo atau AlphaStar, tetapi EVE berbeza daripada keduanya.
Go dan StarCraft memiliki ciri sama: satu permainan mempunyai permulaan, penghujung, dan peraturan kemenangan-kekalahan yang jelas.
Matlamat AlphaGo adalah untuk memenangi permainan catur, matlamat AlphaStar adalah untuk memenangi pertandingan StarCraft, kedua-duanya merupakan paradigma kajian "kecerdasan satu sesi", tetapi EVE tidak mempunyai akhir permainan.
EVE Online dikenali dengan "alam semesta bersama tunggal" (single-shard / single shared universe), di mana ramai pemain bersaing, berdagang, membentuk aliansi, dan berperang dalam dunia kekal yang sama dalam jangka masa yang panjang.
Pemain membina sistem ekonomi sebenar, perikatan politik, kumpulan tentera, rute perdagangan, dendam sejarah, dan rancangan perang bertahun-tahun di sini.
Beberapa pertempuran memakan masa satu tahun penuh dari persiapan hingga berakhir. Kebangkitan dan kejatuhan beberapa aliansi dijadikan sejarah sebenar oleh pemain seterusnya.
Hilmar mengatakan dalam pengumuman itu: "EVE adalah salah satu daripada sedikit tempat yang membolehkan anda menjelajahi isu-isu pintar dalam persekitaran yang berfungsi seperti dunia nyata."
Hassabis juga berbincang bahawa beliau telah bermain permainan sejak kecil, memulakan kerjayanya dengan merekabentuk permainan simulasi AI, dan penyelidikan AlphaGo, AlphaStar, dan SIMA semuanya berkait rapat dengan permainan, sementara EVE adalah pilihan seterusnya:
Saya sangat gembira dapat bekerjasama dengan Fenris Creations untuk secara selamat menjelajahi pengalaman permainan baharu dan memajukan penyelidikan AI di dalam alam semesta yang dibina oleh pemain dan memiliki kedalaman yang tiada tandingan.
Sebahagian besar ujian AI seperti pemeriksaan kesihatan, sementara EVE lebih seperti melemparkan AI ke dalam「masyarakat buatan」yang telah berlangsung selama 23 tahun.
Tiga tulang paling sukar untuk agen
Tepat pada rutin harian pemain EVE
Pihak rasmi secara jelas menyenaraikan tiga arah penyelidikan: perancangan jangka panjang (long-horizon planning), memori (memory), dan pembelajaran berterusan (continual learning).
Tiga arah ini adalah tiga cabang paling sukar dalam bidang penyelidikan agen AI pada masa kini.
Jika ada seseorang di sekitar anda yang telah bermain EVE Online selama lebih dari sepuluh tahun, mintalah dia membuka akaunnya dan memperlihatkan senarai rakan anda, anda kemungkinan besar akan melihat puluhan kumpulan dan ratusan nama, dengan catatan seperti "hutang dari kempen Delve 2018", "pengkhianat dalam Goonswarm, jangan bekerjasama", "lelaki ini adalah mata-mata, semua orang dalam organisasi tahu".
Ini bukan tetingkap konteks, tetapi ingatan jangka panjang lintas sesi yang bermula sepuluh tahun yang lalu.
Tahap ingatan ini, pemain EVE melaluinya setiap hari, tahap pembelajaran berterusan juga sama.
Pada Januari 2014, pertempuran B-R5RB berlangsung selama sekitar 21 jam, melibatkan lebih dari 7.500 peran, 75 Titan hancur, dan kerugian setara dengan wang tunai sebanyak kira-kira US$300,000. Pemicu keseluruhan pertempuran ini ialah tagihan kedaulatan yang gagal dibayar secara automatik.
Selepas pertempuran ini, taktik armada seluruh permainan ditulis semula. Konfigurasi armada dan sistem taktik setiap aliansi dalam beberapa tahun ke depan semuanya diiterasi berdasarkan analisis pasca-perlawanan. Setiap bulan dilakukan perubahan, dan setiap kekalahan dipecahkan menjadi pembaruan strategi yang boleh dilaksanakan.
Untuk perancangan jangka panjang, unit masa standard perang gabungan EVE bukan jam, tetapi bulan. Sebuah perang antarabintang, dari persiapan hingga dimulai, melibatkan pembinaan kapal, pengangkutan, diplomasi, penyamaran, dan lawan mata-mata, dengan ratusan pemain bekerjasama secara spontan tanpa penjadualan tugas, meneruskan satu matlamat bersama sepanjang bulan.
Sistem kerjasama ini tumbuh secara alami oleh pemain selama 23 tahun.
Tiga tulang paling sukar dalam penilaian agen AI semasa ini adalah aktiviti harian pemain EVE.
Evolusi yang dipandu pemain dalam EVE selama 23 tahun menghasilkan persekitaran yang sentiasa berubah, sentiasa kompleks, dan tanpa jalan pintas, yang tidak boleh disintesis secara buatan di dalam makmal.
SIMA 2 yang dikeluarkan oleh DeepMind pada November 2025 telah berkembang dari "melaksanakan arahan" kepada "memahami matlamat, menarik kesimpulan, dan belajar sambil bermain".
Dari segi soalan penyelidikan, projek EVE dan SIMA 2 sama-sama berada di jalan raya “permainan sebagai medan latihan agen”, perbezaannya ialah kali ini medannya ditukar kepada alam semesta nyata yang beroperasi berterusan selama 23 tahun.

Adegan pertempuran dalam permainan EVE Online, pertempuran berskala besar yang disusun secara spontan oleh pemain dan sering berlangsung selama berjam-jam, adalah alasan utama DeepMind memilih EVE sebagai skenario penyelidikan perancangan jangka panjang dan pembelajaran berterusan.
DeepMind memasuki sandbox luar talian
Bukan Player Universe
Cara DeepMind bekerjasama dengan Fenris kali ini lebih konservatif daripada yang dijangka; DeepMind tidak mendapat akses langsung ke pelayan rasmi pemain aktif.
DeepMind dalam pengumuman rasmi menyatakan: penyelidikan awal akan dijalankan pada versi luar talian EVE Online, menggunakan pelayan tempatan, untuk menguji dan menilai model dalam persekitaran terkawal, tanpa menyambung ke pelayan rasmi EVE Online.
Di satu sisi, versi luar talian bermaksud DeepMind tidak akan menggunakan data pertandingan pemain aktif, dan tidak akan mengganggu ekonomi pelayan sebenar, yang mengelakkan sebarang kompleksiti privasi dan pematuhan.
Di sisi lain, versi luar talian EVE masih dapat mengekalkan sistem peraturan yang kompleks, kapal, mekanisme ekonomi, dan struktur wilayah bintang sebagai reka bentuk utama.
DeepMind menerima dunia kompleks yang telah diuji tekanan oleh pemain selama 23 tahun, sebagai ujian tempat agen harus bertahan hidup.
Dari Atari ke EVE
Jalan ini membawa ke mana?
Dari pilihan latihan DeepMind selama lebih dari sepuluh tahun ke belakang, terdapat satu garis evolusi yang sangat jelas.
Dari 2013 hingga 2015, Atari menjadi titik permulaan. DQN memasukkan agen ke dalam permainan seperti Breakout dan Space Invaders, yang memiliki tahap yang jelas dan peraturan tertutup. Ia menguji reaksi dan penganggaran nilai.
Pada tahun 2016 hingga 2017, AlphaGo dan AlphaZero. Peraturan catur Go adalah teratur, ruang tindakan besar tetapi tertutup. Menguji pencarian dan penalaran rantai panjang.
Pada tahun 2019, AlphaStar memasuki StarCraft II. Ini adalah kali pertama ia memasuki persekitaran permainan berbilang garis, masa nyata, dan maklumat tidak sempurna. Ia menguji pengambilan keputusan masa nyata di bawah keadaan pemerhatian separa.
Pada tahun 2024, SIMA ingin menciptakan agen universal yang merangkumi pelbagai permainan, dengan penekanan pada pengalihan dan penggeneralisasian.
Pada tahun 2025, pengupayaan SIMA 2: bukan sahaja melaksanakan arahan, tetapi juga berdialog dengan pengguna, menalar matlamat, dan memperbaiki diri semasa permainan.

SIMA 2 yang dikeluarkan oleh DeepMind pada 2025 telah berkembang dari "melaksanakan arahan" kepada "memahami matlamat, menarik kesimpulan, dan belajar sambil bermain"
Setiap generasi persekitaran membawa sedikit lebih banyak "penampilan dunia nyata": dari peraturan tertutup kepada peraturan terbuka, dari maklumat sempurna kepada maklumat tidak sempurna, daripada pertandingan tunggal kepada perpindahan merentas sesi.
Namun sebelum ini, kebanyakan persekitaran ini masih merupakan tugas yang relatif tertutup, boleh dipisahkan, dan boleh dinilai secara berulang, contohnya Atari adalah permainan arcade dengan peraturan tetap, AlphaStar menghadapi pertandingan StarCraft yang berakhir setiap sesi, manakala SIMA diuji dalam pelbagai persekitaran maya 3D untuk menguji penggeneralisasian merentas permainan.
Perbezaan EVE ialah ia merupakan dunia kekal yang berjalan jangka panjang, dipandu pemain, dengan struktur ekonomi dan politik yang terus berkembang.
Ia berkembang secara spontan selama 23 tahun oleh sekelompok pemain sebenar di dunia dengan peraturan terbuka: ekonomi yang dipandu pemain sepenuhnya (fluktuasi harga ISK setara dengan pasaran kewangan sebenar), struktur politik antara gabungan (diplomasi, mata-mata, perjanjian gencatan senjata), dan ekosistem perang lengkap dari konflik kecil hingga pertempuran selama 21 jam.
Konsensus dalam kalangan dalam kalangan semakin jelas, tugas titik tunggal yang hanya mengukur skor sudah tidak lagi menawarkan inovasi baru, tetapi ingatan jangka panjang, perancangan lintas minggu, dan pembelajaran daripada kegagalan masih belum mempunyai medan penilaian yang sesuai.
Jadi, pilihan DeepMind kali ini adalah: alih-alih mencipta persekitaran sintetik baru, lebih baik masuk ke dalam sebuah "masyarakat buatan" yang telah diuji tekanan selama 23 tahun oleh pemain manusia.
Namun, masalah yang lebih besar turut muncul:
Agen AI yang mampu wujud, belajar, dan merancang secara berterusan di dalam EVE, apakah masih kekurangan apa untuk beroperasi secara autonomi seperti agen di dunia nyata?
Rujukan:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-di-balik-eve-online-bertukar-kebebasan-dan-mengganti-nama-sebagai-fenris-creations-memasuki-perkongsian-penelitian-dengan-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Artikel ini berasal daripada akaun微信公众号 "Sinzhiyuan", penulis: ASI Revelation, penyunting: Yuan Yu
