DeepMind bermitra dengan EVE Online untuk menguji AI di alam semesta virtual berusia 23 tahun

CEO DeepMind, sang pencipta AlphaGo, Demis Hassabis, telah menggunakan game untuk penelitian AI selama lebih dari sepuluh tahun.

Kali ini, ia memasukkan AI ke dalam "Alam Semesta Hidup" yang telah berjalan selama 23 tahun: game online luar angkasa EVE Online yang panduan pemula saja bisa membuat pemain baru mundur.

Permainan catur memiliki akhir, tetapi EVE tidak.

Pada awal Mei, DeepMind mengumumkan kolaborasi penelitian dengan EVE Online, karena alasan yang sederhana: alam semesta EVE yang kompleks dan didorong oleh pemain merupakan kotak pasir aman yang sempurna untuk menguji memori AI, pembelajaran berkelanjutan, dan perencanaan jangka panjang.

DeepMind

DeepMind bekerja sama dengan EVE, bukan untuk mengejar pengalaman bermain yang menarik atau memperkuat mekanisme permainan, tetapi untuk mengatasi tiga tantangan paling sulit dalam penelitian agen AI saat ini; Hassabis menaruh harapannya pada game lama yang telah berjalan selama 23 tahun.

DeepMind

Fenris Creations (sebelumnya CCP Games) mengumumkan kolaborasi dengan DeepMind

Perusahaan di balik EVE Online, pada hari yang sama, 6 Mei, mengumumkan empat hal:

Dipisahkan kembali dari entitas induk Pearl Abyss;
Diganti nama menjadi Fenris Creations;
Menyelesaikan transaksi senilai $120 juta;
Sebagai bagian dari independensi ini, Google memegang saham minoritas di Fenris Creations dan secara bersamaan meluncurkan kolaborasi penelitian dengan Google DeepMind.

CEO Fenris Creations, Hilmar Veigar Pétursson, menyatakan dalam pengumuman tersebut:

Transformasi ini tidak melibatkan pemutusan hubungan kerja atau restrukturisasi, tim, produk, dan rencana pengembangan tetap sama. EVE berlanjut.

Dari angka operasionalnya, perusahaan ini datang dengan "senjata nyata" untuk membicarakan kolaborasi, bukan menjual aset untuk bertahan hidup.

EVE Online menghasilkan pendapatan lebih dari 70 juta dolar AS pada tahun 2025, dengan November mencatat pendapatan tertinggi sepanjang sejarah, dan Q4 menjadi kuartal dengan pendapatan tertinggi kedua dalam 20 tahun sejarah game ini.

Fenris Creations menjadi entitas terpisah, yang berarti EVE sekarang memiliki induk perusahaan yang dapat menentukan kerja sama penelitiannya sendiri, tanpa terikat pada tujuan strategis perusahaan penerbit game yang lebih besar.

DeepMind

Kotak permainan papan yang diterbitkan oleh Fenris pada tahun 1997. Nama "Fenris" sudah ada enam tahun sebelum EVE Online; perubahan nama menjadi Fenris Creations adalah sebuah pengembalian, bukan permulaan baru.

Mengapa DeepMind memilih EVE?

2023 "Masyarakat Buatan"

Uji coba AI sulit direplikasi

Banyak orang yang mendengar "game + penelitian AI" langsung teringat pada AlphaGo atau AlphaStar, tetapi EVE berbeda daripada mereka.

Go dan StarCraft memiliki satu kesamaan: sebuah pertandingan memiliki awal, akhir, dan aturan kemenangan-kekalahan yang jelas.

Tujuan AlphaGo adalah memenangkan permainan catur, tujuan AlphaStar adalah memenangkan pertandingan StarCraft, keduanya mengikuti paradigma penelitian 'kecerdasan satu sesi', tetapi EVE tidak memiliki akhir.

EVE Online dikenal dengan "alam semesta bersama tunggal" (single-shard / single shared universe), di mana sejumlah besar pemain bersaing, berdagang, membentuk aliansi, dan berperang dalam dunia yang berkelanjutan yang sama.

Pemain di sini telah membangun sistem ekonomi nyata, aliansi politik, kelompok militer, rute perdagangan, dendam sejarah, dan rencana perang bertahun-tahun.

Beberapa kampanye memakan waktu satu tahun penuh dari persiapan hingga berakhir. Beberapa kenaikan dan kejatuhan aliansi dijadikan sejarah nyata oleh pemain berikutnya.

Hilmar mengatakan dalam pengumuman: "EVE adalah salah satu dari sedikit tempat yang memungkinkan eksplorasi masalah kecerdasan di lingkungan yang berfungsi seperti dunia nyata."

Hassabis bahkan membahas bahwa dirinya telah bermain game sejak kecil, memulai karier dengan merancang game simulasi AI, dan penelitian AlphaGo, AlphaStar, dan SIMA sangat terkait erat dengan game, sementara EVE adalah pilihan tahap berikutnya:

Saya senang dapat bekerja sama dengan Fenris Creations untuk secara aman menjelajahi pengalaman game baru dan memajukan penelitian AI di alam semesta yang dibuat oleh pemain dan memiliki tingkat kompleksitas tak tertandingi.

Sebagian besar benchmark AI seperti pemeriksaan kesehatan, sementara EVE lebih seperti melempar AI ke dalam sebuah "masyarakat buatan" yang telah berlangsung selama 23 tahun.

Tiga tulang paling sulit untuk agen

Tepatnya rutinitas harian pemain EVE

Pada kesempatan ini, pihak resmi secara jelas menyebutkan tiga arah penelitian: perencanaan jangka panjang (long-horizon planning), memori (memory), dan pembelajaran berkelanjutan (continual learning).

Ketiga arah ini adalah tiga tantangan terberat yang diakui dalam bidang penelitian agen AI saat ini.

Jika ada seseorang di sekitarmu yang telah memainkan EVE Online selama lebih dari sepuluh tahun, mintalah dia membuka akunnya dan menunjukkan daftar temannya, kamu kemungkinan besar akan melihat puluhan grup, ratusan nama, dengan catatan seperti "hutang dari kampanye Delve 2018", "pengkhianat dalam Goonswarm, jangan bekerja sama", "orang ini mata-mata, semua orang di organisasi tahu".

Ini bukan jendela konteks, melainkan memori jangka panjang lintas sesi yang dimulai dari sepuluh tahun yang lalu.

Tahap ingatan, pemain EVE melewati setiap hari, tahap pembelajaran berkelanjutan juga sama.

Pada Januari 2014, pertempuran B-R5RB berlangsung sekitar 21 jam, melibatkan lebih dari 7.500 karakter, 75 Titan hancur, dan kerugian setara dengan uang sungguhan sekitar USD 300.000. Pemicu seluruh pertempuran ini adalah gagalnya pembayaran otomatis tagihan kedaulatan.

Setelah pertempuran ini selesai, seluruh taktik armada dalam permainan diubah total. Konfigurasi armada dan sistem taktik setiap aliansi selama beberapa tahun ke depan semuanya diiterasi berdasarkan analisis pasca-pertempuran. Setiap bulan ada perubahan, setiap kekalahan diuraikan menjadi pembaruan strategi yang dapat dieksekusi.

Untuk perencanaan jangka panjang, satuan waktu standar perang aliansi EVE bukan jam, tapi bulan. Sebuah perang antar sistem bintang, dari persiapan hingga dimulai, melibatkan pembuatan kapal, transportasi, diplomasi, penyusupan, dan counter-intelijen, dengan ratusan pemain berkolaborasi secara spontan tanpa penjadwalan tugas, mendorong tujuan bersama sepanjang bulan.

Sistem kolaborasi ini tumbuh secara alami dari para pemain selama 23 tahun.

Tiga tulang paling sulit dalam evaluasi agen AI saat ini justru merupakan bagian dari rutinitas pemain EVE.

Evolusi yang didorong pemain di EVE selama 23 tahun menciptakan lingkungan yang selalu berubah, selalu kompleks, dan tanpa jalan pintas, kompleksitas semacam ini tidak dapat disintesis secara buatan di laboratorium.

SIMA 2 yang dirilis DeepMind pada November 2025 telah berkembang dari "menjalankan perintah" menjadi "memahami tujuan, menalar proses, dan belajar sambil bermain".

Dari sudut pandang penelitian, proyek EVE dan SIMA 2 sama-sama berada di jalur "game sebagai lapangan pelatihan agen", yang membedakan adalah kali ini lapangannya diubah menjadi alam semesta nyata yang berjalan terus-menerus selama 23 tahun.

DeepMind

Adegan kampanye dalam game EVE Online, pertempuran skala besar yang diorganisir secara spontan oleh pemain dan sering berlangsung selama berjam-jam, adalah alasan utama DeepMind memilih EVE sebagai lingkungan penelitian untuk perencanaan jangka panjang dan pembelajaran berkelanjutan.

DeepMind memasuki sandbox offline

Bukan Player Universe

Cara DeepMind bekerja sama dengan Fenris kali ini lebih konservatif daripada yang diperkirakan; DeepMind tidak mendapatkan akses langsung ke server resmi pemain aktif.

DeepMind menyatakan dalam pengumuman resmi: penelitian awal akan dilakukan pada versi offline EVE Online, menggunakan server lokal, untuk menguji dan mengevaluasi model dalam lingkungan terkendali, tanpa terhubung ke server operasional resmi EVE Online.

Di satu sisi, versi offline berarti DeepMind tidak akan menggunakan data pertandingan pemain aktif, juga tidak akan mengganggu ekonomi server asli, sehingga menghindari berbagai kompleksitas privasi dan kepatuhan.

Di sisi lain, versi offline EVE masih dapat mempertahankan sistem aturan kompleks, mekanisme kapal dan ekonomi, serta struktur wilayah bintang sebagai desain intinya.

DeepMind mendapatkan dunia kompleks yang telah diuji tekanan oleh pemain selama 23 tahun, sebagai ujian tempat agen harus bertahan hidup.

Dari Atari ke EVE

Jalan ini menuju ke mana?

Dari pilihan latihan DeepMind selama dua dekade terakhir, terlihat jelas garis evolusi.

Dari 2013 hingga 2015, Atari menjadi titik awal. DQN memasukkan agen ke dalam game-game dengan level jelas dan aturan tertutup seperti Breakout dan Space Invaders. Ini menguji reaksi dan estimasi nilai.

Pada tahun 2016 hingga 2017, AlphaGo dan AlphaZero. Aturan go teratur, ruang tindakan sangat besar tetapi tertutup. Menguji pencarian dan penalaran rantai panjang.

Pada tahun 2019, AlphaStar memasuki StarCraft II. Pertama kalinya memasuki lingkungan permainan real-time, informasi tidak sempurna, dan multi-line. Menguji keputusan real-time dalam kondisi observasi sebagian.

Pada tahun 2024, SIMA ingin membuat agen universal yang berlaku lintas banyak game. Yang diuji adalah kemampuan迁移泛化.

Pada tahun 2025, pembaruan SIMA 2: tidak hanya menjalankan perintah, tetapi juga dapat berdialog dengan pengguna, bernalar tujuan, dan meningkatkan diri selama proses permainan.

DeepMind

SIMA 2 yang dirilis DeepMind pada 2025 telah berkembang dari "mengeksekusi perintah" menjadi "memahami tujuan, menalar proses, dan belajar sambil bermain"

Setiap generasi lingkungan menambahkan sedikit lebih banyak "penampilan dunia nyata": dari aturan tertutup menjadi aturan terbuka, dari informasi sempurna menjadi informasi tidak sempurna, dari pertarungan satu sesi menjadi migrasi lintas sesi.

Namun sebelumnya, sebagian besar lingkungan ini masih merupakan tugas yang relatif tertutup, dapat dipisahkan, dan dapat dievaluasi berulang-ulang, misalnya Atari adalah game arcade dengan aturan tetap, AlphaStar menghadapi pertandingan StarCraft yang berakhir satu per satu, sedangkan SIMA diuji di berbagai lingkungan virtual 3D untuk menguji generalisasi lintas game.

Keunikan EVE adalah bahwa ia merupakan dunia permanen yang berjalan lama, didorong oleh pemain, dengan struktur ekonomi dan politik yang terus berkembang.

Ini berkembang secara alami selama 23 tahun oleh sekelompok pemain nyata di dunia dengan aturan terbuka: ekonomi yang didorong pemain sepenuhnya (fluktuasi harga ISK sebanding dengan pasar keuangan nyata), struktur politik antar aliansi (diplomasi, mata-mata, perjanjian gencatan senjata), dan ekosistem perang lengkap mulai dari konflik skala kecil hingga pertempuran selama 21 jam.

Konsensus di kalangan industri mengenai evaluasi agen semakin jelas; skor tugas titik tunggal sudah tidak lagi menawarkan hal baru, tetapi memori jangka panjang, perencanaan lintas minggu, dan pembelajaran dari kegagalan belum memiliki arena evaluasi yang layak.

Jadi, pilihan DeepMind kali ini adalah: alih-alih menciptakan lingkungan sintetis baru, lebih baik masuk ke dalam sebuah "masyarakat buatan" yang telah diuji tekanan selama 23 tahun oleh pemain manusia.

Namun, masalah yang lebih besar pun muncul:

Agen AI yang dapat eksis, belajar, dan merencanakan secara berkelanjutan di dalam EVE, apa yang masih kurang dibandingkan dengan agen yang beroperasi secara otonom di dunia nyata?

Referensi:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-di-balik-eve-online-menjadi-independen-mengubah-nama-menjadi-fenris-creations-memasuki-kerjasama-penelitian-dengan-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

Artikel ini berasal dari akun WeChat "Sinzhiyuan", penulis: ASI Revelation, editor: Yuanyu