ซีอีโอของ DeepMind และผู้สร้าง AlphaGo เดมิส ฮัสซาบิส ได้ใช้เกมในการวิจัย AI มานานกว่าสิบปี
ครั้งนี้ เขาได้นำ AI ไปใส่ลงใน “จักรวาลที่มีชีวิต” ที่ดำเนินมา 23 ปี: เกมออนไลน์อวกาศที่แม้แต่คู่มือสำหรับผู้เริ่มต้นยังสามารถทำให้ผู้เล่นถอยหลังได้ เกม EVE Online
เกมหมากรุกมีจุดสิ้นสุด แต่ EVE ไม่มี
ต้นเดือนพฤษภาคม DeepMind ได้ประกาศความร่วมมือด้านการวิจัยกับ EVE Online เนื่องจากจักรวาลที่ซับซ้อนและขับเคลื่อนโดยผู้เล่นของ EVE เป็นสภาพแวดล้อมปลอดภัยที่สมบูรณ์แบบสำหรับทดสอบหน่วยความจำของ AI การเรียนรู้อย่างต่อเนื่อง และการวางแผนระยะยาว

DeepMind ร่วมมือกับ EVE ไม่ใช่เพื่อตามหาประสบการณ์การเล่นเกมที่น่าสนใจ หรือเสริมสร้างรูปแบบการเล่นเกม แต่เพื่อแก้ไขปัญหาสามข้อที่ถือว่ายากที่สุดในการวิจัยตัวแทนปัญญาประดิษฐ์ในปัจจุบัน ฮัสซาบิสได้วางคำตอบไว้กับเกมเก่าที่ดำเนินมา 23 ปี

Fenris Creations (เดิมคือ CCP Games) ประกาศความร่วมมือกับ DeepMind
บริษัทที่อยู่เบื้องหลัง EVE Online ประกาศสิ่งต่างๆ สี่ประการในวันที่ 6 พฤษภาคม:
- แยกตัวออกจากระบบแม่ Pearl Abyss อีกครั้ง;
- เปลี่ยนชื่อเป็น Fenris Creations;
- ดำเนินการซื้อขายมูลค่า 120 ล้านดอลลาร์สหรัฐ;
- ในฐานะส่วนหนึ่งของการแยกตัวครั้งนี้ Google ถือหุ้นน้อยใน Fenris Creations และเริ่มต้นความร่วมมือด้านการวิจัยกับ Google DeepMind พร้อมกัน
ซีอีโอของ Fenris Creations ฮิลมาร์ ไวการ์ เป็ตเตอร์สสัน ระบุในประกาศว่า:
การเปลี่ยนแปลงครั้งนี้ไม่เกี่ยวข้องกับการเลิกจ้างหรือการจัดโครงสร้างใหม่ ทีม ผลิตภัณฑ์ และแผนการพัฒนาคงเดิม EVE ยังคงดำเนินต่อไป
จากตัวเลขการดำเนินงาน บริษัทนี้มาเจรจาความร่วมมือด้วย “อาวุธจริง” ไม่ใช่การขายสินทรัพย์เพื่อเอาชีวิตรอด
EVE Online รายได้เกิน 70 ล้านดอลลาร์สหรัฐในปี 2025 โดยเดือนพฤศจิกายนสร้างสถิติรายได้สูงสุดในประวัติศาสตร์ และไตรมาสที่ 4 เป็นไตรมาสที่มีรายได้สูงเป็นอันดับสองในประวัติศาสตร์ 20 ปีของเกมนี้
การแยกตัวของ Fenris Creations หมายความว่า EVE ตอนนี้มีบริษัทแม่ที่สามารถตัดสินใจเกี่ยวกับความร่วมมือด้านการวิจัยได้ด้วยตนเอง โดยไม่ถูกผูกมัดด้วยเป้าหมายเชิงกลยุทธ์ของบริษัทเผยแพร่เกมขนาดใหญ่

กล่องเกมโต๊ะที่ Fenris ออกวางตลาดในปี 1997 ชื่อ “Fenris” นั้นเก่ากว่า EVE Online ถึง 6 ปี การเปลี่ยนชื่อเป็น Fenris Creations เป็นการย้อนกลับไปสู่ต้นกำเนิด ไม่ใช่การเริ่มต้นใหม่
ทำไม DeepMind ถึงเลือก EVE?
ปี 2023 "สังคมประดิษฐ์"
การทดสอบมาตรฐาน AI ทำได้ยากที่จะทำซ้ำ
หลายคนเมื่อได้ยินคำว่า “เกม + การวิจัย AI” อาจนึกถึง AlphaGo หรือ AlphaStar แต่ EVE นั้นแตกต่างจากพวกมัน
围棋และสตาร์คราฟต์มีคุณลักษณะร่วมกันหนึ่งประการ: การแข่งขันหนึ่งเกมมีจุดเริ่มต้น มีจุดสิ้นสุด และมีกฎเกณฑ์ที่ชัดเจนในการตัดสินผู้ชนะผู้แพ้
เป้าหมายของ AlphaGo คือชนะการเล่นหมาก ขณะที่เป้าหมายของ AlphaStar คือชนะการต่อสู้ใน StarCraft ทั้งคู่เป็นแนวทางการวิจัยแบบ "ปัญญาประดิษฐ์สำหรับเกมเดียว" แต่ EVE ไม่มีจุดสิ้นสุด
EVE Online โดดเด่นด้วย “จักรวาลร่วมเดียว” (single-shard / single shared universe) ที่ผู้เล่นจำนวนมากแข่งขัน ค้าขาย สร้างพันธมิตร และทำสงครามในโลกถาวรเดียวกันเป็นเวลานาน
ผู้เล่นได้สร้างระบบเศรษฐกิจที่แท้จริง พันธมิตรทางการเมือง กลุ่มทางการทหาร เส้นทางการค้า ความแค้นทางประวัติศาสตร์ และแผนการสงครามข้ามปี
บางสงครามใช้เวลาทั้งปีตั้งแต่การเตรียมการจนถึงการจบลง บางพันธมิตรที่ขึ้นมาและล่มสลาย ถูกผู้เล่นรุ่นหลังศึกษาเหมือนประวัติศาสตร์ที่แท้จริง
ฮิลมาอร์กล่าวในประกาศว่า: 「EVE เป็นหนึ่งในไม่กี่ที่ที่สามารถสำรวจปัญหาเชิงปัญญาในสภาพแวดล้อมที่ทำงานเหมือนโลกจริง」
ฮัสซาบิสยังกล่าวอีกว่า เขาเล่นเกมตั้งแต่เด็ก จุดเริ่มต้นของอาชีพคือการออกแบบเกมจำลอง AI การวิจัย AlphaGo, AlphaStar และ SIMA ล้วนมีความเชื่อมโยงอย่างลึกซึ้งกับเกม และ EVE คือตัวเลือกถัดไป:
ฉันรู้สึกยินดีที่ได้ร่วมงานกับ Fenris Creations เพื่อสำรวจประสบการณ์เกมใหม่ๆ และส่งเสริมการวิจัยด้าน AI อย่างปลอดภัยในจักรวาลที่ผู้เล่นสร้างขึ้นและมีความซับซ้อนไม่เคยมีมาก่อน
การทดสอบ AI ส่วนใหญ่เหมือนการตรวจสุขภาพ แต่ EVE ดูเหมือนการโยน AI เข้าไปใน “สังคมประดิษฐ์” ที่ดำเนินมาแล้ว 23 ปี
สามกระดูกที่ยากที่สุดของตัวแทน
พอดีกับกิจวัตรประจำวันของ EVE players
ครั้งนี้ทางทีมอย่างเป็นทางการได้ระบุแนวทางการวิจัยสามด้านไว้ชัดเจน: การวางแผนระยะยาว (long-horizon planning), ความจำ (memory), และการเรียนรู้อย่างต่อเนื่อง (continual learning)
สามทิศทางนี้เป็นสามประเด็นที่ยากที่สุดในวงการวิจัยตัวแทนปัญญาประดิษฐ์ในปัจจุบัน
หากคุณมีใครสักคนที่เล่น EVE Online มาเกินสิบปี ให้เขาเปิดบัญชีให้คุณดูรายชื่อเพื่อนสักครั้ง คุณมักจะเห็นกลุ่มต่างๆ หลายสิบกลุ่ม ชื่อหลายร้อยชื่อ พร้อมหมายเหตุเช่น “หนี้จากสงคราม Delve ปี 2018” “ทรยศภายใน Gooseswarm ห้ามร่วมมือ” “คนนี้เป็นสายลับ ทุกคนในองค์กรรู้กันดี”
นี่ไม่ใช่หน้าต่างบริบท แต่เป็นความจำระยะยาวข้ามเซสชันที่เริ่มต้นมาตั้งแต่สิบปีที่ผ่านมา
ระดับความจำ ผู้เล่น EVE ผ่านมันทุกวัน เช่นเดียวกับระดับการเรียนรู้อย่างต่อเนื่อง
ในเดือนมกราคมปี 2014 การต่อสู้ของ B-R5RB ดำเนินไปประมาณ 21 ชั่วโมง มีตัวละครเข้าร่วมมากกว่า 7,500 ตัว และยาน Titan จำนวน 75 ลำถูกทำลาย ความเสียหายคิดเป็นเงินจริงประมาณ 300,000 ดอลลาร์สหรัฐ สาเหตุที่ทำให้เกิดการต่อสู้ครั้งนี้คือการไม่สามารถชำระใบแจ้งหนี้อธิปไตยได้อัตโนมัติ
หลังจากสงครามครั้งนี้จบลง กลยุทธ์เรือรบของเกมทั้งหมดถูกเขียนใหม่ทั้งหมด โครงสร้างเรือรบและระบบกลยุทธ์ของพันธมิตรต่างๆ ในปีถัดไปถูกพัฒนาต่อเนื่องโดยอิงจากการวิเคราะห์ผลลัพธ์ การปรับปรุงเกิดขึ้นทุกเดือน และความล้มเหลวแต่ละครั้งถูกวิเคราะห์เพื่อแปลงเป็นการอัปเดตกลยุทธ์ที่สามารถดำเนินการได้
สำหรับการวางแผนระยะยาว เวลามาตรฐานในการสงครามของกลุ่ม EVE ไม่ใช่ชั่วโมง แต่เป็นเดือน การสงครามข้ามระบบดาวตั้งแต่การเตรียมการจนถึงการเริ่มต้น รวมถึงการสร้างยาน การขนส่ง การทูต การซุ่มตัว และการต่อต้านการสอดแนม ผู้เล่นนับร้อยคนร่วมมือกันโดยไม่มีการจัดตารางงาน ผลักดันเป้าหมายร่วมกันข้ามเดือน
ระบบร่วมมือชุดนี้เกิดขึ้นเองจากผู้เล่นในช่วง 23 ปี
สามกระดูกที่ถูกประเมินว่ายากที่สุดในปัจจุบันในการประเมิน AI แอจีนต์ คือสิ่งที่ผู้เล่น EVE ต้องเผชิญในชีวิตประจำวัน
การวิวัฒนาการที่ขับเคลื่อนโดยผู้เล่นใน EVE ตลอดปี 2023 ได้สร้างสภาพแวดล้อมที่เปลี่ยนแปลงอย่างต่อเนื่อง ซับซ้อนอย่างต่อเนื่อง และไม่มีทางลัด ซึ่งไม่สามารถสร้างความซับซ้อนเช่นนี้ขึ้นมาได้ในห้องแล็บ
SIMA 2 ที่ DeepMind เปิดตัวในเดือนพฤศจิกายน 2025 ได้พัฒนาจากการ "ปฏิบัติตามคำสั่ง" เป็นการ "เข้าใจเป้าหมาย วิเคราะห์กระบวนการ และเรียนรู้ขณะเล่น"
จากมุมมองของคำถามวิจัย โครงการ EVE และ SIMA 2 อยู่ในเส้นทางเดียวกันคือ “เกมเป็นสนามฝึกอบรมตัวแทน” แต่ครั้งนี้สนามถูกเปลี่ยนเป็นจักรวาลจริงที่ทำงานต่อเนื่องมา 23 ปี

ฉากการต่อสู้ขนาดใหญ่ในเกม EVE Online การประชุมขนาดใหญ่ที่ผู้เล่นจัดขึ้นด้วยตนเองและมักใช้เวลาหลายชั่วโมง เป็นเหตุผลหลักที่ DeepMind เลือก EVE เป็นสภาพแวดล้อมสำหรับการวิจัยด้านการวางแผนระยะยาวและการเรียนรู้อย่างต่อเนื่อง
DeepMind ใช้ sandbox แบบออฟไลน์
ไม่ใช่ Player Universe
วิธีการร่วมมือระหว่าง DeepMind กับ Fenris ครั้งนี้ค่อนข้างระมัดระวังกว่าที่คาดไว้ โดย DeepMind ไม่ได้รับสิทธิ์เชื่อมต่อโดยตรงกับเซิร์ฟเวอร์หลักของผู้เล่นที่กำลังเล่นอยู่
DeepMind ประกาศอย่างเป็นทางการว่า: การวิจัยเริ่มต้นจะดำเนินการบนเวอร์ชันออฟไลน์ของ EVE Online โดยใช้เซิร์ฟเวอร์ท้องถิ่น เพื่อทดสอบและประเมินโมเดลในสภาพแวดล้อมที่ควบคุม โดยไม่เชื่อมต่อกับเซิร์ฟเวอร์หลักของ EVE Online
ในทางหนึ่ง การใช้เวอร์ชันออฟไลน์หมายความว่า DeepMind จะไม่ใช้ข้อมูลการแข่งขันของผู้เล่นที่กำลังเล่นจริง หรือรบกวนเศรษฐกิจของเซิร์ฟเวอร์จริง ซึ่งช่วยหลีกเลี่ยงความซับซ้อนด้านความเป็นส่วนตัวและการปฏิบัติตามกฎหมาย
ในอีกด้านหนึ่ง เวอร์ชันออฟไลน์ของ EVE ยังสามารถรักษาการออกแบบหลักต่างๆ เช่น ระบบกฎที่ซับซ้อน ยานอวกาศและกลไกเศรษฐกิจ โครงสร้างของภูมิภาคดาว
DeepMind ได้รับโลกที่ซับซ้อนซึ่งถูกทดสอบโดยผู้เล่นมากกว่า 23 ปี เป็นสนามสอบที่ตัวแทนปัญญาประดิษฐ์ต้องมีชีวิตอยู่
จาก Atari ถึง EVE
เส้นทางนี้นำไปสู่ที่ไหน
เมื่อมองย้อนกลับจากสนามการฝึกของ DeepMind ตลอดสิบปีที่ผ่านมา มีเส้นทางการพัฒนาที่ชัดเจน
ระหว่างปี 2013 ถึง 2015 Atari เป็นจุดเริ่มต้น DQN ได้ใส่ตัวแทนลงในเกมที่มีระดับชัดเจนและกฎปิด เช่น Breakout และ Space Invaders ซึ่งทดสอบการตอบสนองและการประมาณค่า
ระหว่างปี 2016 ถึง 2017 AlphaGo และ AlphaZero กฎของโกะมีความเป็นระเบียบ พื้นที่การกระทำมีขนาดใหญ่แต่ปิดล้อม ทดสอบการค้นหาและการให้เหตุผลแบบห่วงโซ่ยาว
ในปี 2019 AlphaStar เข้าสู่เกม StarCraft II เป็นครั้งแรกในสภาพแวดล้อมที่เป็นแบบเรียลไทม์ ข้อมูลไม่สมบูรณ์ และมีการเล่นหลายเส้นทาง การทดสอบคือการตัดสินใจแบบเรียลไทม์ภายใต้การสังเกตเพียงบางส่วน
ในปี 2024 SIMA ต้องการสร้างตัวแทนอัจฉริยะทั่วไปที่สามารถใช้งานข้ามเกมหลายเกม โดยเน้นที่การถ่ายโอนและการทั่วไป
ในปี 2025 การอัปเกรด SIMA 2: ไม่เพียงแต่ดำเนินคำสั่ง แต่ยังสามารถพูดคุยกับผู้ใช้ วิเคราะห์เป้าหมาย และปรับปรุงตัวเองระหว่างการเล่นเกม

SIMA 2 ที่ DeepMind เปิดตัวในปี 2025 ได้พัฒนาจาก「การดำเนินคำสั่ง」ไปสู่「การเข้าใจเป้าหมาย การวิเคราะห์กระบวนการ และเรียนรู้ขณะเล่น」
แต่ละรุ่นของสภาพแวดล้อมมีลักษณะของโลกจริงเพิ่มขึ้นเล็กน้อย: จากกฎที่ปิดกั้นสู่กฎที่เปิดกว้าง จากข้อมูลสมบูรณ์สู่ข้อมูลไม่สมบูรณ์ จากการแข่งขันในแต่ละเกมเดียวสู่การถ่ายโอนข้ามเกม
แต่ก่อนหน้านี้ สิ่งแวดล้อมเหล่านี้ส่วนใหญ่ยังคงเป็นภารกิจที่ปิดกั้น相对、แยกได้ และสามารถประเมินซ้ำได้ เช่น Atari เป็นเกมอาร์เคดที่มีกฎคงที่ AlphaStar ต้องเผชิญกับการแข่งขันสตาร์คราฟต์ที่จบแต่ละเกม ส่วน SIMA ทดสอบการทั่วไปข้ามเกมในสภาพแวดล้อมเสมือน 3 มิติหลายแห่ง
สิ่งที่ทำให้ EVE แตกต่างคือ มันเป็นโลกถาวรที่ดำเนินไปอย่างต่อเนื่อง ขับเคลื่อนโดยผู้เล่น โดยโครงสร้างทางเศรษฐกิจและการเมืองจะพัฒนาอย่างต่อเนื่อง
มันถูกพัฒนาขึ้นอย่างเป็นธรรมชาติโดยกลุ่มผู้เล่นจริงในโลกที่มีกฎเกณฑ์เปิดเผยตลอดช่วงเวลา 23 ปี: เศรษฐกิจที่ขับเคลื่อนโดยผู้เล่นทั้งหมด (ราคา ISK มีการผันผวนเทียบเท่าตลาดการเงินจริง) โครงสร้างทางการเมืองข้ามพันธมิตร (การทูต สายลับ และข้อตกลงหยุดยิง) และระบบนิเวศสงครามที่ครบวงจร ตั้งแต่การปะทะขนาดเล็กจนถึงสงครามขนาดใหญ่ที่ kéo dài 21 ชั่วโมง
ชุมชนมีความเห็นพ้องต้องกันมากขึ้นเกี่ยวกับการประเมินเอเจนต์อัจฉริยะ การทดสอบคะแนนในงานจุดเดียวไม่สามารถสร้างสิ่งใหม่ๆ ได้อีกแล้ว แต่ยังไม่มีสนามการประเมินที่เหมาะสมสำหรับหน่วยความจำระยะยาว การวางแผนข้ามสัปดาห์ และการเรียนรู้จากความล้มเหลว
ดังนั้น ทางเลือกของ DeepMind ในครั้งนี้คือ: แทนที่จะสร้างสภาพแวดล้อมจำลองขึ้นใหม่ พวกเขาจึงเลือกเข้าสู่ “สังคมประดิษฐ์” ที่ถูกทดสอบด้วยแรงกดดันจากผู้เล่นมนุษย์มาแล้ว 23 ปี
แต่ปัญหาที่ใหญ่กว่านั้นก็เริ่มปรากฏขึ้น:
ตัวแทนปัญญาประดิษฐ์ที่สามารถมีอยู่อย่างต่อเนื่อง เรียนรู้อย่างต่อเนื่อง และวางแผนอย่างต่อเนื่องใน EVE นั้น ยังขาดอะไรอีกบ้างเมื่อเทียบกับตัวแทนที่ทำงานอย่างอิสระในโลกจริง?
ข้อมูลอ้างอิง:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
บทความนี้มาจาก微信号 “ซินจีหยวน” โดยผู้เขียน: ASI Revelation แก้ไขโดย Yuan Yu
