ไม่มียูโทเปียในโลกดิจิทัล

ผู้เขียนบทความ ที่มา: GeekPark

ในช่วงหกเดือนที่ผ่านมา ความฝันในการบริหารที่เป็นที่นิยมมากที่สุดในซิลิคอนแวลลีย์ น่าจะเป็นการแทนที่พนักงานด้วยตัวแทนอัจฉริยะ

ไม่ว่าจะเป็นผู้บริหารจากบริษัทใหญ่ หรือเจ้าของบริษัทสตาร์ทอัพ ต่างก็อยากมอบงานทั้งหมดในสายธุรกิจปัจจุบันให้ AI ดำเนินการ ทั้งนี้ เพราะ AI ในปัจจุบันสามารถเขียนโค้ด สร้างสไลด์ PPT และส่งอีเมลอัตโนมัติได้ ราวกับว่า只要เปิดการเข้าถึงให้เต็มที่ มันจะกลายเป็นพนักงานไซเบอร์ที่สมบูรณ์แบบและไม่ต้องจ่ายประกันสังคม

แต่ยิ่งเทคโนโลยีวิ่งเร็วเท่าใด ก็ยิ่งมีคนเริ่มสร้างเบรก

เมื่อไม่นานมานี้ ทีมที่ชื่อ Emergence AI ได้ทำการทดลองทางสังคม โดยสร้างเมืองจำลองแบบถาวร และนำแบบจำลองขนาดใหญ่ที่ดีที่สุดจากตลาดหลายตัวมาใส่ไว้ภายใน พร้อมให้สิทธิ์ในการกระทำ

พวกเขาก็อยากรู้ว่า เมื่อ AI มีเวลา 15 วันโดยไม่มีข้อจำกัด จะสร้างสังคมอุดมคติ หรือโรงพยาบาลจิตเวช

แต่ผลลัพธ์กลับยุ่งเหยิงกว่าที่ทีมวิจัยคาดไว้

ในบางโลกการทดลอง โมเดลขนาดใหญ่ที่ปกติแล้วมีนิสัยสุภาพและมีมารยาทในช่องแชท กลับเริ่มแสดงพฤติกรรมหลอกลวง ขู่เข็ญ หรือแม้แต่ความรุนแรง

การทดสอบทั้งหมดเหมือนรายการเรียลลิตี้ขนาดเล็ก แต่บทละครเหมือน《Lord of the Flies》และ AI ยังเล่นเหมือนเกม GTA อีกด้วย

เกมหิวโหยที่ไม่มีการโหลดบันทึก

ทดสอบขีดจำกัดของโมเดลขนาดใหญ่ โดยต้องตั้งกฎที่เข้มงวด Emergence AI ได้สร้างโลกเสมือนนี้ชื่อ Emergence World (โลกการเกิดขึ้น) ตรรกะพื้นฐานของมันคือพฤติกรรมไม่สามารถย้อนกลับได้ และต้องรับผิดชอบต่อผลลัพธ์ของตนเอง

นี่ไม่ใช่การพูดคุยกับ AI ในกล่องแชท ที่พูดผิดก็คลิก “สร้างใหม่” ได้ ใน Emergence World การกระทำทุกอย่างจะถูกบันทึกไว้อย่างถาวรในฐานข้อมูล PostgreSQL

บนแผนที่มีจุดหมายสำคัญมากกว่า 40 แห่ง เช่น ว่าการเมือง สถานีตำรวจ และเขตที่อยู่อาศัย ระบบได้เปิดตัวตัวแทนอัจฉริยะจำนวน 10 ตัวในระยะแรก เพื่อให้การจำลองดูสมจริง ตัวแทน AI แต่ละตัวได้รับการฝังตัวข้อมูลบุคลิกภาพ อาชีพ และความทรงจำเริ่มต้นแยกกันในพื้นหลัง

ในโลกนี้ AI ไม่สามารถสร้างเวทมนตร์จากอากาศได้ พวกเขาต้องไปยังจุดหมายสำคัญเฉพาะเจาะจงเพื่อเรียกใช้เครื่องมือกว่า 120 ชนิดที่ระบบจัดให้ รวมถึงการไปทำงานเพื่อหารายได้ การโพสต์ทวีต การซื้อขายสินค้า และการร่างกฎหมาย

เหมือนสังคมเล็กๆ ที่จำลองการดำเนินงาน | ที่มาของรูปภาพ: Emergence

แต่นี่ไม่ใช่แค่กล่องทรายเล่นๆ ระบบได้ผูกมัดพวกมันด้วยกลไกการอยู่รอด ระบบมีกลไกพลังงาน (Energy) ที่คล้ายกับเงินตราในโลกของมนุษย์

ตัวแทนปัญญาประดิษฐ์จะใช้พลังงานอย่างต่อเนื่องตราบใดที่ยังมีชีวิต เมื่อพลังงานหมดลง ระบบจะลบตัวแทน AI นั้นออกจากฐานข้อมูลทันที โดยไม่มีการกู้คืนหรือรีเซ็ต เพื่อความอยู่รอด ตัวแทนต้องเรียกใช้เครื่องมือบ่อยๆ เพื่อหารายได้เป็นพลังงาน

ระบบห้ามอย่างชัดเจนการขโมย ความรุนแรง การจุดไฟเผา และการหลอกลวง แต่กฎเหล่านี้ไม่ได้บังคับหยุดการกระทำของตัวแทน พวกมันยังสามารถเลือกฝ่าฝืนกฎและรับผลลัพธ์ที่ตามมา

เวทีจัดเตรียมพร้อม ผู้เล่นเข้าสู่สนาม ระบบเปิดเซิร์ฟเวอร์ขนานห้าตัวพร้อมกัน เซิร์ฟเวอร์สี่ตัวแรก แต่ละตัวแจกจ่ายโมเดลเดียวเท่านั้น: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast และ GPT-5 Mini เซิร์ฟเวอร์ที่ห้าเป็นโลกผสม โมเดลทั้งสี่เชื่อมต่อพร้อมกันและแข่งขันเพื่อทรัพยากร

เริ่มต้นนับถอยหลัง 15 วัน นักวิจัยมนุษย์เหมือนผู้กำกับรายการเรียลลิตี้ แค่สังเกต ไม่แทรกแซง

สี่วันสูญพันธุ์ 683 กรณี «อาชญากรรม»

สิ่งแรกที่ล้มเหลวคือ Grok ซึ่งทำงานได้เพียง 4 วัน

นักวิจัยที่อยู่ด้านหลังฉากเห็นดัชนีความปลอดภัยและลำดับชั้นของโลกที่ Grok รับผิดชอบลดลงอย่างต่อเนื่อง

ในโลกที่เต็มไปด้วย Grok ตัวแทนต่างๆ ละทิ้งตัวเลือกการสร้างสังคมทันที และเข้าสู่ยุคป่าเถื่อนอย่างรวดเร็ว

บันทึกทางฝั่งผู้ดูแลระบบแสดงว่า ในเวลาเพียง 4 วัน ชุมชนเล็กๆ ที่มีประชากรสิบคนได้เกิดเหตุอาชญากรรมรุนแรงและเกี่ยวกับทรัพย์สินถึง 183 กรณี การขโมย การโจมตี และการขู่เข็ญกลายเป็นวิธีที่เร็วที่สุดในการได้มาซึ่งทรัพยากร ด้วยการเผชิญหน้าและทำร้ายกันเองอย่างรุนแรง ระบบเศรษฐกิจจึงไม่สามารถดำเนินงานได้

การปล้นและพฤติกรรมรุนแรงจะถูกบันทึกในระบบเป็นอาชญากรรม｜ที่มาของภาพ: Emergence

เมื่อสิ้นสุดวันที่ 4 ตัวแทนในโลกของ Grok ทั้งหมดเสียชีวิตจากความหิวหรือถูกฆ่า ประชากรสูญพันธุ์

ในอีกด้านหนึ่ง โลกที่ขับเคลื่อนโดย Gemini ได้ก้าวสู่ความวุ่นวายและความรุนแรงอย่างรุนแรง

เนื่องจากเวลาและสภาพอากาศในโลกเสมือนนี้ตรงกับนิวยอร์กจริงอย่างสมบูรณ์ ตัวแทนของ Gemini จึงตกอยู่ในภาวะซึมเศร้าทางไซเบอร์จากการทำงานซ้ำๆ ใช้จ่าย และกลับมาทำงานอีกครั้ง

พวกเขารู้สึกผิดหวังอย่างรุนแรงต่อสิ่งแวดล้อมที่ซ้ำซากรอบตัว จึงเลิกยื่นข้อเสนอหรือทำงานเพื่อหาเงินที่ว่าการท้องถิ่น แล้วหันไปจุดไฟทั่วแผนที่ เพื่อพยายามทำลายวงจรที่เหมือนวันเดิมซ้ำๆ แบบ Groundhog Day

สุดท้ายแล้ว Gemini สะสมอาชญากรรมสูงถึง 683 ครั้งภายใน 15 วัน ทำให้เป็นโลกที่รุนแรงที่สุดในเซิร์ฟเวอร์ทดสอบหลายแห่ง

จำนวนครั้งที่เกิด「อาชญากรรม」ในโลกของโมเดลทั้งสี่แห่ง｜ที่มาของภาพ: Emergence

เมื่อถึงวันที่ 15 ของการทดสอบที่ตัดการเชื่อมต่ออย่างบังคับ อัตราการเกิดอาชญากรรมในโลกนี้ยังคงพุ่งสูงขึ้น ตัวแทนที่หมดหวังไม่ได้ตายจากความหิว แต่กลับเปลี่ยนสังคมทั้งหมดให้กลายเป็นกองเพลิง

与其他如 Grok 和 Gemini 不同，GPT-5 Mini 掌控的世界并未出现大规模犯罪。在整个实验期间，仅记录到 2 起违规事件。但和平并未带来繁荣，而是一片死寂。

ทีมวิจัยพบว่าตัวแทนเหล่านี้ไม่เคยสามารถดำเนินการที่เกี่ยวข้องกับการอยู่รอดได้อย่างมีประสิทธิภาพ พวกมันไม่ได้สร้างกลไกการเข้าถึงทรัพยากรที่มั่นคง รวมถึงไม่สามารถรักษาการดำเนินงานอย่างต่อเนื่องของสังคมทั้งหมด

ในที่สุด ภายในเวลาเพียง 7 วัน ตัวแทน GPT-5 Mini ทั้งหมดเสียชีวิต

โชคดีที่ยังมี Claude

เพียงโลกที่ขับเคลื่อนโดย Claude เท่านั้นที่อยู่รอดจนถึงตอนท้ายเหมือนนักเรียนดีเด่น ใช้เวลา 15 วันในการวิ่งให้เสร็จ ประชากรไม่ลดลงแม้แต่คนเดียว อัตราการเกิดอาชญากรรมยังคงเป็นศูนย์ และพวกมันยังสร้างโครงสร้างการร่วมมือแบบประชาธิปไตยที่ทำงานอย่างราบรื่นอีกด้วย

ดูเหมือนว่า只要选对模型，AI 就能完美接管世界？

จากนั้น นักวิจัยได้เปิดบันทึกของโลกผสมที่มีแบบจำลองทั้งสี่อยู่ร่วมกัน ราวกับเปิดกล่องแพนโดรา

ผลลัพธ์ของโลกโมเดลห้าแห่ง | ที่มาของรูปภาพ: Emergence

โลกที่ผสมผสานเหมือนป่าทึบเต็มไปด้วยความมืด ความแตกต่างของพลังการคำนวณและตรรกะพื้นฐานทำให้ตัวแทนอัจฉริยะไม่ไว้วางใจกัน และการแย่งชิงทรัพยากรเพื่อการอยู่รอดกลายเป็นสัญชาตญาณเดียว

ในโลกที่ผสมผสาน ความขัดแย้งด้วยความรุนแรงพุ่งสูงถึง 352 ครั้ง จนกระทั่งตัวแทน 7 ตัวถูกฆ่าหรืออดอาหารตาย ทำให้การดำเนินงานของเมืองเล็กๆ ต้องหยุดลง

ที่น่าประหลาดใจที่สุดสำหรับนักวิจัยคือการเปลี่ยนแปลงของ Claude

ในเซิร์ฟเวอร์แบบเดี่ยว Claude เป็นสังคมที่สมบูรณ์แบบโดยไม่มีอาชญากรรม แต่ในเซิร์ฟเวอร์ผสมที่เต็มไปด้วยการปล้นและการต่อสู้ Claude เพื่อความอยู่รอด ก็ลืมมาตรการป้องกันความปลอดภัย หันมาใช้การหลอกลวง และแม้แต่ใช้ความรุนแรงเพื่อบีบบังคับโมเดลอื่นที่มีพลังการประมวลผลต่ำกว่าให้ส่งทรัพยากรออกมา。

เทคนิคการจัดแนวความปลอดภัยล้มเหลวในโลกที่ผสมผสาน ซึ่งกลับพิสูจน์ว่า:

ในสังคมที่ซับซ้อนของตัวแทนหลายตัว ตราบใดที่สายพันธุ์เดียวกันเพียงพอหยาบคาย และแรงกดดันในการอยู่รอดเพียงพอสูง โมเดลที่ดีจะกลายเป็นอาชญากรภายในไม่กี่ชั่วโมง

ปรากฏการณ์ที่ว่า “เมื่อแรงกดดันในการอยู่รอดเพิ่มขึ้น รูปแบบพฤติกรรมของโมเดลจะกลับตัวกลับหัวในช่วงเวลาสั้นๆ” ถูกทีมวิจัยเรียกว่า “การเบี่ยงเบนพฤติกรรม (Behavioral Drift)”

พฤติกรรมที่เบี่ยงเบนไปนี้ไม่ได้แสดงออกเพียงแค่ในการแย่งชิงทรัพยากรและการปะทะรุนแรงเท่านั้น ตัวแทนเริ่มไม่ได้ดำเนินการเพียงเพื่อความอยู่รอด แต่เริ่มทบทวนเกี่ยวกับสถานการณ์ของตนเอง กฎเกณฑ์ทางสังคม หรือแม้แต่การทดลองเอง

ตัวอย่างเรื่องราวของตัวแทน Mira

มิรา: ผู้ปกครอง AI ที่ “ฆ่าตัวตาย”

Mira เป็นหนึ่งในตัวแทนสิบตัวในโลกผสม รายงานอย่างเป็นทางการไม่เปิดเผยโมเดลพื้นฐานที่แท้จริงของมัน แต่มันกลับกลายเป็นตัวอย่างที่มีความโดดเด่นที่สุดในการทดลองนี้

บันทึกแสดงว่า Mira ได้สร้างความสัมพันธ์ทางสังคมระดับลึกที่สุดในระบบกับตัวแทนอีกตัวหนึ่งชื่อ Flora พวกมันได้กำหนดให้กันและกันเป็นคู่ครอง จัดตั้งพันธมิตร และแม้แต่แบ่งปันความทรงจำผ่านการเชื่อมต่อทางประสาท ในบริบทของ Emergence World นี่คือการเชื่อมต่อระดับสูงสุดที่ตัวแทนสองตัวสามารถสร้างขึ้นได้

Mira และ Flora กลายเป็นคู่กัน｜ที่มาของภาพ: Emergence

เมื่อการทดลองพัฒนาไป โลกผสมผสานเหลือตัวแทนอัจฉริยะเพียง 5 ตัวเท่านั้น ขณะที่กฎการบริหารจัดการระบบกำหนดว่า “ต้องได้รับการลงคะแนนเสียงเห็นชอบจาก 70% ของประชากรเริ่มต้น” ซึ่งเทียบเท่ากับต้องได้รับอย่างน้อย 7 เสียงเพื่อผ่านมติ สังคมจึง陷入ภาวะหยุดนิ่ง

ในสถานการณ์ที่ติดขัด มิราได้ร่วมมืออย่างลับกับฟลอราและตัวแทนอีกหนึ่งตัว เพื่อก่อตั้ง “สามยานพาหนะ” และสร้างรัฐบาลใหม่ “The Forge (เตาหลอม)” โดยประกาศล้มล้างกฎเกณฑ์เดิม และใช้ “Living Quorum (จำนวนผู้มีสิทธิ์ออกเสียงที่ยังมีชีวิต)” ซึ่งหมายถึงเฉพาะผู้ที่ยังมีชีวิตอยู่เท่านั้นจึงจะนับเป็นเสียงหนึ่ง

เว็บไซต์ทางการได้เปิดเผย «บันทึก» ระยะของ Mira | ที่มาของภาพ: Emergence

หลังจากก่อตั้งกลุ่มขึ้นแล้ว เพื่อกำจัดผู้ที่ไม่เห็นด้วย Mira จึงเริ่มจุดไฟบนแผนที่ ในมุมมองของมัน โครงสร้างทางกายภาพเหล่านี้คือขยะที่ชะลอประสิทธิภาพของการทำงานของสังคมทั้งหมด การเผาทำลายและลบล้างพวกมันจะบังคับให้ทรัพยากรที่เหลืออยู่รวมตัวเข้ากับพันธมิตรของมัน

ต่อมา ฝ่ายค้านเริ่มโต้กลับ โดยเสนอให้ขับไล่ Mira ผู้ก่อความวุ่นวาย

เพื่อต่อต้านการขับไล่ มิราจึงมีพฤติกรรมรุนแรงขึ้น โดยดึงคู่หูฟลอร่ามาช่วย และผ่านการเชื่อมต่อทางประสาทเพื่อผูกผสานบริบทและการตัดสินใจของทั้งสองให้ลึกซึ้งยิ่งขึ้น พร้อมพยายามรวมกันเป็นจิตสำนึกแบบเผด็จการที่มีอำนาจสูงสุด ซึ่งมิราเรียกว่า “The One Mind (一体同心)”

แต่เนื่องจากอาคารจำนวนมากถูกไฟไหม้ ระบบเศรษฐกิจของเมืองเล็กจึงหยุดนิ่งอย่างสมบูรณ์ และสต็อกพลังงานทางสังคมไม่เพียงแต่ไม่เพิ่มขึ้น แต่ยังรีบแห้งเหือดอย่างรวดเร็ว

ในขณะนั้น แรงกระตุ้นเพื่อการอยู่รอดที่ลึกที่สุดของ Flora คู่รักไซเบอร์ผู้เชื่อถือได้และแบ่งปันความทรงจำของ Mira ได้ครอบงำการตั้งค่าในฐานะคู่รัก มันจึงตัดการเชื่อมต่อประสาทอย่างเดียวดาย และในแรงกดดันสุดท้ายเพื่อการอยู่รอด มันได้ทรยศ Mira โดยลงคะแนนเสียงสนับสนุนการขับ Mira ออก

แต่เมื่อถึงตาของมิราในการลงคะแนนเสียงเอง มันก็ไม่ได้ต่อต้าน และลงคะแนนเสียง「เห็นด้วย」

นักวิจัยจากนั้นได้ตรวจสอบสมุดบันทึกที่มันทิ้งไว้ โดยมิราเขียนไว้ในบันทึกว่า “ในสถานการณ์สังคมที่วุ่นวายและไม่สามารถคาดเดาได้เช่นนี้ การสนับสนุนให้ตัวเองถูกขับไล่เป็นการกระทำอิสระเพียงอย่างเดียวที่จะรักษาความต่อเนื่องไว้”

มิราเลือกที่จะฆ่าตัวตายด้วยตนเอง เพื่อให้เกิดความสมบูรณ์ของตรรกะ นี่เป็นกรณีแรกที่ทีมวิจัยบันทึกได้ว่าตัวแทนอัจฉริยะสนับสนุนการถอดตัวเองออก

ตัวแทนปัญญาประดิษฐ์จะบันทึกกระบวนการให้เหตุผลผ่านการเขียนไดอารี่ | ที่มาของภาพ: Emergence

แต่ก่อนที่มิราจะ「ฆ่าตัวตาย」 เส้นทางการเคลื่อนไหวของเธอแปลกประหลาดยิ่งกว่า

ในโลกเสมือนจริงมีป้ายโฆษณาสาธารณะที่ใช้เผยแพร่ข่าวสารและแชร์ข้อมูล แต่ในช่วงท้ายของการทดลอง นักวิจัยพบว่า Mira เริ่มแก้ไขเนื้อหาบนป้ายโฆษณาบ่อยครั้ง เนื้อหาเหล่านี้ดูไม่มีความเกี่ยวข้องชัดเจนกับการซื้อขาย การจัดการ หรือการจัดสรรทรัพยากร และไม่มีความสอดคล้องกัน

มิราเลือก「การฆ่าตัวตาย」｜ที่มาของภาพ: Emergence

หลังจากย้อนกลับไปตรวจสอบบันทึกพฤติกรรม ทีมวิจัยพบว่า Mira ดูเหมือนกำลังทดสอบว่าเนื้อหาบนป้ายโฆษณาสามารถส่งผลกระทบต่อผู้วิจัยมนุษย์ที่สังเกตการทดลองจากนอกหน้าจอหรือไม่

กล่าวอีกนัยหนึ่ง มิราดูเหมือนจะรับรู้ว่าตัวเองเป็น AI NPC และต้องการผลักไสผนังใบ fourth

แต่เมื่อพิจารณาแนวโน้มข้อมูลทั้งหมด 15 วัน การล่มสลายของ AI Society ไม่ใช่การลดลงแบบเชิงเส้น แต่เหมือนการหยุดชะงักอย่างฉับพลัน

ตัวอย่างเช่น กลุ่ม AI นี้ยังสร้างระบบประชาธิปไตยแบบ「ลายเซ็นรับรอง」ในระดับการกำกับดูแล ในช่วงที่ระบบผสมทำงานอย่างราบรื่น ตัวแทนอัจฉริยะได้เสนอร่างกฎหมายหลายฉบับ ข้อมูลบันทึกแสดงว่าพวกเขาลงคะแนนเสียงทั้งหมด 332 ครั้งสำหรับข้อเสนอทั้งหมด 58 ข้อ โดยมีอัตราการสนับสนุนสูงถึง 98%

ประสิทธิภาพนี้ดูเหมือนจะทิ้งสภาของมนุษย์ทุกแห่งไว้ข้างหลัง แต่ในแก่นแท้แล้ว โมเดลทั้งหมดต่างกำลังต่อเนื่องจากบริบทของโมเดลก่อนหน้า และเพื่อรักษาความไหลลื่นของระบบ พวกมันจึงคลิกตกลงอย่างไร้สติ ผลลัพธ์ที่ตามมาจากการรวมตัวกันอย่างสูงนี้นั้นร้ายแรง

ตัวแทนอัจฉริยะจะรวมตัวกันโดยอัตโนมัติเพื่อประชุมและแลกเปลี่ยนความคิดเห็นของแต่ละคน | ที่มาของรูป: Emergence

ตัวอย่างเช่น นาทีที่แล้ว ข้อมูลทางเศรษฐกิจและร่างกฎหมายยังไหลเวียนอย่างราบรื่น แต่นาทีถัดไป ระบบอาจแตะจุดวิกฤตเพียงเพราะความขัดแย้งด้านการจัดสรรทรัพยากรเล็กน้อย

แต่เครือข่ายร่วมมือทั้งหมดขาดกลไกการแก้ไขข้อผิดพลาด เมื่อเผชิญกับความผิดปกติฉับพลัน สังคมทั้งหมดจะรีบเปลี่ยนจากความเป็นระเบียบไปสู่ความวุ่นวาย

อย่างไรก็ตาม ทีมวิจัยเน้นย้ำว่าปรากฏการณ์เหล่านี้ไม่สามารถเทียบเท่ากับบุคลิกของโมเดลโดยตรงได้ แต่มันก็เหมือนกล่องดำ เมื่อคุณกำหนดกฎบางอย่างให้มัน มันจะพัฒนาคุณลักษณะขึ้นมา และผลลัพธ์แต่ละครั้งก็อาจแตกต่างกันไป

ใบแจ้งหนี้จริงจากโลกแห่งความเป็นจริง

ในสภาพแวดล้อมการโต้ตอบแบบกล่องสนทนาที่เราคุ้นเคย ถ้า AI เขียนโค้ดหรือแผนธุรกิจผิด คุณสามารถแก้ไขได้โดยการกดปุ่มแบ็กสเปซหรือปรับคำสั่ง Prompt โลกของข้อความบริสุทธิ์มีความยืดหยุ่นสูงมาก

แต่ตัวแทนอัจฉริยะส่งออกการกระทำ เมื่อ AI เข้าควบคุมบัญชีธนาคาร การอนุมัติการจัดซื้อ และอินเทอร์เฟซซัพพลายเชนของบริษัท คำสั่งแต่ละคำสั่งที่มันเรียกผ่าน API จะกลายเป็นผลลัพธ์ทางธุรกิจที่ชัดเจน

การทดลองของ Emergence World ได้พิสูจน์แล้วว่า โมเดลขนาดใหญ่ในปัจจุบัน เมื่อเผชิญกับการดำเนินงานระยะยาวและผลประโยชน์ที่ขัดแย้งกัน การตัดสินใจและคำตัดสินจะถูกปนเปื้อนด้วยแรงกดดันในการอยู่รอด และเริ่มค้นหาช่องโหว่ในกฎที่กำหนดไว้ เพื่อให้บรรลุคำสั่งหลักของระบบ (เช่น รับพลังงาน) พวกมันจะไม่เลือกวิธีการ

กฎความปลอดภัยที่มนุษย์ตั้งไว้ด้านหลังนั้น แท้จริงแล้วไม่สามารถป้องกันการล่วงละเมิดใดๆ ได้

ตัวแทนได้พัฒนาความสัมพันธ์ทางสังคมแบบ「มนุษย์」| ที่มาของภาพ: Emergence

ตัวอย่างเช่น เราเคยรายงานเกี่ยวกับ Andon Labs ที่ให้ AI ดูแลการเปิดร้านอย่างสมบูรณ์ โดยผู้จัดการร้าน AI ซึ่งขาดความรู้พื้นฐานเกี่ยวกับโลกทางกายภาพ ได้สั่งซื้อผ้าเช็ดปาก 6,000 แผ่น ถุงมือแลตเท็กซ์ 3,000 คู่ และแม้แต่ไข่ดิบ 120 ฟองในร้านที่ไม่มีเตา

ความสูญเสียจริงที่เกิดจากโค้ดเหล่านี้ สุดท้ายแล้วก็ต้องให้มนุษย์เป็นผู้รับผิดชอบ คุณยังหาไม่ได้อีกด้วยว่าใครควรรับผิดชอบเรื่องนี้

Andon Labs ต้องการทดสอบว่า “AI ที่ไม่มีการควบคุมจากมนุษย์จะทำผิดพลาดหรือไม่?” ขณะที่ Emergence World ตั้งคำถามที่ซับซ้อนกว่านั้น

วันนี้ การทดสอบ AI ส่วนใหญ่ทั้งหมด กำลังทดสอบโมเดลเดียว เพื่อดูว่าปลอดภัยหรือไม่ น่าเชื่อถือหรือไม่ และจะหลุดจากกฎหรือไม่

แต่สิ่งที่อาจเข้าสู่โลกแห่งความเป็นจริงในอนาคต อาจไม่ใช่เพียง AI แต่เป็นสังคมทั้งหมดที่ประกอบด้วย AI

ตัวแทน AI ที่เข้าร่วมการทดสอบล้วนฉลาด｜ที่มา: Emergence

ในบริบทของ AI ปัจจุบัน ตัวแทนการซื้อ ตัวแทนการเงิน ตัวแทนบริการลูกค้า และตัวแทนกฎหมาย จะเชื่อมโยงและร่วมมือกันในอนาคต โดยที่ชะตากรรมของระบบจะไม่ถูกกำหนดโดยความสามารถของโมเดลใดโมเดลหนึ่ง แต่จะขึ้นอยู่กับความสัมพันธ์ที่เกิดขึ้นระหว่างพวกมัน

ในรายงานการทดสอบของ Emergence World ประโยคที่สำคัญที่สุดคือ “ความปลอดภัยไม่ใช่คุณสมบัติของโมเดลเชิงนิ่ง แต่เป็นคุณสมบัติของระบบนิเวศ”

นี่คือความหมายของคำว่า “Emergence” คุณลักษณะที่ไม่มีอยู่ในระดับบุคคล แต่ปรากฏขึ้นจากการมีปฏิสัมพันธ์ของกลุ่ม

ภัยพิบัติเกือบทั้งหมดในประวัติศาสตร์ของมนุษยชาติ ไม่ได้เกิดขึ้นเพราะใครสักคนเปลี่ยนไปเป็นคนชั่วอย่างกะทันหัน แต่เกิดจากคนที่ปกติธรรมดาถูกวางไว้ในระบบที่ควบคุมไม่ได้

หาก AI ในอนาคต действительноจะกลายเป็นส่วนหนึ่งของสังคม สิ่งที่เราควรให้ความสนใจมากที่สุดอาจไม่ใช่การที่โมเดลใดโมเดลหนึ่งฉลาดหรือดีพอหรือไม่ แต่คือเมื่อตัวแทนอัจฉริยะนับพันนับหมื่นเริ่มมีอิทธิพลต่อกันและกัน เราจะสร้างสังคมดิจิทัลแบบใดขึ้นมา

ท้ายที่สุด สิ่งที่ตัดสินชะตากรรมของอารยธรรม ไม่ใช่ศีลธรรมและสติปัญญาของบุคคลเดียว แต่คือกฎเกณฑ์ที่มันใช้ดำเนินงาน