Anthropic เสนอการระงับการพัฒนาปัญญาประดิษฐ์ทั่วอุตสาหกรรมเพื่อประเมินความเสี่ยง

Anthropic บริษัทผู้พัฒนาโมเดล Claude AI ได้เผยแพร่บล็อกโพสต์เมื่อวันที่ 4 มิถุนายน เสนอแนวคิดที่เมื่อปีก่อนคงดูไม่น่าเป็นไปได้จากห้องปฏิบัติการ AI ชั้นนำเลย: การหยุดชั่วคราวอย่างเป็นระบบในการพัฒนา AI ระดับหน้าสุดของอุตสาหกรรมทั้งหมด

ข้อเสนอที่เขียนโดย Marina Favaro และ Jack Clark มุ่งเน้นไปที่ปัญหาที่เฉพาะเจาะจงและน่ากังวลอย่างแท้จริง โมเดล AI กำลังเข้าใกล้ความสามารถในการปรับปรุงตนเองแบบวนซ้ำ หมายความว่าพวกเขาสามารถปรับเปลี่ยนและพัฒนาความสามารถของตนเองได้โดยไม่ต้องมีการแทรกแซงจากมนุษย์

สิ่งที่ Anthropic กำลังเสนอจริงๆ

นี่ไม่ใช่การเรียกร้องให้ถอด GPU ทุกตัวและกลับบ้าน Anthropic กำลังสนับสนุนกรอบการทำงานร่วมกันแบบหลายฝ่าย โดยห้องปฏิบัติการ AI รายใหญ่ตกลงระงับงานพัฒนาที่ก้าวหน้าที่สุดชั่วคราว เพื่อให้งานวิจัยด้านความปลอดภัยและระบบการตรวจสอบสามารถตามทัน

Anthropic ชี้ชัดว่า การกระทำฝ่ายเดียว ซึ่งบริษัทหรือประเทศใดประเทศหนึ่งเหยียบเบรกเพียงฝ่ายเดียว นั้นไม่เพียงพอและอาจมีผลตรงข้าม การเสนอแนะนี้มองถึงความร่วมมือระหว่างห้องปฏิบัติการที่มีทรัพยากรดีเยี่ยมจากสหรัฐอเมริกา จีน และประเทศอื่นๆ ที่มีโปรแกรม AI อย่างจริงจัง Anthropic กำลังนำเสนอความท้าทายในการตรวจสอบในรูปแบบที่ยืมมาจากข้อตกลงควบคุมอาวุธนิวเคลียร์ โดยผู้ตรวจสอบจะยืนยันการปฏิบัติตามผ่านกลไกการตรวจจับที่ตกลงกันไว้ แทนที่จะพึ่งพาความเชื่อเพียงอย่างเดียว

โฆษณา

Anthropic ระบุว่าจะดำเนินการวิจัยของตนเองเพื่อสร้างเครื่องมือตรวจจับและยืนยันเหล่านี้ โดยสร้างระบบที่เทียบเท่ากับผู้ตรวจสอบอาวุธ AI — ระบบที่สามารถยืนยันได้ว่าห้องปฏิบัติการกำลังดำเนินการพัฒนาขั้นสูงอย่างลับๆ ขณะที่อ้างอย่างเปิดเผยว่าปฏิบัติตามการระงับชั่วคราว

ทำไมครั้งนี้อาจแตกต่างจากปี 2023

ในปี 2023 จดหมายเปิดผนึกที่เรียกร้องให้ระงับการฝึกอบรม AI ที่เกินระดับ GPT-4 เป็นเวลาหกเดือน ได้รับลายเซ็นจากนักวิจัยและบุคคลชั้นนำด้านเทคโนโลยีนับพันราย แต่กลับไม่สามารถบรรลุเป้าหมายใดๆ อย่างมีนัยสำคัญ แรงกดดันด้านการแข่งขันพิสูจน์แล้วว่ามีอิทธิพลมากกว่าความกังวลร่วมกัน และห้องปฏิบัติการรายใหญ่ทุกแห่งยังคงพัฒนาต่อไป

ข้อเสนอของ Anthropic มีโครงสร้างที่แตกต่างกัน แทนที่จะขอให้มีการระงับชั่วคราวที่ไม่ชัดเจนซึ่งสนับสนุนด้วยลายเซ็น บริษัทเสนอระบบการปฏิบัติตามที่สามารถตรวจสอบได้ การเปรียบเทียบกับการควบคุมอาวุธนิวเคลียร์ไม่ได้ผิดไปทั้งหมด: สนธิสัญญาควบคุมอาวุธระหว่างประเทศทำงานได้ เมื่อทำงานได้ เพราะมีระบบการตรวจสอบและผลลัพธ์สำหรับการละเมิด ไม่ใช่เพราะผู้ลงนามแค่สัญญาด้วยนิ้วก้อย

ในปี 2023 การปรับปรุงตนเองแบบวนซ้ำเป็นเพียงข้อกังวลเชิงทฤษฎี ขณะนี้ การสังเกตภายในของ Anthropic ชี้ให้เห็นว่าโมเดลปัจจุบันมีความสามารถเพิ่มขึ้นในการเขียนโค้ดด้วยตนเอง ใกล้เคียงกับขีดจำกัดที่ระบบ AI สามารถมีส่วนร่วมอย่างมีนัยสำคัญต่อการพัฒนาเวอร์ชันถัดไปของตัวเอง

สิ่งนี้หมายความว่าอย่างไรสำหรับนักลงทุน

สำหรับผู้ที่ถือสินทรัพย์ที่เกี่ยวข้องกับ AI รวมถึงโทเค็นคริปโตที่มุ่งเน้น AI และโครงการบล็อกเชนที่ใช้การเรียนรู้ของเครื่อง ข้อเสนอของ Anthropic ได้เพิ่มตัวแปรใหม่เข้าไปในกระบวนการคำนวณความเสี่ยง กรอบการระงับชั่วคราวอย่างร่วมมือ แม้จะไม่เกิดขึ้นจริงทั้งหมด ก็เปลี่ยนการอภิปรายจาก “เราควรควบคุม AI หรือไม่” เป็น “เราจะบังคับใช้การปฏิบัติตามกฎระเบียบข้ามพรมแดนได้อย่างไร”

โครงการคริปโตที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ ตั้งแต่เครือข่ายการคำนวณแบบกระจายอำนาจไปจนถึงโทเค็นตัวแทนปัญญาประดิษฐ์ ได้รับส่วนหนึ่งของข้อได้เปรียบทางมูลค่าจากสมมติฐานที่ว่าการพัฒนาปัญญาประดิษฐ์จะยังคงเร่งตัวขึ้นอย่างต่อเนื่องโดยไม่หยุดชะงัก กรอบการระงับที่น่าเชื่อถือ หรือแม้แต่การเคลื่อนไหวด้านการกำกับดูแลอย่างจริงจังในทิศทางนั้น อาจก่อให้เกิดความไม่แน่นอนต่อการประเมินมูลค่าเหล่านั้น

ระบบการตรวจสอบแบบกระจายศูนย์อาจกลายเป็นส่วนหนึ่งของคำตอบที่ Anthropic กำลังมองหา หากคุณต้องตรวจสอบว่าห้องปฏิบัติการทั่วโลก tuân thủข้อจำกัดในการพัฒนา สมุดบันทึกที่โปร่งใสและกันการเปลี่ยนแปลงไม่ใช่เครื่องมือที่แย่ที่สุดสำหรับงานนี้