เครื่องจักรเพิ่งแก้ปัญหาคณิตศาสตร์ที่ทำให้มนุษย์ติดขัดมานานหลายทศวรรษ ระบบ AlphaProof Nexus ของ Google DeepMind ซึ่งรวมโมเดลภาษาขนาดใหญ่เข้ากับตัวช่วยพิสูจน์ทางรูปแบบ Lean ได้แก้ปัญหา Erdős ที่ยังเปิดอยู่ได้ 9 จาก 353 ปัญหา และพิสูจน์ข้อคาดการณ์ที่ยังเปิดอยู่จาก Online Encyclopedia of Integer Sequences (OEIS) ได้ 44 จาก 492 ข้อ
ต้นทุนต่อปัญหา: ไม่กี่ร้อยดอลลาร์ ปัญหาเหล่านั้นเองในบางกรณี ยังไม่ได้รับการแก้ไขนานกว่าที่ผู้อ่านส่วนใหญ่จะมีชีวิตอยู่
AlphaProof Nexus ทำหน้าที่อะไรจริงๆ
AlphaProof Nexus แก้ไขปัญหาการหลอกลวงของ AI โดยการผสานความสามารถในการสร้างของโมเดล AI เข้ากับการตรวจสอบพิสูจน์อย่างเป็นทางการผ่านเครื่องมือพิสูจน์ Lean ระบบ AI จะเสนอพิสูจน์ จากนั้นระบบตรวจสอบที่แยกต่างหากจะตรวจสอบขั้นตอนตรรกะทุกขั้นตอน หากพิสูจน์ไม่ถูกต้อง จะถูกปฏิเสธ
ผลลัพธ์ได้รับการบันทึกในเอกสารล่วงหน้า arXiv (2605.22763v1) ที่เผยแพร่เมื่อวันที่ 21 พฤษภาคม 2026 หลักฐานทางคณิตศาสตร์ทั้งหมดและเวอร์ชันภาษาธรรมชาติที่เลือกได้รับการเผยแพร่ในที่เก็บ GitHub ซึ่งได้รับการอัปเดตระหว่างวันที่ 20 ถึง 22 พฤษภาคม 2026 ตัวอย่างปัญหาที่ได้รับการแก้ไขรวมถึงรุ่น #125, #138, #741 และ #12 จากแคตตาล็อกปัญหาของ Erdős โดยหลักฐานได้รับการแชร์ผ่านการอภิปรายบน erdosproblems.com
ระบบใช้สิ่งที่ DeepMind เรียกว่า “agentic loops” ที่เกี่ยวข้องกับการตรวจสอบพิสูจน์ การวนซ้ำ และการปรับปรุงพิสูจน์ให้สอดคล้องกับตัวตรวจสอบทางรูปแบบจนกว่าพิสูจน์จะผ่านหรือระบบสรุปว่าไม่สามารถแก้ปัญหานี้ได้
รุ่นตัวแทนพื้นฐานของระบบยังแก้ปัญหาของ Erdős ได้ 9 ข้อ แต่ด้วยต้นทุนการคำนวณที่สูงกว่า ซึ่งบ่งชี้ว่าสถาปัตยกรรม Nexus แบบเต็มรูปแบบมีประสิทธิภาพมากกว่ามากกว่าที่จะมีความสามารถสูงกว่าในเชิงดิบ
เหตุผลที่ปัญหาของเออร์ดอสสำคัญ
พอล เออร์ดอส เป็นหนึ่งในนักคณิตศาสตร์ที่ผลิตผลงานได้มากที่สุดในประวัติศาสตร์ โดยรับผิดชอบในการตั้งคำถามนับร้อยข้อในสาขาการจัดหมู่ ทฤษฎีจำนวน และทฤษฎีกราฟ ปัญหาหลายข้อเหล่านี้มีรางวัลเงินสดที่เขาตั้งขึ้นเอง
การแก้ปัญหา Erdős ได้ 9 จากทั้งหมด 353 ปัญหาที่ยังค้างอยู่ คิดเป็นประมาณ 2.5% แต่ละปัญหาเป็นขอบเขตของความรู้ทางคณิตศาสตร์ที่นักคณิตศาสตร์มืออาชีพแทบไม่ได้ก้าวหน้าเลย บางครั้งเป็นเวลาหลายทศวรรษ
การพิสูจน์ข้อสันนิษฐานของ OEIS 44 ข้อจากทั้งหมด 492 ข้อ หรือประมาณ 9% แสดงให้เห็นว่าระบบสามารถทำงานได้ในหลากหลายสาขาคณิตศาสตร์ ไม่ใช่เฉพาะเจาะจงแค่ด้านใดด้านหนึ่ง
AlphaProof Nexus สร้างขึ้นจากงานก่อนหน้าของ DeepMind ที่ใช้ AlphaProof ซึ่งบรรลุประสิทธิภาพระดับเหรียญเงินในการแข่งขันคณิตศาสตร์โอลิมปิกสากลปี 2024 การก้าวจากโปรแกรมแก้ปัญหาโอลิมปิกไปสู่โปรแกรมพิสูจน์ระดับวิจัยนั้นมีความสำคัญอย่างมาก: ปัญหาโอลิมปิกถูกออกแบบมาให้สามารถแก้ได้ภายในไม่กี่ชั่วโมงโดยมนุษย์ที่มีพรสวรรค์ ในขณะที่ปัญหาวิจัยแบบเปิดไม่มีการรับประกันเช่นนั้น
สิ่งนี้หมายความว่าอย่างไรต่อการตรวจสอบ AI และคริปโต
AlphaProof Nexus ไม่มีความเชื่อมโยงโดยตรงกับสินทรัพย์ดิจิทัลหรือโทเค็นใดๆ DeepMind ได้พัฒนาสิ่งนี้ขึ้นเพื่อการวิจัยทางคณิตศาสตร์ โดยมีการคาดการณ์ว่าจะนำไปใช้ในสาขาคอมบิเนตอริกส์ เรขาคณิตพีชคณิต และการเพิ่มประสิทธิภาพ
เทคโนโลยีหลัก การตรวจสอบอย่างเป็นทางการที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ ตั้งอยู่ที่จุดตัดของปัญหาหลายประการที่อุตสาหกรรมคริปโตให้ความสำคัญ การตรวจสอบสัญญาอัจฉริยะ การสร้าง zero-knowledge proof และการตรวจสอบโปรโตคอลเข้ารหัส ล้วนพึ่งพาความสามารถพื้นฐานเดียวกัน: การรับรองว่าข้อความเชิงตรรกะมีความถูกต้องอย่างพิสูจน์ได้
การตรวจสอบอย่างเป็นทางการคือกระบวนการพิสูจน์ทางคณิตศาสตร์ว่าซอฟต์แวร์ทำงานตามที่ตั้งใจไว้ ซึ่งในอดีตมีค่าใช้จ่ายสูงและช้า ต้องอาศัยผู้เชี่ยวชาญเฉพาะทาง ระบบที่สามารถสร้างและตรวจสอบหลักฐานเชิงรูปแบบได้ด้วยตนเองในราคาไม่กี่ร้อยดอลลาร์ต่อปัญหา ได้เปลี่ยนแปลงเศรษฐศาสตร์ของสมการนี้
zero-knowledge proof เทคนิคการเข้ารหัสที่เป็นพื้นฐานของบล็อกเชนที่เน้นความเป็นส่วนตัวและโซลูชันการขยายขนาดระดับที่สอง ต้องการการสร้างทางคณิตศาสตร์อย่างเข้มงวด ข้อผิดพลาดในการออกแบบวงจร ZK อาจทำให้ความเป็นส่วนตัวและความปลอดภัยเสี่ยง
