Meituan เปิดแหล่งที่มาของโมเดลพิสูจน์ทฤษฎีบทขนาด 560 พันล้านพารามิเตอร์ ด้วยอัตราการผ่าน 97.1% ใน 72 ขั้นตอนการให้เหตุผล

Chainthink

เวลาเผยแพร่: 21/03/2569 02:31:29

แชร์

สรุป

ทีม LongCat ของ Meituan ได้เปิดแหล่งรหัส LongCat-Flash-Prover ซึ่งเป็นโมเดล MoE ขนาด 560 พันล้านพารามิเตอร์สำหรับการพิสูจน์ทฤษฎีบท Lean4 โมเดลดังกล่าวซึ่งมีให้บน GitHub, Hugging Face และ ModelScope ภายใต้ใบอนุญาต MIT สามารถบรรลุอัตราการผ่าน 97.1% บน MiniF2F-Test ใน 72 ขั้นตอน การลงทุนตามมูลค่าในคริปโตยังคงได้รับประโยชน์จากการวิเคราะห์เปิดตำแหน่ง เนื่องจากมีเครื่องมือใหม่ๆ เช่น นี้เกิดขึ้น

ตามการติดตามของ 1M AI News ทีม LongCat ของ Meituan เปิดตัว LongCat-Flash-Prover ซึ่งเป็นโมเดล MoE ขนาด 560,000 ล้านพารามิเตอร์ ที่ออกแบบมาเฉพาะสำหรับงานการให้เหตุผลทางคณิตศาสตร์ในภาษาพิสูจน์ทางรูปนิยม Lean4 น้ำหนักของโมเดลได้รับการเผยแพร่ภายใต้ใบอนุญาต MIT และได้上线บน GitHub, Hugging Face และ ModelScope

แบบจำลองแยกการให้เหตุผลเชิงรูปนิยมออกเป็นสามความสามารถที่เป็นอิสระ: การแปลงเชิงรูปนิยมอัตโนมัติ (แปลงปัญหาคณิตศาสตร์ภาษาธรรมชาติให้เป็นประโยคใน Lean4), การสร้างร่าง (ผลิตกรอบการพิสูจน์ในรูปแบบเลมมา) และการสร้างการพิสูจน์อย่างสมบูรณ์ ความสามารถทั้งสามนี้ใช้การรวมเครื่องมือตัวแทนเพื่อให้เหตุผลกับคอมไพเลอร์ Lean4 เพื่อตรวจสอบแบบเรียลไทม์

ในด้านการฝึกอบรม ทีมได้เสนอกรอบการทำงาน Hybrid-Experts Iteration เพื่อสร้างข้อมูลสำหรับการเริ่มต้นแบบเย็น และในขั้นตอนการเรียนรู้แบบเสริมแรง ได้นำอัลกอริทึม HisPO มาใช้เพื่อเสถียรภาพการฝึกอบรมงานระยะยาวของโมเดล MoE พร้อมทั้งเพิ่มกลไกการตรวจสอบความสอดคล้องและกฎหมายของทฤษฎีเพื่อป้องกันการหลอกลวงรางวัล

การทดสอบพื้นฐานแสดงว่า LongCat-Flash-Prover ได้ทำลายสถิติ SOTA สองรายการในโมเดลน้ำหนักแบบเปิดแหล่งที่มา ได้แก่ การพิสูจน์เชิงอัตโนมัติและการพิสูจน์ทฤษฎีบท โดยมีอัตราการผ่าน 97.1% บน MiniF2F-Test ด้วยการให้เหตุผลเพียง 72 ครั้ง และได้คะแนน 70.8% และ 41.5% ตามลำดับบน ProverBench และ PutnamBench โดยไม่เกิน 220 ครั้งต่อคำถาม

แหล่งที่มา:แสดงต้นฉบับ

คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา