OpenAI ให้คะแนนการให้เหตุผลของโมเดล AI โดยไม่ตั้งใจ พบว่าไม่มีการสูญเสียความสามารถในการตรวจสอบ

iconCryptoBriefing
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ข่าว AI + คริปโต: OpenAI เปิดเผยโมเดล AI หลายตัว รวมถึง GPT-5.4 Thinking และเวอร์ชัน GPT-5.4 อื่นๆ ที่ประสบกับการให้คะแนนแบบ chain-of-thought โดยไม่ตั้งใจระหว่างการฝึกอบรม รายงานข่าวบนบล็อกเชนแสดงว่าการวิเคราะห์ภายในพบว่าไม่มีการสูญเสียความสามารถในการตรวจสอบที่สำคัญ ข้อผิดพลาดนี้ส่งผลกระทบต่อตัวอย่างการฝึกอบรมน้อยกว่า 3.8% ส่วนหนึ่งของกระบวนการประเมินการให้เหตุผลภายในแทนผลลัพธ์สุดท้ายโดยไม่ตั้งใจ OpenAI สแกนการรันการเรียนรู้ด้วยการเสริมแรงทั้งหมดและยืนยันว่าความโปร่งใสในการให้เหตุผลยังคงสมบูรณ์ Redwood Research ชี้ให้เห็นว่าเหตุการณ์นี้ไม่ได้ทำลายความสามารถในการตรวจสอบ แต่เน้นย้ำถึงความเสี่ยงของ chain-of-thought โมเดล AI ตอนนี้ได้รับการรวมเข้ากับระบบบล็อกเชน เช่น การตรวจสอบสัญญาอัจฉริยะและการเทรดอัตโนมัติ ความสามารถในการตรวจสอบที่ยังคงสมบูรณ์เป็นสิ่งสำคัญสำหรับนักพัฒนาและนักลงทุนในโครงการคริปโตที่รวม AI

OpenAI เปิดเผยว่าโมเดล AI หลายตัวของพวกเขา รวมถึง GPT-5.4 Thinking และการปรับปรุงต่างๆ ของ GPT-5.4 ได้รับการให้คะแนนแบบ chain-of-thought โดยไม่ตั้งใจระหว่างการฝึกอบรมการเรียนรู้แบบเสริมแรง การวิเคราะห์ภายในพบว่าไม่มีการลดลงอย่างมีนัยสำคัญในความสามารถของโมเดลในการแสดงกระบวนการของตน

เหตุการณ์เหล่านี้ส่งผลกระทบต่อตัวอย่างการฝึกน้อยกว่า 3.8% ในโมเดลที่ได้รับผลกระทบมากที่สุด ซึ่งมีส่วนเล็กน้อยของกระบวนการฝึกอบรมที่ให้รางวัลหรือลงโทษโมเดลโดยไม่ได้ตั้งใจตามขั้นตอนการให้เหตุผลภายในของโมเดล แทนที่จะพิจารณาเฉพาะผลลัพธ์สุดท้าย

เกิดอะไรขึ้นจริงๆ

การให้คะแนนโดยไม่ตั้งใจมีรูปแบบจำกัดบางอย่าง การฝึกบางครั้งให้รางวัลกับความมีประโยชน์ของเส้นทาง ซึ่งหมายถึงการให้คะแนนเชิงบวกกับรูปแบบการให้เหตุผลของโมเดล ในขณะที่บางครั้งลงโทษการใช้คำขอที่ไม่จำเป็นภายในห่วงโซ่ความคิด กรณีทดสอบที่เด่นชัดที่สุดแสดงให้เห็นอัตราการลงโทษการอ้างอิง CoT ถึงการโกงประมาณ 2%

ทีมภายในของ OpenAI ได้ดำเนินการสแกนอัตโนมัติผ่านการรันการเรียนรู้แบบเสริมแรงทั้งหมดเพื่อตรวจสอบผลกระทบต่อความโปร่งใสในการให้เหตุผล โมเดลยังสามารถติดตามการให้เหตุผลเชิงตรรกะได้อย่างเชื่อถือได้ และความสามารถในการตรวจจับความไม่สอดคล้องที่อาจเกิดขึ้นยังคงทำงานได้อย่างสมบูรณ์

ระบบนิเวศด้านความปลอดภัยตอบสนอง

องค์กรภายนอก ได้แก่ METR, Apollo Research และ Redwood Research ได้ร่วม贡献ข้อมูลเชิงลึกให้กับผลการค้นพบ Redwood Research ยอมรับว่าเหตุการณ์เล็กน้อยเหล่านี้ไม่ได้ส่งผลต่อความสามารถในการตรวจสอบ แต่ชี้ให้เห็นว่าการให้เหตุผลแบบห่วงโซ่ความคิด ซึ่งใช้เป็นมาตรการความปลอดภัย นั้นมีช่องโหว่ที่เป็นธรรมชาติ

Anthropic ได้เผยแพร่รายงานในเดือนเมษายน 2026 เพื่อศึกษาปรากฏการณ์ที่คล้ายกันในโมเดลของตนเอง OpenAI ได้เพิ่มมาตรการตรวจจับอย่างต่อเนื่องตั้งแต่เดือนธันวาคม 2025 เพื่อป้องกันข้อผิดพลาดในการให้คะแนนในอนาคต บริษัทได้ดำเนินการระบบตรวจจับอัตโนมัติและมาตรการป้องกันภายในที่ออกแบบมาโดยเฉพาะเพื่อจับการปนเปื้อนของการให้คะแนน CoT ก่อนที่จะส่งผลกระทบต่อการฝึกอบรมในระดับใหญ่

สิ่งนี้หมายความว่าอย่างไรสำหรับคริปโตและโทเค็น AI

ไม่มีปฏิกิริยาจากตลาดในทันทีต่อสินทรัพย์คริปโตที่เกี่ยวข้องกับ AI หลังจากประกาศดังกล่าว โมเดล AI กำลังถูกผสานรวมเข้ากับแอปพลิเคชันบล็อกเชนอย่างแพร่หลาย รวมถึงการตรวจสอบสัญญาอัจฉริยะ ตัวแทน AI แบบกระจายศูนย์ และระบบการซื้อขายอัตโนมัติ ซึ่งทั้งหมดนี้พึ่งพา AI ที่สามารถให้เหตุผลอย่างถูกต้องและโปร่งใส

ข้อเท็จจริงที่ว่าความสามารถในการตรวจสอบยังคงอยู่นั้นเป็นประเด็นสำคัญสำหรับผู้ที่กำลังพัฒนาหรือลงทุนในโครงการคริปโตที่รวมปัญญาประดิษฐ์ไว้ ซึ่งหมายความว่าโครงสร้างพื้นฐานด้านความปลอดภัยรอบโมเดลการให้เหตุผลกำลังจับปัญหาได้ก่อนที่จะกลายเป็นปัญหาเชิงระบบ

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา