Anthropic เปิดตัวโครงการ Project Glasswing มูลค่า 100 ล้านดอลลาร์สหรัฐร่วมกับบริษัทเทคโนโลยี 12 แห่ง เพื่อแก้ไขช่องโหว่ซอฟต์แวร์ทั่วโลก

ผู้เขียน: Anthropic

DeepChain TechFlow

คำแนะนำจาก Shenchao: Anthropic เปิดตัวโมเดลล้ำสมัยที่ยังไม่เปิดเผยชื่อ Claude Mythos Preview ซึ่งมีความสามารถในการตรวจสอบรหัสเหนือกว่าผู้เชี่ยวชาญด้านความปลอดภัยส่วนใหญ่ของมนุษย์ และสามารถค้นพบช่องโหว่ศูนย์วันที่มีอยู่มานานหลายทศวรรษได้ด้วยตนเอง

ด้วยความสามารถนี้ Anthropic ร่วมกับ AWS, Apple, Google, Microsoft, NVIDIA และอีก 12 บริษัทเทคโนโลยีชั้นนำ เปิดตัวโครงการ Project Glasswing โดยจัดสรรเครดิตมูลค่า 100 ล้านดอลลาร์สหรัฐ เพื่อเป้าหมายในการปิดช่องโหว่ของซอฟต์แวร์สำคัญทั่วโลก ก่อนที่ผู้โจมตีจะสามารถเข้าถึงความสามารถเทียบเท่ากัน

บทนำ

วันนี้เราประกาศ Project Glasswing (โครงการกระจกปีก) ซึ่งเป็นความริเริ่มใหม่ที่รวมเอา Amazon Web Services (AWS)、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA และ Palo Alto Networks มาร่วมกัน เพื่อปกป้องความปลอดภัยของซอฟต์แวร์ที่สำคัญที่สุดของโลก

เราเริ่มต้นโครงการ Project Glasswing เพราะโมเดลขั้นสูงใหม่ที่ Anthropic ฝึกฝนแสดงความสามารถที่เราเชื่อว่าอาจเปลี่ยนแปลงภูมิทัศน์ด้านความปลอดภัยทางไซเบอร์ได้ Claude Mythos Preview เป็นโมเดลขั้นสูงแบบทั่วไปที่ยังไม่ได้เปิดตัว ซึ่งเปิดเผยความจริงที่โหดร้ายว่า ความสามารถในการเขียนโค้ดของโมเดล AI ได้ถึงระดับที่สามารถเกินกว่าผู้เชี่ยวชาญทุกคน เว้นแต่ผู้เชี่ยวชาญชั้นยอดเท่านั้น ในด้านการค้นพบและใช้ประโยชน์จากช่องโหว่ของซอฟต์แวร์

Mythos Preview ได้ค้นพบช่องโหว่ระดับสูงนับพันแห่ง ครอบคลุมระบบปฏิบัติการหลักทุกระบบและเบราว์เซอร์หลักทุกตัว ตามความก้าวหน้าของ AI ความสามารถนี้จะแพร่กระจายในอนาคตอันใกล้นี้ และอาจตกไปอยู่ในมือของผู้ใช้งานที่ไม่รับผิดชอบ ผลกระทบต่อเศรษฐกิจ ความปลอดภัยของสาธารณะ และความมั่นคงแห่งชาติอาจรุนแรงมาก Project Glasswing เป็นความพยายามเร่งด่วนเพื่อให้ความสามารถเหล่านี้ถูกใช้เพื่อการป้องกันเป็นอันดับแรก

ในฐานะส่วนหนึ่งของ Project Glasswing หุ้นส่วนข้างต้นจะใช้ Mythos Preview ในการทำงานด้านความปลอดภัยเชิงรับ; Anthropic จะแบ่งปันบทเรียนที่ได้รับเพื่อให้อุตสาหกรรมโดยรวมได้รับประโยชน์ เราได้เปิดการเข้าถึงสำหรับองค์กรอีกกว่า 40 แห่งที่สร้างหรือดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ ให้สามารถสแกนและเสริมความมั่นคงให้กับระบบของตนเองและระบบโอเพ่นซอร์ส Anthropic ได้ให้คำมั่นว่าจะจัดสรรเครดิตการใช้งาน Mythos Preview สูงสุด 100 ล้านดอลลาร์สหรัฐ และบริจาคโดยตรง 4 ล้านดอลลาร์สหรัฐให้กับองค์กรด้านความปลอดภัยโอเพ่นซอร์ส

Project Glasswing แค่เป็นจุดเริ่มต้น ไม่มีองค์กรใดสามารถแก้ไขปัญหาความปลอดภัยทางไซเบอร์ได้เพียงลำพัง: นักพัฒนา AI ระดับแนวหน้า บริษัทซอฟต์แวร์อื่นๆ นักวิจัยด้านความปลอดภัย ผู้ดูแลระบบโอเพ่นซอร์ส และรัฐบาลทั่วโลกต่างมีบทบาทที่ไม่สามารถแทนที่ได้ การป้องกันโครงสร้างพื้นฐานเครือข่ายระดับโลกอาจใช้เวลาหลายปี; ในขณะที่ความสามารถของ AI ระดับแนวหน้าอาจก้าวกระโดดอย่างมากภายในไม่กี่เดือนข้างหน้า ผู้ป้องกันไซเบอร์ต้องดำเนินการทันทีเพื่อให้ได้เปรียบ

ความปลอดภัยทางไซเบอร์ในยุคปัญญาประดิษฐ์

ซอฟต์แวร์ที่เราพึ่งพาทุกวัน—ที่ใช้รันระบบธนาคาร จัดเก็บบันทึกทางการแพทย์ เชื่อมต่อเครือข่ายโลจิสติกส์ และรักษาการดำเนินงานของเครือข่ายไฟฟ้า—ล้วนมีบั๊กอยู่เสมอ บั๊กส่วนใหญ่ไม่สำคัญ แต่บางตัวเป็นช่องโหว่ด้านความปลอดภัยที่ร้ายแรง ซึ่งหากถูกค้นพบ ผู้โจมตีสามารถยึดครองระบบ หยุดการดำเนินงาน หรือขโมยข้อมูล

การโจมตีทางไซเบอร์ได้แสดงให้เห็นถึงผลลัพธ์ที่ทำลายล้างต่อ เครือข่ายองค์กร、ระบบการแพทย์、โครงสร้างพื้นฐานด้านพลังงาน、ศูนย์กลางการขนส่ง และหน่วยงานของรัฐบาลต่างๆ ของประเทศต่างๆ ในระดับโลก การโจมตีระดับชาติจากจีน อิหร่าน เกาหลีเหนือ และรัสเซีย ได้คุกคามโครงสร้างพื้นฐานที่สนับสนุนชีวิตของประชาชนและการเตรียมความพร้อมทางทหาร แม้แต่การโจมตีขนาดเล็กที่มุ่งเป้าไปที่ โรงพยาบาล หรือ โรงเรียน เพียงแห่งเดียว ก็สามารถก่อให้เกิดความสูญเสียทางเศรษฐกิจอย่างมาก เปิดเผยข้อมูลที่ละเอียดอ่อน หรือแม้แต่คุกคามชีวิตผู้คน ความสูญเสียทางเศรษฐกิจประจำปีจากอาชญากรรมไซเบอร์ทั่วโลกนั้นยากที่จะคำนวณได้อย่างแม่นยำ แต่อาจ อยู่ที่ประมาณ 5 แสนล้านดอลลาร์สหรัฐ

ในอดีต ข้อบกพร่องของซอฟต์แวร์จำนวนมากไม่ถูกค้นพบเป็นเวลาหลายปี เนื่องจากต้องใช้ความรู้เฉพาะทางที่มีเพียงผู้เชี่ยวชาญด้านความปลอดภัยจำนวนน้อยเท่านั้นที่จะมี แต่ด้วยการปรากฏตัวของโมเดล AI ล่าสุด ต้นทุน พลังงาน และอุปสรรคทางความเชี่ยวชาญในการค้นหาและใช้ประโยชน์จากช่องโหว่ของซอฟต์แวร์ได้ลดลงอย่างมาก ในปีที่ผ่านมา โมเดล AI ได้แสดงความสามารถในการอ่านและให้เหตุผลเกี่ยวกับโค้ดที่แข็งแกร่งขึ้น โดยเฉพาะอย่างยิ่งในการค้นพบ ช่องโหว่ และการสร้าง วิธีการใช้ประโยชน์ ซึ่งแสดงผลลัพธ์ที่น่าทึ่ง Claude Mythos Preview ได้ก้าวกระโดดอย่างมากในทักษะด้านความปลอดภัยทางไซเบอร์เหล่านี้ — มันค้นพบช่องโหว่บางอย่างที่ยังคงอยู่แม้จะผ่านการตรวจสอบโดยมนุษย์เป็นเวลาหลายทศวรรษและผ่านการทดสอบความปลอดภัยอัตโนมัติหลายล้านครั้ง และรหัสการใช้ประโยชน์ที่มันพัฒนาขึ้นก็ยิ่งมีความซับซ้อนมากขึ้น

หลังจากผ่านไปสิบปีนับตั้งแต่การแข่งขันเครือข่าย DARPA ครั้งแรก DARPA Cyber Grand Challenge โมเดล AI ชั้นนำกำลังเข้าใกล้หรือเทียบเท่าความสามารถของมนุษย์ที่ดีที่สุดในการค้นหาและใช้ช่องโหว่ หากไม่มี มาตรการรักษาความปลอดภัยที่จำเป็น ความสามารถทางไซเบอร์ที่ทรงพลังเหล่านี้อาจถูกใช้เพื่อโจมตีช่องโหว่จำนวนมากที่มีอยู่ในซอฟต์แวร์ที่สำคัญที่สุดของโลก การโจมตีทางไซเบอร์จะเกิดขึ้นบ่อยขึ้น มีความรุนแรงมากขึ้น และเสริมพลังให้กับคู่แข่งของสหรัฐอเมริกาและพันธมิตรของพวกเขา นี่คือลำดับความสำคัญด้านความปลอดภัยที่ประเทศประชาธิปไตยต้องให้ความสำคัญ

ข่าวดีคือ ความสามารถที่ทำให้โมเดล AI เป็นอันตรายเมื่ออยู่ในมือที่ผิด กลับทำให้มันมีคุณค่าอย่างยิ่งในการค้นหาและแก้ไขข้อบกพร่องที่สำคัญของซอฟต์แวร์ — รวมถึงช่วยผลิตซอฟต์แวร์ใหม่ที่มีบั๊กปลอดภัยน้อยลง Project Glasswing เป็นก้าวสำคัญในการช่วยให้ผู้ป้องกันสร้างข้อได้เปรียบอย่างยั่งยืนในยุคความปลอดภัยทางไซเบอร์ที่ขับเคลื่อนด้วย AI

ความสามารถในการค้นพบช่องโหว่และวิธีการใช้ประโยชน์จากมัน

ในช่วงหลายสัปดาห์ที่ผ่านมา เราได้ค้นพบช่องโหว่ศูนย์วันนับพันแห่งในระบบปฏิบัติการหลักทุกระบบ ทุกเบราว์เซอร์หลัก และซอฟต์แวร์สำคัญอื่นๆ หลายตัว โดยใช้ Claude Mythos Preview ช่องโหว่เหล่านี้หลายแห่งอยู่ในระดับความเสี่ยงสูง ซึ่งเป็นข้อบกพร่องที่นักพัฒนาซอฟต์แวร์ไม่เคยรู้มาก่อน

บน บล็อก Frontier Red Team เราเปิดเผยรายละเอียดทางเทคนิคของช่องโหว่บางส่วนที่ได้รับการแก้ไข รวมถึงวิธีการใช้ประโยชน์ที่ Mythos Preview ค้นพบ การค้นพบช่องโหว่เหล่านี้เกือบทั้งหมด (และการพัฒนาวิธีการใช้ประโยชน์ที่เกี่ยวข้องหลายวิธี) ถูกดำเนินการโดยโมเดลอย่างสมบูรณ์โดยไม่มีการชี้นำจากมนุษย์ ตัวอย่างดังต่อไปนี้:

Mythos Preview ค้นพบช่องโหว่ที่มีอยู่มานาน 27 ปีใน OpenBSD OpenBSD มีชื่อเสียงในด้านความปลอดภัยที่เข้มงวดสูงสุด และได้รับการใช้งานอย่างกว้างขวางในไฟร์วอลล์และโครงสร้างพื้นฐานสำคัญอื่นๆ ช่องโหว่นี้อนุญาตให้ผู้โจมตีสามารถทำให้เครื่องเป้าหมายล่มจากระยะไกลได้เพียงแค่เชื่อมต่อกับเครื่องนั้น
มันยังพบช่องโหว่ที่มีอายุ 16 ปีใน FFmpeg ซึ่งถูกใช้งานโดยซอฟต์แวร์นับไม่ถ้วนในการถอดรหัสวิดีโอ ปัญหาอยู่ที่บรรทัดรหัสหนึ่งบรรทัด โดยเครื่องมือทดสอบอัตโนมัติได้ตรวจจับบรรทัดนี้มาแล้ว 5 ล้านครั้ง แต่ไม่เคยพบปัญหานี้มาก่อน
โมเดลนี้ค้นพบและเชื่อมโยงช่องโหว่หลายช่องใน Linux kernel (ซึ่งเป็นระบบปฏิบัติการที่ใช้บนเซิร์ฟเวอร์ส่วนใหญ่ทั่วโลก) เพื่อทำการโจมตีแบบเพิ่มสิทธิ์จากสิทธิ์ผู้ใช้ทั่วไปไปสู่การควบคุมเครื่องอย่างสมบูรณ์

เราได้รายงานช่องโหว่ทั้งหมดข้างต้นให้กับผู้ดูแลซอฟต์แวร์ที่เกี่ยวข้องแล้ว และช่องโหว่เหล่านั้นได้รับการแก้ไขเรียบร้อยแล้ว สำหรับช่องโหว่อื่นๆ อีกหลายรายการ เราได้ให้รายละเอียดของแฮชการเข้ารหัสวันนี้ (ดูที่บล็อกของ Red Team) และจะเปิดเผยข้อมูลเฉพาะเจาะจงหลังจากแก้ไขเสร็จสิ้น

มาตรฐานการประเมินเช่น CyberGym ก็ยืนยันช่องว่างที่ชัดเจนระหว่าง Mythos Preview กับโมเดลที่แข็งแกร่งเป็นอันดับสองของเรา Claude Opus 4.6:

การจำลองช่องโหว่ด้านความปลอดภัยทางไซเบอร์ - CyberGym

รูปภาพ

นอกจากงานของเรายังมีพันธมิตรหลายรายที่ได้ใช้ Claude Mythos Preview มาเป็นเวลาหลายสัปดาห์ นี่คือข้อเสนอแนะจากพวกเขา:

ความสามารถด้าน AI ได้ข้ามขีดจำกัดหนึ่งไปแล้ว ซึ่งเปลี่ยนแปลงความเร่งด่วนในการป้องกันโครงสร้างพื้นฐานที่สำคัญจากภัยคุกคามทางไซเบอร์อย่างพื้นฐานและไม่สามารถย้อนกลับได้ เราได้แสดงด้วยงานพื้นฐานของโมเดลเหล่านี้ว่า สามารถระบุและแก้ไขช่องโหว่ด้านความปลอดภัยในฮาร์ดแวร์และซอฟต์แวร์ได้ด้วยความเร็วและขนาดที่ไม่เคยมีมาก่อน นี่คือการเปลี่ยนแปลงอันลึกซึ้งและสัญญาณที่ชัดเจนว่า วิธีการเสริมความมั่นคงของระบบเดิมนั้นไม่เพียงพออีกต่อไป ผู้ให้บริการเทคโนโลยีต้องรีบนำวิธีการใหม่ๆ มาใช้อย่างกระตือรือร้น และลูกค้าก็ต้องเตรียมพร้อมสำหรับการนำไปใช้งาน นี่คือเหตุผลที่ Cisco เข้าร่วม Project Glasswing — งานนี้สำคัญและเร่งด่วนเกินกว่าจะทำคนเดียว

—— แอนโทนี กรีเชโอ รองประธานอาวุโสและหัวหน้าเจ้าหน้าที่ด้านความปลอดภัยและความเชื่อถือของซิสโก

ที่ AWS เราสร้างการป้องกันก่อนที่ภัยคุกคามจะเกิดขึ้น ตั้งแต่ชิปที่ออกแบบเฉพาะไปจนถึงทั้งสแต็กเทคโนโลยี ความปลอดภัยไม่ใช่เพียงขั้นตอนหนึ่ง แต่เป็นกระบวนการต่อเนื่องที่ฝังอยู่ในทุกสิ่งที่เราทำ ทีมของเราวิเคราะห์ปริมาณการจราจรบนเครือข่ายมากกว่า 400 ล้านล้านครั้งต่อวันเพื่อตรวจจับภัยคุกคาม และ AI เป็นหัวใจสำคัญของความสามารถในการป้องกันในระดับใหญ่ เราได้ทดสอบ Claude Mythos Preview ภายในระบบความปลอดภัยของเราเอง โดยนำไปใช้กับโค้ดฐานหลัก ซึ่งมันได้ช่วยเสริมความมั่นคงของโค้ดให้เราแล้ว เรากำลังนำความเชี่ยวชาญด้านความปลอดภัยอันลึกซึ้งมาใช้ในการร่วมมือกับ Anthropic เพื่อช่วยเสริมความแข็งแกร่งให้กับ Claude Mythos Preview ทำให้องค์กรอื่นๆ สามารถดำเนินงานได้ด้วยมาตรฐานความปลอดภัยสูงสุด

—— เอมี่ เฮอร์ซอก รองประธานและผู้อำนวยการด้านความปลอดภัยทางข้อมูลของ Amazon Web Services

เมื่อความปลอดภัยทางไซเบอร์ไม่ถูกจำกัดด้วยความสามารถของมนุษย์เพียงอย่างเดียว โอกาสในการใช้ AI อย่างรับผิดชอบเพื่อเพิ่มความปลอดภัยและลดความเสี่ยงในระดับใหญ่เป็นครั้งแรกในประวัติศาสตร์ ร่วมกับ Project Glasswing และรับสิทธิ์เข้าถึง Claude Mythos Preview เพื่อให้เราสามารถระบุและบรรเทาความเสี่ยงได้ตั้งแต่เนิ่นๆ ปรับปรุงโซลูชันด้านความปลอดภัยและการพัฒนาของเรา จึงสามารถปกป้องลูกค้าและไมโครซอฟต์ได้ดียิ่งขึ้น เมื่อทดสอบบนมาตรฐานความปลอดภัยแบบเปิดแหล่งที่มาของเรา CTI-REALM Claude Mythos Preview แสดงผลลัพธ์ที่ดีขึ้นอย่างมีนัยสำคัญเมื่อเทียบกับรุ่นก่อนหน้า เราหวังที่จะร่วมมือกับ Anthropic และอุตสาหกรรมโดยรวมเพื่อปรับปรุงผลลัพธ์ด้านความปลอดภัยสำหรับทุกคน

—— อิโกร์ ซีกันสกี้ รองประธานฝ่ายความปลอดภัยทางไซเบอร์และงานวิจัยของไมโครซอฟท์

ช่องโหว่จากเวลาที่ถูกค้นพบจนถึงเวลาที่ผู้โจมตีใช้ประโยชน์ได้นั้นได้ลดลงแล้ว—สิ่งที่เคยใช้เวลาหลายเดือนในอดีต ตอนนี้ AI สามารถทำได้ในไม่กี่นาที Claude Mythos Preview แสดงให้เห็นถึงความเป็นไปได้ในการดำเนินการแบบใหญ่ของผู้ป้องกัน ขณะที่คู่ต่อสู้จะไม่สามารถหลีกเลี่ยงได้ที่จะพยายามใช้ความสามารถเดียวกันนี้ นี่ไม่ใช่เหตุผลที่จะชะลอตัว แต่เป็นเหตุผลที่ต้องเร่งเดินหน้าไปด้วยกัน การใช้งาน AI ต้องมีความปลอดภัยที่แน่นอน นี่คือเหตุผลที่ CrowdStrike เข้าร่วมตั้งแต่วันแรก

—— เอลียา ไซต์เซฟ หัวหน้าเจ้าหน้าที่เทคโนโลยีของ CrowdStrike

ในอดีต ความเชี่ยวชาญด้านความปลอดภัยเป็นสิ่งฟุ่มเฟือยที่องค์กรที่มีทีมความปลอดภัยขนาดใหญ่เท่านั้นจึงจะเข้าถึงได้ ผู้ดูแลซอฟต์แวร์โอเพ่นซอร์ส—ซึ่งซอฟต์แวร์ของพวกเขาเป็นรากฐานของโครงสร้างพื้นฐานสำคัญส่วนใหญ่ทั่วโลก—มักต้องจัดการกับปัญหาความปลอดภัยด้วยตัวเองมาโดยตลอด ซอฟต์แวร์โอเพ่นซอร์สประกอบเป็นโค้ดส่วนใหญ่ในระบบสมัยใหม่ รวมถึงระบบที่ตัวแทน AI ใช้ในการเขียนซอฟต์แวร์ใหม่ ผ่านการให้ผู้ดูแลคลังซอฟต์แวร์โอเพ่นซอร์สที่สำคัญเหล่านี้เข้าถึงรุ่น AI ใหม่ที่สามารถระบุและแก้ไขช่องโหว่ได้อย่างแข็งขันในระดับใหญ่ Project Glasswing จึงเสนอทางออกที่เป็นรูปธรรมเพื่อเปลี่ยนแปลงสถานการณ์นี้ นี่คือวิธีที่ความปลอดภัยที่เสริมด้วย AI เปลี่ยนจากเครื่องมือเฉพาะของทีมขนาดใหญ่ให้กลายเป็นผู้ช่วยที่เชื่อถือได้สำหรับผู้ดูแลทุกคน

—— Jim Zemlin, CEO ของ Linux Foundation

การส่งเสริมความปลอดภัยทางไซเบอร์และความยืดหยุ่นของระบบการเงินเป็นหัวใจสำคัญของภารกิจของจีพีจี พวกเราเชื่อว่าอุตสาหกรรมจะแข็งแกร่งที่สุดเมื่อองค์กรชั้นนำร่วมมือกันเพื่อแก้ไขความท้าทายร่วมกัน Project Glasswing ให้โอกาสอันเป็นเอกลักษณ์ในระยะเริ่มต้นที่จะช่วยให้เราสามารถประเมินความสามารถของเครื่องมือ AI รุ่นถัดไปในการป้องกันโครงสร้างพื้นฐานสำคัญตามมาตรฐานของตนเอง พร้อมทั้งร่วมงานกับผู้นำด้านเทคโนโลยีที่ได้รับการยกย่อง เราจะดำเนินการด้วยวิธีการที่เข้มงวดและเป็นอิสระเพื่อกำหนดวิธีการขับเคลื่อนและวิธีการให้ความช่วยเหลือ ความริเริ่มของ Anthropic สะท้อนถึงแนวทางที่มีวิสัยทัศน์และเน้นการร่วมมือซึ่งจำเป็นในช่วงเวลาเช่นนี้

— แพต โอเป็ต หัวหน้าเจ้าหน้าที่รักษาความปลอดภัยทางสารสนเทศของโจนส์ แอนด์ โจนส์

谷歌很高兴看到这一跨行业网络安全倡议的形成，并通过 Vertex AI 向参与者提供 Mythos Preview。行业在新兴安全问题上的协作一直至关重要，无论是后量子密码学、负责任的零日漏洞披露、开源软件安全，还是防御基于 AI 的攻击。我们一直相信 AI 在网络防御中既带来新挑战也带来新机遇，这就是我们构建 Big Sleep 和 CodeMender 等 AI �驱动工具来发现和修复关键软件缺陷的原因。我们将继续投资于领先的网络安全平台和以保护用户、客户、生态系统及国家安全为核心的文化。

—— เฮเธอร์ อดกินส์ รองประธานฝ่ายวิศวกรรมความปลอดภัยของกูเกิล

ในช่วงหลายสัปดาห์ที่ผ่านมา เราได้ใช้โมเดล Claude Mythos Preview เพื่อระบุช่องโหว่ที่ซับซ้อนซึ่งโมเดลรุ่นก่อนหน้าพลาดไปอย่างสมบูรณ์ ไม่เพียงแต่เปลี่ยนกฎของเกมในการค้นพบช่องโหว่ที่ซ่อนอยู่ แต่ยังหมายความว่าผู้โจมตีจะสามารถค้นพบและใช้ประโยชน์จากช่องโหว่ศูนย์วันได้เร็วกว่าที่เคยเป็นมาอย่างมาก ชัดเจนว่าโมเดลเหล่านี้ควรอยู่ในมือของเจ้าของโครงการโอเพ่นซอร์สและผู้ป้องกันทุกคน เพื่อค้นหาและแก้ไขช่องโหว่ก่อนที่ผู้โจมตีจะได้รับสิทธิ์เข้าถึง อาจสำคัญยิ่งกว่านั้นคือ: ทุกคนต้องเตรียมตัวสำหรับผู้โจมตีที่ได้รับการช่วยเหลือจาก AI การโจมตีจะมีมากขึ้น เร็วขึ้น และซับซ้อนขึ้น นี่คือเวลาที่ต้องปรับปรุงระบบความปลอดภัยทางไซเบอร์อย่างครอบคลุม เราชื่นชม Anthropic ที่ร่วมมือกับอุตสาหกรรมเพื่อให้แน่ใจว่าความสามารถอันทรงพลังเหล่านี้จะถูกใช้เพื่อการป้องกันเป็นอันดับแรก

—— ลี คลาริช หัวหน้าผลิตภัณฑ์และเทคโนโลยีของ Palo Alto Networks

Claude Mythos Preview มีความสามารถด้านความปลอดภัยทางไซเบอร์ที่แข็งแกร่ง เนื่องจากความสามารถในการเขียนโค้ดและเหตุผลของตัวแทนที่ยอดเยี่ยม ผลการประเมินด้านล่างแสดงให้เห็นว่าโมเดลนี้ได้คะแนนสูงสุดในงานเขียนซอฟต์แวร์หลายรายการเมื่อเทียบกับโมเดลทั้งหมดที่รู้จัก

Agent Encoding

รูปภาพ

Reasoning

รูปภาพ

การค้นหาตัวแทนอัจฉริยะและการใช้งานคอมพิวเตอร์

รูปภาพ

คำอธิบาย:

SWE-bench ได้รับการยืนยัน โปร และหลายภาษา: การตรวจสอบด้วยการจดจำได้ทำเครื่องหมายบางข้อคำถามไว้ หลังจากตัดข้อคำถามที่อาจมีการจดจำออกแล้ว ข้อได้เปรียบของ Mythos Preview เมื่อเทียบกับ Opus 4.6 ยังคงไม่เปลี่ยนแปลง
SWE-bench Multimodal: ใช้การดำเนินการภายใน คะแนนไม่สามารถเปรียบเทียบโดยตรงกับตารางคะแนนสาธารณะ
Terminal-Bench 2.0: ใช้กรอบงาน Terminus-2 ด้วยโหมดการคิดแบบปรับตัวได้สูงสุด งบรวมต่อภารกิจ 1 ล้านโทเค็น ทรัพยากรแบบรับประกัน 1 เท่า / สูงสุด 3 เท่า และเฉลี่ยจาก 5 ครั้งต่อภารกิจ หลังจากเพิ่มขีดจำกัดเวลาเป็น 4 ชั่วโมงและอัปเดตเป็น Terminal-Bench 2.1 คะแนน Mythos Preview อยู่ที่ 92.1%
BrowseComp: Claude Mythos Preview ได้คะแนนสูงกว่า Opus 4.6 โดยใช้ token เพียง 1/4.9 ของจำนวนที่后者ใช้
การสอบครั้งสุดท้ายของมนุษยชาติ: Mythos ยังคงแสดงผลดีในโหมดความพยายามต่ำ อาจมีการจดจำแบบจำลองบางส่วน

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความสามารถของโมเดล คุณสมบัติด้านความปลอดภัย และคุณลักษณะพื้นฐาน โปรดดูที่ Claude Mythos Preview System Card

เรายังไม่มีแผนเปิดให้สาธารณชนใช้งาน Claude Mythos Preview แต่เป้าหมายสุดท้ายคือการให้ผู้ใช้สามารถปรับใช้โมเดลระดับ Mythos ได้อย่างปลอดภัยในปริมาณมาก—not only สำหรับความปลอดภัยทางไซเบอร์ แต่ยังรวมถึงคุณค่าอื่นๆ อีกมากมายที่โมเดลระดับสูงเช่นนี้จะนำมา สำหรับการนี้ เราจำเป็นต้องก้าวหน้าในการพัฒนามาตรการป้องกันความปลอดภัยทางไซเบอร์ (และด้านอื่นๆ) ที่สามารถตรวจจับและป้องกันผลลัพธ์ที่อันตรายที่สุดของโมเดล เราวางแผนจะเปิดตัวมาตรการป้องกันความปลอดภัยใหม่ในโมเดล Claude Opus ที่จะออกในเร็วๆ นี้ เพื่อให้เราสามารถปรับปรุงและพัฒนามาตรการเหล่านี้ด้วยโมเดลที่ไม่มีระดับความเสี่ยงเท่ากับ Mythos Preview

ขั้นตอนถัดไปของ Project Glasswing

การเปิดตัววันนี้เป็นจุดเริ่มต้นของความพยายามระยะยาว การประสบความสำเร็จต้องการการมีส่วนร่วมอย่างกว้างขวางจากทั้งภายในและภายนอกอุตสาหกรรมเทคโนโลยี

พันธมิตรของ Project Glasswing จะได้รับสิทธิ์เข้าถึง Claude Mythos Preview เพื่อค้นหาและแก้ไขช่องโหว่และจุดอ่อนในระบบพื้นฐานของพวกเขา—ระบบที่ครอบคลุมส่วนใหญ่ของพื้นที่การโจมตีที่แชร์ทั่วโลก งานหลักที่คาดว่าจะเน้นได้แก่ การตรวจจับช่องโหว่ในท้องถิ่น การทดสอบแบบแบล็กบ็อกแบบไบนารี การเสริมความปลอดภัยของจุดปลาย และการทดสอบการเจาะระบบ

จำนวนการใช้งานโมเดล 100 ล้านดอลลาร์สหรัฐที่ Anthropic ให้คำมั่นสำหรับ Project Glasswing และผู้เข้าร่วมรายอื่นๆ จะครอบคลุมการใช้งานจำนวนมากในช่วงการทดลองเชิงวิจัย หลังจากนั้น Claude Mythos Preview จะจัดจำหน่ายให้ผู้เข้าร่วมในอัตรา 25 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นการป้อนข้อมูล / 125 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นการส่งออก (ผู้เข้าร่วมสามารถเข้าถึงโมเดลนี้ผ่าน Claude API, Amazon Bedrock, Google Cloud Vertex AI และ Microsoft Foundry)

นอกจากการใช้เครดิตโมเดลแล้ว เรายังบริจาค 2.5 ล้านดอลลาร์สหรัฐให้กับ Linux Foundation เพื่อสนับสนุน Alpha-Omega และ OpenSSF และบริจาค 1.5 ล้านดอลลาร์สหรัฐให้กับ Apache Software Foundation เพื่อช่วยผู้ดูแลซอฟต์แวร์โอเพ่นซอร์สรับมือกับสภาพแวดล้อมที่เปลี่ยนแปลงไป (ผู้ดูแลที่สนใจสามารถสมัครเข้าถึงผ่านโปรแกรม Claude for Open Source)

เราวางแผนที่จะขยายขอบเขตของงานนี้อย่างต่อเนื่องเป็นเวลาหลายเดือน และแบ่งปันประสบการณ์ให้มากที่สุดเท่าที่จะเป็นไปได้ เพื่อให้องค์กรอื่นๆ สามารถนำประสบการณ์เหล่านี้ไปประยุกต์ใช้กับความปลอดภัยของตนเอง พันธมิตรจะแลกเปลี่ยนข้อมูลและแนวทางปฏิบัติที่ดีที่สุดตามเงื่อนไขที่เหมาะสม; ภายใน 90 วัน Anthropic จะรายงานผลการค้นพบของเราอย่างเปิดเผย รวมถึงช่องโหว่ที่ได้รับการแก้ไขและมาตรการปรับปรุงที่สามารถเปิดเผยได้ เราจะร่วมมือกับองค์กรด้านความปลอดภัยชั้นนำเพื่อกำหนดคำแนะนำเชิงปฏิบัติเกี่ยวกับการพัฒนาแนวทางความปลอดภัยในยุคปัญญาประดิษฐ์ ซึ่งอาจครอบคลุม: กระบวนการเปิดเผยช่องโหว่ กระบวนการอัปเดตซอฟต์แวร์ ความปลอดภัยของโอเพ่นซอร์สและซัพพลายเชน วงจรชีวิตการพัฒนาซอฟต์แวร์และแนวทางการออกแบบความปลอดภัย มาตรฐานอุตสาหกรรมที่ได้รับการควบคุม การขยายและการทำให้เป็นอัตโนมัติของการคัดกรอง และการอัปเดตแพตช์อัตโนมัติ

Anthropic ยังคงหารือกับเจ้าหน้าที่รัฐบาลสหรัฐเกี่ยวกับความสามารถด้านความมั่นคงปลอดภัยทางไซเบอร์ของ Claude Mythos Preview การปกป้องโครงสร้างพื้นฐานที่สำคัญเป็นลำดับความสำคัญด้านความมั่นคงแห่งชาติอันดับแรกของประเทศประชาธิปไตย — การปรากฏตัวของความสามารถด้านความมั่นคงปลอดภัยทางไซเบอร์เหล่านี้ย้ำอีกครั้งว่าสหรัฐอเมริกาและพันธมิตรต้องรักษาความได้เปรียบอย่างเด็ดขาดในเทคโนโลยี AI รัฐบาลมีบทบาทที่ไม่สามารถแทนที่ได้ในการช่วยรักษาความได้เปรียบนี้ การประเมิน และการลดความเสี่ยงด้านความมั่นคงแห่งชาติที่เกี่ยวข้องกับโมเดล AI เราพร้อมร่วมมือกับตัวแทนรัฐบาลในทุกระดับเพื่อช่วยดำเนินการเหล่านี้

เราหวังว่า Project Glasswing จะเป็นแรงผลักดันให้เกิดความพยายามในระดับที่ใหญ่กว่า ซึ่งครอบคลุมทั้งภาคอุตสาหกรรมและภาครัฐ โดยทุกฝ่ายร่วมมือกันในการจัดการกับปัญหาที่ใหญ่ที่สุดเกี่ยวกับผลกระทบด้านความปลอดภัยของแบบจำลองที่มีพลังสูง เราเชิญสมาชิกในอุตสาหกรรม AI อื่นๆ เข้าร่วมเพื่อช่วยกำหนดมาตรฐานอุตสาหกรรม ในระยะกลาง องค์กรอิสระของบุคคลที่สาม—ซึ่งสามารถรวบรวมองค์กรจากทั้งภาคเอกชนและภาครัฐ—อาจเป็นแพลตฟอร์มที่เหมาะสมที่สุดสำหรับการดำเนินงานโครงการด้านความปลอดภัยทางไซเบอร์ในระดับใหญ่ต่อไป

หมายเหตุ

โครงการนี้ตั้งชื่อตามผีเสื้อปีกแก้ว (Greta oto) คำเปรียบเทียบนี้มีสองนัย: ปีกที่โปร่งใสของผีเสื้อช่วยให้มันสามารถหายตัวไปได้ คล้ายกับช่องโหว่ที่ซ่อนอยู่ในโค้ดที่ถูกกล่าวถึงในบทความนี้; ปีกที่โปร่งใสยังช่วยให้มันหลีกเลี่ยงอันตราย คล้ายกับวิธีการที่เราส่งเสริมเรื่องความโปร่งใส
Mythos มาจากภาษากรีกโบราณ หมายถึง "การเล่าเรื่อง" หรือ "เรื่องราว": ระบบเรื่องราวที่อารยธรรมใช้เพื่อเข้าใจโลก
ผู้เชี่ยวชาญด้านความปลอดภัยที่ได้รับผลกระทบจากมาตรการป้องกันความปลอดภัยเหล่านี้สามารถสมัครโปรแกรมยืนยันไซเบอร์ความปลอดภัยที่จะเปิดตัวในเร็วๆ นี้