Anthropic เปิดตัวโมเดล Mythos AI ซึ่งจำกัดการใช้งานชั่วคราวสำหรับการตรวจสอบความปลอดภัยของโครงสร้างพื้นฐาน

Anthropic เปิดตัวโมเดล AI รหัสลับ Mythos ซึ่งมีความสามารถเหนือกว่าโมเดลชั้นนำปัจจุบัน Claude Opus 4.6 อย่างทั่วถึงในด้านการเขียนโค้ด การให้เหตุผล และการค้นหาช่องโหว่; เนื่องจากมีศักยภาพในการสร้างภัยคุกคามด้านความปลอดภัยอย่างก้าวกระโดด จึงยังไม่เปิดให้บริการอย่างเปิดเผย แต่ได้เริ่มโครงการ Project Glasswing ร่วมกับองค์กรเทคโนโลยีหลัก 12 แห่ง เช่น AWS, Apple, Microsoft และองค์กรโอเพนซอร์ส เช่น Linux Foundation เพื่อนำไปใช้ในการตรวจสอบและเสริมความปลอดภัยให้กับโครงสร้างพื้นฐานดิจิทัลที่สำคัญของโลกก่อน

ผู้เขียนบทความ: ตัง เริน

ที่มาของบทความ: Mars Finance

ฉันรู้สึกว่ามนุษย์อาจกำลังถูก AI ตามทันด้วยความเร็วที่เกินกว่าการรับรู้ปกติ

ไม่รู้ว่าสถานการณ์ของคุณเป็นอย่างไร แต่อย่างน้อยตอนนี้ฉันไม่สามารถขาด AI ได้แล้ว งานของฉันทุกวันมีอย่างน้อย 50% ที่ได้รับการช่วยเหลือจาก AI

นอกจากนี้ อัตราส่วนนี้ยังคงเพิ่มขึ้นอย่างต่อเนื่อง

ในขณะเดียวกัน ด้วยการเปิดตัวรุ่นใหม่ๆ อย่างต่อเนื่อง ทั้งประสิทธิภาพและคุณภาพในการทำงานของฉัน รวมถึงค่าใช้จ่ายรายเดือนของฉันบน Token ก็กำลังเติบโตอย่างรวดเร็ว

เมื่อคืนฉันได้อ่านข่าวว่า Anthropic เปิดตัวโมเดลที่แม้แต่ตัวเองก็ไม่กล้าเปิดให้ทุกคนใช้ เพราะมันแข็งแกร่งเกินไป

ชื่อของโมเดลใหม่นี้คือ 「Mythos」 ซึ่งแปลเป็นภาษาจีนหมายถึง 「ตำนาน」

ขณะนี้เป็นเวอร์ชันตัวอย่าง ดังนั้นทางทีมอย่างเป็นทางการจึงเรียกมันว่า "Mythos Preview" อย่างไรก็ตาม ครั้งนี้ถูกเปิดตัวในรูปแบบของโครงการที่ชื่อว่า "Project Glasswing"

เกี่ยวกับโครงการนี้ ผมจะพูดถึงในภายหลัง

Mythos

เดือนที่แล้ว เอกสารภายในของ Anthropic ถูกเปิดเผยโดยไม่ตั้งใจ ซึ่งระบุว่ามีการพัฒนาโมเดลที่ใหญ่และแข็งแกร่งกว่า Opus โดยมีรหัสชื่อว่า Mythos

ต่อมา Anthropic ได้ระบุว่าการรั่วไหลครั้งนี้เกิดจาก "ข้อผิดพลาดของมนุษย์" โดยไม่ได้ให้คำอธิบายเพิ่มเติม

ตอนนี้ โมเดลที่มีรหัสชื่อ Mythos ได้รับการประกาศอย่างเป็นทางการแล้ว

แม้จะมีการประกาศอย่างเป็นทางการ แต่มันยังไม่ได้เปิดตัวอย่างเป็นทางการ กล่าวคือ ผู้ใช้ทั่วไปยังไม่สามารถใช้งานได้

เหตุผลง่ายๆ ก็คือ Anthropic รู้สึกว่าโมเดลนี้แข็งแกร่งเกินไป และไม่เหมาะที่จะเปิดให้ทุกคนใช้งานก่อนที่กลไกความปลอดภัยจะพร้อม

ฉันคิดว่า ประโยคนี้คุ้มค่าที่จะหยุดคิดสักวินาที

โดยทั่วไป บริษัท AI แห่งหนึ่งเมื่อเปิดตัวโมเดลใหม่จะรีบวางจำหน่ายทันทีเพื่อแย่งชิงตลาด แต่ครั้งนี้วิธีการของ Anthropic ดูเหมือนจะผิดปกติอย่างชัดเจน

ในมุมมองของฉัน ไม่ใช่ว่าพวกเขาไม่อยากส่ง แต่พวกเขากลัวที่จะส่ง

เพราะว่าโมเดลที่ชื่อ Mythos นั้นแข็งแกร่งมาก

ดูข้อมูลการทดสอบที่ทางโครงการเปิดเผยก่อน

ในด้านความสามารถในการเขียนโค้ด ช่องว่างระหว่าง Mythos กับ Claude Opus 4.6 ซึ่งเป็นโมเดลที่แข็งแกร่งที่สุดที่เปิดเผยต่อสาธารณะในปัจจุบัน นั้นค่อนข้างใหญ่ โดย Mythos ชนะอย่างเด็ดขาดในแบบทดสอบมาตรฐานทุกประเภท

Mythos

ในด้านความสามารถในการให้เหตุผล การทดสอบ GPQA Diamond (คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา) ผลลัพธ์คือ 94.6% เทียบกับ 91.3% Mythos ชนะ

ในการทดสอบที่มีเครื่องมือและไม่มีเครื่องมือใน Humanity's Last Exam Mythos ก็ชนะทั้งสองกรณี

Mythos

ในด้านความสามารถในการดำเนินการคอมพิวเตอร์ที่เกี่ยวข้องกับ Agent OSWorld-Verified (ดำเนินงานคอมพิวเตอร์ด้วยตนเอง) Mythos ทำได้ 79.6% สูงกว่า Oputs 4.6 ที่อยู่ที่ 72.7%

ในทุกมิติ Mythos แข็งแกร่งกว่า Opus 4.6 บางด้านแม้แต่เหนือกว่าอย่างถล่มทลาย

Mythos

ในบางภารกิจ ช่องว่างไม่ได้เป็นเพียงการพัฒนาแบบค่อยเป็นค่อยไป แต่เป็นการก้าวกระโดดอย่างมาก ตัวอย่างเช่น SWE-bench Multimodal ที่พุ่งจาก 27.1% เป็น 59% แทบจะเพิ่มขึ้นเป็นสองเท่า

เหตุผลหลักที่ทำให้พวกเขาไม่กล้าขึ้นออนไลน์ Mythos คือความสามารถของมันในการเจาะผ่านกำแพงความปลอดภัยของโลกซอฟต์แวร์นั้นแข็งแกร่งเกินไป

พูดให้เข้าใจง่ายๆ ระบบและซอฟต์แวร์ทั้งหมดทั่วโลกต่างก็มีช่องโหว่ และ Mythos สามารถค้นหาและโจมตีช่องโหว่เหล่านี้ได้ในระดับที่เหนือกว่ามนุษย์

สมมติว่า ความสามารถนี้ถูกแฮกเกอร์ยึดครอง ระบบปฏิบัติการและซอฟต์แวร์ทั่วโลกจะได้รับผลกระทบ โดยเฉพาะอย่างยิ่งโครงสร้างพื้นฐานสาธารณะและความมั่นคงแห่งชาติ

Anthropic ได้ระบุไว้ในประกาศว่า “เมื่อคุณดูจบแล้ว ฉันรู้สึกว่าน่ากลัวอย่างยิ่ง”

Mythos

ความสามารถในการเข้ารหัสของโมเดล AI ได้ถึงระดับสูงมาก โดยในการค้นหาและใช้ประโยชน์จากช่องโหว่ของซอฟต์แวร์ พวกมันเกือบจะเหนือกว่าทุกคน เว้นแต่ผู้เชี่ยวชาญที่มีทักษะสูงที่สุด

เกี่ยวกับประโยคนี้ ฉันอยากขยายเพิ่มเติม

ฉันมีพื้นฐานเป็นโปรแกรมเมอร์ ดังนั้นฉันจึงรู้ว่าซอฟต์แวร์ถูกสร้างขึ้นอย่างไร และโค้ดที่คนต่างกันเขียนนั้นมีความแตกต่างกันมากเพียงใด

นอกจากนี้ ไม่มีซอฟต์แวร์ใดที่กล้าอ้างว่าไม่มีช่องโหว่ แม้ว่าช่องโหว่นั้นจะยังไม่เคยถูกค้นพบมาก่อน

ช่องโหว่ก่อนหน้านี้สามารถอยู่นิ่งในระบบเป็นเวลาหลายทศวรรษไม่ใช่เพราะระบบปลอดภัยเพียงพอ

แต่เนื่องจากงานการค้นหาช่องโหว่นั้นต้องการทักษะทางวิชาชีพที่สูงมาก ความอดทนและพลังงานอย่างยิ่ง รวมถึงเวลาอันมากมาย

มีคนที่เข้าใจน้อยเกินไป คนที่กล้าลงทุนจึงยิ่งน้อยกว่า

ความหายากของ “ความสามารถ” นี้ เป็นเงื่อนไขแฝงที่สร้างพื้นฐานทั้งหมดของโลกความปลอดภัยของซอฟต์แวร์ หลังจากที่ AI เข้ามาเกี่ยวข้อง เงื่อนไขนี้เริ่มคลายตัวลง

AI สามารถทำงานได้เหนือกว่ามนุษย์ส่วนใหญ่ที่ไม่ใช่顶尖 ซึ่งเราสามารถใช้มันในการโจมตีช่องโหว่ หรือจะใช้มันปิดช่องโหว่ก็ได้

เพื่อแก้ไขปัญหานี้ ต่อไปฉันจะอธิบายว่า Project Glasswing ที่ Anthropic สร้างขึ้นคืออะไร

พูดแบบง่ายๆ นี่คือโครงการที่ใช้ความสามารถของ Mythos ในการค้นหาบั๊กในระบบโครงสร้างพื้นฐานทั่วโลก

ผู้เข้าร่วมรวมถึง AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation และอีกทั้งหมด 12 องค์กร

Mythos

การจัดรวมนี้ครอบคลุมคลาวด์คอมพิวติ้ง ระบบปฏิบัติการ ชิป เบราว์เซอร์ โครงสร้างพื้นฐานทางการเงิน ความปลอดภัยทางไซเบอร์ และระบบนิเวศแบบโอเพ่นซอร์ส

พูดอีกแบบคือ ผู้เล่นหลักทั้งหมดของโครงสร้างพื้นฐานดิจิทัลทั่วโลกแทบทั้งหมดอยู่ในโครงการนี้แล้ว

ตรรกะหลักของโครงการนี้มีเพียงข้อเดียว คือให้ทีมป้องกันใช้ความสามารถของโมเดล AI ระดับสูงสุดนี้ก่อน

เพราะหากฝ่ายโจมตีได้รับเครื่องมือระดับเดียวกันก่อน ช่องว่างที่เปิดขึ้นจะยากที่จะปิดลง Anthropic ให้คำมั่นว่าจะจัดสรรเครดิตการใช้งานโมเดล 100 ล้านดอลลาร์สหรัฐ เพื่อครอบคลุมช่วงการทดลองเชิงวิจัย

นอกเหนือจาก 12 องค์กรหลัก ยังมีองค์กรมากกว่า 40 แห่งที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญได้รับสิทธิ์เข้าถึงเพื่อใช้ Mythos สแกนระบบและโครงการโอเพ่นซอร์สของตนเอง

ในขณะเดียวกัน Anthropic ได้บริจาค 2.5 ล้านดอลลาร์สหรัฐให้กับ Linux Foundation และ 1.5 ล้านดอลลาร์สหรัฐให้กับ Apache Software Foundation ซึ่งทั้งสององค์กรนี้เป็นโครงสร้างพื้นฐานของโลกซอฟต์แวร์

พูดง่ายๆ คือแอป เว็บไซต์ และระบบต่างๆ ที่เราใช้อยู่ในปัจจุบัน ส่วนใหญ่ล้วนใช้พวกเขาเป็นโครงสร้างพื้นฐาน

ในมุมมองของฉัน Anthropic ครั้งนี้ทำสิ่งที่ดี ไม่เพียงแต่เปิดตัวโมเดลที่แข็งแกร่งขึ้น แต่ยังใช้เงินลงทุนในโครงสร้างพื้นฐานข้อมูลทั่วโลกเพื่อช่วยปรับปรุงตัวเอง

After all, going naked benefits no one.

อาจยังรู้สึกไม่ชัดเจนว่า Mythos แข็งแกร่งแค่ไหน แต่ฉันพบตัวอย่างสามกรณีจากบทความต้นฉบับของทางการ ซึ่งฉันคิดว่ามันอธิบายได้ดีกว่าตัวเลข

Mythos

อันดับแรก คือ OpenBSD

นี่คือระบบปฏิบัติการที่ได้รับการยอมรับว่ามีความปลอดภัยสูงมาก โครงสร้างพื้นฐานที่สำคัญหลายแห่งทำงานบนระบบดังกล่าว รวมถึงระบบ iOS ของโทรศัพท์ Apple ที่เราใช้ ระบบ Android และแม้แต่ระบบภายในขององค์กรและหน่วยงานบางแห่ง

Mythos ค้นพบช่องโหว่ที่มีอยู่มานาน 27 ปี ซึ่งผู้โจมตีสามารถทำให้เครื่องเป้าหมายล่มจากระยะไกลได้เพียงแค่เชื่อมต่อเข้ากับเครื่องนั้น

27 ปี! ไม่ใช่ว่าไม่มีใครสนใจ แต่ไม่มีใครเคยพบเลย

ที่สอง คือ FFmpeg

ซอฟต์แวร์เกือบทั้งหมดที่ต้องจัดการวิดีโอต่างก็พึ่งพา它 ซอฟต์แวร์เล่นวิดีโอที่คุณใช้อยู่แทบทุกตัวล้วนมี它อยู่ด้วย

มีช่องโหว่ซ่อนอยู่ในโค้ดที่เขียนไว้เมื่อ 16 ปีก่อน ซึ่งเครื่องมือทดสอบอัตโนมัติได้โจมตีซ้ำๆ ถึง 5 ล้านครั้ง แต่ไม่เคยพบเลย

แต่ Mythos พบแล้ว

ข้อที่สาม: แกนลินุกซ์

นี่ไม่ต้องพูดมาก เพราะแทบจะถือเป็นโครงสร้างพื้นฐานของอินเทอร์เน็ตทั้งหมด และเป็นสิ่งที่ควรระมัดระวังที่สุด

Mythos ไม่ได้แค่ค้นพบช่องโหว่หลายช่องทางที่แยกจากกัน แต่เชื่อมช่องโหว่เหล่านั้นเข้าด้วยกันเป็นโซ่การโจมตี

เริ่มต้นด้วยสิทธิ์ผู้ใช้ทั่วไป แล้วเพิ่มสิทธิ์ทีละขั้นตอนจนได้รับการควบคุมเต็มรูปแบบบนเครื่องทั้งเครื่อง

เกี่ยวกับ Linux นั้น มีลักษณะต่างจากตัวอย่างสองข้อก่อนหน้านี้อย่างสิ้นเชิง

การค้นหาช่องโหว่คือความสามารถในการวิเคราะห์

แต่ช่องโหว่ในการเชื่อมต่อ คือความสามารถของกลยุทธ์

เช่นเดียวกับผลิตภัณฑ์ผู้จัดการหลายคนที่สามารถวาดแบบร่าง เขียนเอกสาร และวิเคราะห์ข้อมูล ซึ่งเป็นทักษะแบบจุดเดียว แต่การเชื่อมโยงธุรกิจ ผลิตภัณฑ์ และเชิงพาณิชย์เข้าด้วยกัน คือทักษะเชิงกลยุทธ์

โมเดลที่สามารถวางแผนเส้นทางการโจมตี ไม่ได้เป็นเพียงเครื่องมือตรวจสอบความปลอดภัยอีกต่อไป แต่ใกล้เคียงกับตัวแทนอัจฉริยะที่สามารถดำเนินการอย่างแข็งขันในสภาพแวดล้อมดิจิทัล

ในสามกรณีข้างต้น Anthropic ใช้วิธีการค้นพบก่อน รายงานก่อน แก้ไขก่อน แล้วจึงเปิดเผย ซึ่งขณะนี้ได้รับการแก้ไขเรียบร้อยแล้ว

เมื่อคุณเห็นสิ่งนี้ คุณจะรู้ว่า Mythos แข็งแกร่งเพียงใด เหมือนสัตว์ร้ายที่ยังไม่ถูกปล่อยออกจากกรง โลกแห่งความเป็นจริงต้องเตรียมตัวให้พร้อมสำหรับการปรับตัวกับมันก่อน

ฉันอยากพูดถึงการสังเกตบางอย่างที่นี่ ซึ่งอาจเป็นจุดเริ่มต้นของการเปลี่ยนแปลงที่แท้จริงในอนาคต

ประการแรก สมมติฐานด้านความปลอดภัยในโลกซอฟต์แวร์กำลังล้มเหลว

ความมั่นคงของซอฟต์แวร์ที่เราคุ้นเคยในวันนี้ ไม่ได้เกิดขึ้นเพียงเพราะการออกแบบระบบดีพอเท่านั้น แต่ส่วนใหญ่ขึ้นอยู่กับความหายากของความสามารถในการโจมตี

พูดให้ตรงไปตรงมา ไม่ใช่ว่าซอฟต์แวร์ไม่แข็งแรง แต่คือคนไม่แข็งแรงพอ

การค้นหาช่องโหว่ต้องใช้ต้นทุน การสร้างโซ่การโจมตีต้องใช้เวลา และการสแกนในระดับใหญ่ต้องใช้ทรัพยากร ดังนั้นหนี้ทางเทคนิคจำนวนมาก บั๊กเก่าๆ และระบบล้าสมัยจึงยังคงมีชีวิตอยู่โดยไม่เคยได้รับการลบล้างอย่างจริงจัง

เช่นเดียวกับการพัฒนาผลิตภัณฑ์ของเรา เราคิดว่าตรรกะเสร็จสมบูรณ์และไม่มีปัญหา แต่นั่นไม่ได้หมายความว่าทุกอย่างปลอดภัยแล้ว อาจเป็นเพราะเราถึงขีดจำกัดของความสามารถแล้ว

ความสามารถที่ Mythos แสดงให้เห็นคือช่วงเวลาตั้งแต่พบช่องโหว่จนถึงการใช้ประโยชน์จากมัน ได้ถูกลดลงจากหลายเดือนในอดีตเหลือเพียงไม่กี่นาที

หมายถึงอะไรบ้างในไม่กี่นาที?

หมายความว่าจังหวะของการอัปเดตแพตช์และกระบวนการแก้ไขเริ่มตามไม่ทันความเร็วของการโจมตี

ที่สอง โลกแบบเปิดแหล่งที่มาจะรู้สึกถึงแรงกดดันก่อน

ในปัจจุบัน ซอฟต์แวร์สมัยใหม่ส่วนใหญ่ล้วนพึ่งพาการพึ่งพาแบบโอเพ่นซอร์สจำนวนมากที่ซ่อนอยู่ด้านล่าง ซึ่งมักไม่เห็นในชีวิตประจำวัน แต่เมื่อถูกเจาะผ่าน จะส่งผลกระทบต่อทั้งอุตสาหกรรมในเวลาเดียวกัน

อาจมีผู้อ่านบางคนยังไม่เข้าใจตรรกะนี้ ขออธิบายแบบง่ายๆ คือ ซอฟต์แวร์ทั้งหมดที่เราใช้อยู่ในปัจจุบันล้วนมีโครงการโอเพ่นซอร์สเป็นพื้นฐาน และรหัสแหล่งที่มาของโครงการเหล่านี้สามารถมองเห็นได้โดยทุกคน

ในอนาคต เมื่อโมเดลสามารถสแกนโครงการโอเพนซอร์สอย่างต่อเนื่องและในปริมาณใหญ่ ผู้ดูแลชุมชนโอเพนซอร์สจะเผชิญกับระดับแรงกดดันที่แตกต่างออกไปอย่างสิ้นเชิง

นี่คือเหตุผลที่ Anthropic บริจาคเงินให้กับ Linux Foundation และ Apache Foundation

ไม่ได้ทำเพื่อสาธารณประโยชน์ แต่เป็นการยอมรับว่าโครงสร้างพื้นฐานแบบโอเพ่นซอร์สคือฐานรากที่อ่อนแอที่สุดและไม่สามารถล้มลงได้ของโลกดิจิทัลในยุคปัญญาประดิษฐ์ พวกเขาแค่ไม่อยากถูกมองว่าเป็นคนชั่วหรือผู้ร้าย

ที่สาม มนุษย์จะถูกลดทอนบทบาท และ AI จะเริ่มแข่งขันกับ AI

คุณค่าของทีมความปลอดภัยผลิตภัณฑ์อินเทอร์เน็ตในอดีตอยู่ที่ความสามารถในการตัดสินใจของมนุษย์ ประสบการณ์ที่สะสม และความเข้าใจอย่างลึกซึ้งต่อระบบ

ในอนาคต ประเด็นนี้จะเปลี่ยนเป็นตรรกะที่ต่างออกไป

เปรียบเทียบกันที่ว่าใครมีโมเดลที่แข็งแกร่งกว่า ใครเชื่อมต่อเครื่องมือได้เร็วกว่า และใครสามารถฝังการตรวจสอบด้วย AI ไว้ที่จุดเริ่มต้นของกระบวนการพัฒนา

นี่ไม่ใช่ปัญหาเกี่ยวกับโปรแกรมเมอร์ที่ถูกแทนที่ แต่เป็นการจัดโครงสร้างใหม่ของวิธีการผลิตในอุตสาหกรรมความปลอดภัย

ด้านหนึ่ง ช่องโหว่ระดับสูงนับพันแห่งสามารถถูกค้นพบภายในไม่กี่สัปดาห์ ปัญหาคือ ฝ่ายโจมตีจะมีเครื่องมือระดับเดียวกันในที่สุด

ในเวลานั้น ความปลอดภัยของผลิตภัณฑ์ซอฟต์แวร์จะไม่ใช่การต่อสู้ระหว่างมนุษย์กับมนุษย์อีกต่อไป แต่จะเป็นการแข่งขันเชิงรุกและป้องกันระหว่างโมเดลกับโมเดล

ครั้งนี้ Anthropic ไม่ได้แค่เปิดตัวความสามารถ แต่ยังเปิดเผยความเสี่ยงด้วย ซึ่งอาจเป็นความซื่อสัตย์ที่อุตสาหกรรมทั้งหมดต้องการเห็นในขั้นตอนนี้

ทุกคนพูดถึงว่า AI เปลี่ยนประสิทธิภาพการทำงานอย่างไร ซึ่งไม่มีอะไรผิด

แต่ Mythos ยังเตือนเราด้วยว่า ความสามารถของ AI ที่ก้าวกระโดดจะสุดท้ายแล้วแพร่กระจายจากโลกเนื้อหาไปยังโลกซอฟต์แวร์ แล้วจึงแพร่กระจายไปยังโครงสร้างพื้นฐานของโลกดิจิทัลทั้งหมด

เนื้อหาถูกเขียนใหม่ ซึ่งส่งผลต่อตรรกะการรับชม

โลกของซอฟต์แวร์ถูกเขียนใหม่ โดยสั่นคลอนรากฐาน

ในเวลานี้ ฉันนึกถึงประโยคหนึ่งจากภาพยนตร์เรื่อง 2012 ซึ่งจะใช้เป็นข้อสรุปของบทความนี้

ไม่ว่าคุณจะเป็นใคร ไม่ว่าเชื้อชาติหรือประเทศของคุณคืออะไร พรุ่งนี้เราไม่มีความแตกต่างกัน!