Anthropic ra mắt Dự án Project Glasswing trị giá 100 triệu USD cùng 12 công ty công nghệ lớn để khắc phục các lỗ hổng phần mềm toàn cầu

Tác giả: Anthropic

Biên dịch: Shenchao TechFlow

DeepChain dẫn nhập: Anthropic đã phát hành mô hình tiên tiến chưa công khai Claude Mythos Preview, khả năng kiểm tra mã của nó đã vượt trội hơn hầu hết các chuyên gia bảo mật con người, có thể tự động phát hiện các lỗ hổng zero-day tồn tại hàng chục năm.

Dựa trên khả năng này, Anthropic đã cùng với AWS, Apple, Google, Microsoft, NVIDIA và 12 công ty công nghệ lớn khác khởi xướng dự án Project Glasswing, đầu tư 100 triệu USD tín dụng nhằm bịt các lỗ hổng trong phần mềm then chốt toàn cầu trước khi kẻ tấn công đạt được khả năng tương đương.

Giới thiệu

Hôm nay, chúng tôi công bố Project Glasswing (Kế hoạch Glasswing), một sáng kiến mới tập hợp Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA và Palo Alto Networks nhằm bảo vệ an toàn phần mềm quan trọng nhất toàn cầu.

Chúng tôi khởi động Project Glasswing vì một mô hình tiên tiến mới do Anthropic huấn luyện đã thể hiện khả năng mà chúng tôi tin có thể làm thay đổi cục diện an ninh mạng. Claude Mythos Preview là một mô hình tiên tiến phổ quát, chưa được phát hành, và nó phơi bày một sự thật khắc nghiệt: khả năng mã hóa của các mô hình AI đã đạt đến mức độ có thể vượt qua tất cả mọi người, ngoại trừ các chuyên gia hàng đầu, trong việc phát hiện và khai thác lỗ hổng phần mềm.

Mythos Preview đã phát hiện ra hàng ngàn lỗ hổng nghiêm trọng, bao gồm mọi hệ điều hành và trình duyệt phổ biến. Theo tốc độ tiến bộ của AI, khả năng này sẽ lan rộng trong tương lai gần và có thể rơi vào tay những người dùng thiếu trách nhiệm. Tác động đến kinh tế, an toàn công cộng và an ninh quốc gia có thể rất nghiêm trọng. Project Glasswing là một nỗ lực cấp bách nhằm ưu tiên sử dụng những khả năng này vào mục đích phòng thủ.

Là một phần của Project Glasswing, các đối tác trên sẽ sử dụng Mythos Preview trong các nỗ lực bảo mật phòng thủ của họ; Anthropic sẽ chia sẻ những bài học học được để toàn ngành hưởng lợi. Chúng tôi cũng đã cấp quyền truy cập cho hơn 40 tổ chức khác đang xây dựng hoặc duy trì cơ sở hạ tầng phần mềm then chốt, để họ có thể quét và củng cố hệ thống của riêng mình cũng như các hệ thống mã nguồn mở. Anthropic cam kết dành tối đa 100 triệu USD quyền sử dụng Mythos Preview và 4 triệu USD tài trợ trực tiếp cho các tổ chức bảo mật mã nguồn mở.

Project Glasswing chỉ là điểm khởi đầu. Không có tổ chức nào có thể tự mình giải quyết vấn đề an ninh mạng: các nhà phát triển AI tiên tiến, các công ty phần mềm khác, các nhà nghiên cứu bảo mật, những người duy trì mã nguồn mở và chính phủ các quốc gia trên toàn cầu đều đóng vai trò không thể thay thế. Việc xây dựng phòng thủ cho cơ sở hạ tầng mạng toàn cầu có thể cần vài năm; trong khi khả năng AI tiên tiến có thể tiến bộ vượt bậc trong vài tháng tới. Để giành lợi thế, những người phòng thủ mạng phải hành động ngay bây giờ.

An ninh mạng trong thời đại AI

Các phần mềm chúng ta phụ thuộc hàng ngày — chạy hệ thống ngân hàng, lưu trữ hồ sơ y tế, kết nối mạng lưới logistics, duy trì hoạt động của lưới điện — luôn tồn tại lỗi. Hầu hết không quan trọng, nhưng một số là lỗ hổng bảo mật nghiêm trọng, khi bị phát hiện, kẻ tấn công có thể chiếm quyền kiểm soát hệ thống, làm tê liệt hoạt động hoặc đánh cắp dữ liệu.

Các cuộc tấn công mạng đã gây ra những hậu quả phá hoại rõ rệt đối với mạng doanh nghiệp, hệ thống y tế, cơ sở hạ tầng năng lượng, các trung tâm giao thông và các chính phủ cơ quan trên toàn thế giới. Ở cấp độ toàn cầu, các cuộc tấn công cấp nhà nước từ Trung Quốc, Iran, Triều Tiên và Nga đã đe dọa các cơ sở hạ tầng hỗ trợ cuộc sống dân sự và chuẩn bị quân sự. Ngay cả các cuộc tấn công quy mô nhỏ nhắm vào một bệnh viện hoặc trường học duy nhất cũng có thể gây ra tổn thất kinh tế lớn, phơi bày dữ liệu nhạy cảm và thậm chí đe dọa tính mạng. Tổn thất kinh tế hàng năm do tội phạm mạng toàn cầu khó có thể ước tính chính xác, nhưng có thể khoảng 500 tỷ USD.

Trước đây, nhiều lỗi phần mềm đã tồn tại nhiều năm mà không bị phát hiện vì việc tìm kiếm và khai thác chúng đòi hỏi kiến thức chuyên môn chỉ có một số ít chuyên gia an ninh mới sở hữu. Nhưng với sự xuất hiện của các mô hình AI tiên tiến nhất, chi phí, nỗ lực và rào cản chuyên môn cần thiết để phát hiện và khai thác lỗ hổng phần mềm đã giảm đáng kể. Trong năm qua, các mô hình AI ngày càng mạnh mẽ trong việc đọc và suy luận mã nguồn, đặc biệt nổi bật trong việc phát hiện lỗ hổng và xây dựng cách khai thác. Claude Mythos Preview đã đạt được bước tiến vượt bậc trong các kỹ năng an ninh mạng này — nó đã phát hiện ra một số lỗ hổng vẫn tồn tại sau khi con người kiểm tra trong vài thập kỷ và trải qua hàng triệu lần kiểm thử an ninh tự động, đồng thời mã khai thác do nó phát triển ngày càng tinh vi hơn.

Sau mười năm kể từ cuộc thi DARPA Cyber Grand Challenge đầu tiên, các mô hình AI tiên tiến đang tiến gần đến, thậm chí bằng với khả năng phát hiện và khai thác lỗ hổng của con người xuất sắc nhất. Nếu không có các biện pháp an toàn cần thiết, những khả năng mạng mạnh mẽ này có thể được sử dụng để khai thác hàng loạt lỗ hổng hiện có trong phần mềm quan trọng nhất toàn cầu. Các cuộc tấn công mạng sẽ trở nên phổ biến hơn, gây hại hơn và trao quyền cho các đối thủ của Hoa Kỳ và các đồng minh. Đây là một ưu tiên an ninh mà các quốc gia dân chủ phải chú trọng.

Tin tốt là: những khả năng khiến mô hình AI trở nên nguy hiểm khi rơi vào tay sai trái lại khiến chúng cực kỳ có giá trị trong việc phát hiện và khắc phục các lỗ hổng phần mềm quan trọng—đồng thời giúp tạo ra các phần mềm mới ít lỗi bảo mật hơn. Project Glasswing là bước quan trọng giúp các bên phòng thủ xây dựng lợi thế bền vững trong kỷ nguyên an ninh mạng do AI thúc đẩy sắp tới.

Khả năng phát hiện lỗ hổng và cách khai thác của Claude Mythos Preview

Trong vài tuần qua, chúng tôi đã phát hiện hàng ngàn lỗ hổng zero-day (tức là những lỗ hổng mà các nhà phát triển phần mềm hoàn toàn không biết trước) trong mọi hệ điều hành chính, mọi trình duyệt chính và một loạt phần mềm quan trọng khác, trong đó nhiều lỗ hổng có mức độ nguy hiểm cao.

Trên Blog Frontier Red Team, chúng tôi đã tiết lộ chi tiết kỹ thuật của một số lỗ hổng đã được vá, cùng với các phương thức khai thác được Mythos Preview phát hiện. Hầu hết các lỗ hổng này (cùng với việc phát triển nhiều phương thức khai thác liên quan) đều được mô hình tự chủ thực hiện hoàn toàn, không có sự hướng dẫn nào từ con người. Dưới đây là ba ví dụ:

Mythos Preview đã phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD. OpenBSD nổi tiếng với mức độ bảo mật cao và được sử dụng rộng rãi trong tường lửa và các cơ sở hạ tầng quan trọng khác. Lỗ hổng này cho phép kẻ tấn công chỉ cần kết nối đến máy mục tiêu để gây sập từ xa.
Nó cũng phát hiện ra một lỗ hổng 16 năm trong FFmpeg. FFmpeg được vô số phần mềm sử dụng để mã hóa và giải mã video. Vấn đề nằm ở một dòng mã, và các công cụ kiểm thử tự động đã nhắm vào dòng mã này 5 triệu lần nhưng chưa bao giờ phát hiện ra vấn đề.
Mô hình này tự động phát hiện và kết nối nhiều lỗ hổng trong nhân Linux (nhân Linux điều hành phần lớn máy chủ trên toàn cầu), thực hiện cuộc tấn công tăng quyền từ quyền người dùng thông thường đến kiểm soát hoàn toàn máy tính.

Chúng tôi đã báo cáo tất cả các lỗ hổng trên cho các nhà phát triển phần mềm liên quan và tất cả đều đã được sửa chữa. Đối với nhiều lỗ hổng khác, hôm nay chúng tôi đã cung cấp các giá trị băm mật mã chi tiết (xem blog Red Team), và sẽ công bố thông tin cụ thể sau khi việc sửa chữa hoàn tất.

Các tiêu chuẩn đánh giá như CyberGym cũng xác nhận sự khác biệt đáng kể giữa Mythos Preview và mô hình mạnh thứ hai của chúng tôi, Claude Opus 4.6:

Reproducing cybersecurity vulnerabilities - CyberGym

hình ảnh

Ngoài công việc của chính chúng tôi, nhiều đối tác cũng đã sử dụng Claude Mythos Preview trong vài tuần qua. Dưới đây là phản hồi của họ:

「Khả năng AI đã vượt qua một ngưỡng quan trọng, thay đổi căn bản mức độ cấp bách cần thiết để bảo vệ cơ sở hạ tầng then chốt khỏi các mối đe dọa mạng, và sự thay đổi này là không thể đảo ngược. Thông qua công việc nền tảng với các mô hình này, chúng tôi cho thấy có thể nhận diện và khắc phục các lỗ hổng bảo mật trong phần cứng và phần mềm với tốc độ và quy mô chưa từng có. Đây là một sự chuyển biến sâu sắc và một tín hiệu rõ ràng: các phương pháp củng cố hệ thống cũ đã không còn đủ. Các nhà cung cấp công nghệ phải ngay lập tức chủ động áp dụng các phương pháp mới, và khách hàng cũng cần sẵn sàng để triển khai. Đó là lý do Cisco gia nhập Project Glasswing — công việc này quá quan trọng và cấp bách để thực hiện một mình.»

—— Anthony Grieco, Phó Chủ tịch Cao cấp và Giám đốc An ninh & Tin cậy của Cisco

Tại AWS, chúng tôi xây dựng các biện pháp phòng thủ ngay từ trước khi các mối đe dọa xuất hiện, từ các chip tùy chỉnh đến toàn bộ stack công nghệ. An ninh không phải là một giai đoạn, mà là một quá trình liên tục, được tích hợp vào mọi việc chúng tôi làm. Đội ngũ của chúng tôi phân tích hơn 400 nghìn tỷ lần lưu lượng mạng mỗi ngày để phát hiện mối đe dọa, và AI là cốt lõi của khả năng phòng thủ quy mô lớn của chúng tôi. Chúng tôi đang liên tục thử nghiệm Claude Mythos Preview trong hoạt động an ninh của chính mình, áp dụng nó vào các kho mã quan trọng, và nó đã giúp chúng tôi củng cố mã nguồn. Chúng tôi đang đổ vào hợp tác với Anthropic những chuyên môn an ninh sâu rộng và hỗ trợ củng cố Claude Mythos Preview để giúp nhiều tổ chức hơn có thể tiến hành công việc của mình với các tiêu chuẩn an toàn cao nhất.

—— Amy Herzog, Phó chủ tịch và Giám đốc an ninh thông tin của Amazon Web Services

Khi an ninh mạng không còn bị giới hạn bởi năng lực thuần túy của con người, cơ hội sử dụng AI một cách có trách nhiệm để nâng cao tính bảo mật và giảm thiểu rủi ro trên quy mô lớn là chưa từng có. Việc tham gia Project Glasswing và truy cập vào Claude Mythos Preview giúp chúng tôi nhận diện và giảm thiểu rủi ro sớm hơn, tăng cường các giải pháp bảo mật và phát triển của mình, từ đó bảo vệ tốt hơn cho khách hàng và Microsoft. Khi được kiểm thử trên tiêu chuẩn bảo mật mã nguồn mở CTI-REALM, Claude Mythos Preview cho thấy sự cải thiện đáng kể so với các mô hình trước đó. Chúng tôi mong muốn hợp tác với Anthropic và ngành công nghiệp rộng lớn hơn để cải thiện kết quả an ninh cho tất cả mọi người.

—— Igor Tsyganskiy, Phó Chủ tịch Điều hành về An ninh Mạng và Nghiên cứu của Microsoft

Khoảng thời gian từ khi lỗ hổng được phát hiện đến khi bị kẻ tấn công khai thác đã sụp đổ — những việc trước đây mất vài tháng, giờ đây AI có thể hoàn thành trong vài phút. Claude Mythos Preview cho thấy khả năng hành động quy mô lớn của bên phòng thủ, trong khi đối thủ sẽ không thể tránh khỏi việc tìm cách khai thác cùng khả năng đó. Đây không phải là lý do để chậm lại, mà là lý do để cùng nhau tăng tốc. Để triển khai AI, cần có an ninh đảm bảo. Đó chính là lý do CrowdStrike tham gia ngay từ ngày đầu tiên.

—— Elia Zaitsev, Chief Technology Officer của CrowdStrike

Trước đây, chuyên môn về bảo mật là một thứ xa xỉ chỉ các tổ chức có đội ngũ bảo mật lớn mới có thể sở hữu. Các nhà duy trì phần mềm mã nguồn mở — phần mềm của họ hỗ trợ phần lớn cơ sở hạ tầng then chốt toàn cầu — từ trước đến nay đều phải tự tìm cách giải quyết các vấn đề bảo mật. Phần mềm mã nguồn mở chiếm phần lớn mã nguồn trong các hệ thống hiện đại, bao gồm cả các hệ thống mà các tác nhân AI sử dụng để viết phần mềm mới. Bằng cách cung cấp quyền truy cập vào các mô hình AI thế hệ mới — có khả năng phát hiện và sửa lỗi một cách chủ động quy mô lớn — cho các nhà duy trì các kho mã nguồn mở then chốt, Project Glasswing cung cấp một con đường thực tế để thay đổi tình hình này. Đó là cách bảo mật được tăng cường bởi AI chuyển từ công cụ độc quyền của các đội ngũ lớn thành trợ lý đáng tin cậy cho mỗi nhà duy trì.

—— Jim Zemlin, CEO của Linux Foundation

Việc thúc đẩy an ninh mạng và khả năng chống chịu của hệ thống tài chính là cốt lõi trong sứ mệnh của JPMorgan Chase, và chúng tôi tin rằng ngành công nghiệp sẽ mạnh mẽ nhất khi các tổ chức hàng đầu cùng hợp tác giải quyết những thách thức chung. Project Glasswing mang đến cơ hội sớm độc đáo để chúng tôi đánh giá năng lực của các công cụ AI thế hệ tiếp theo trong việc bảo vệ hạ tầng then chốt theo tiêu chuẩn của riêng mình, đồng thời cùng làm việc với những nhà lãnh đạo công nghệ được tôn trọng. Chúng tôi sẽ tiếp cận một cách nghiêm túc và độc lập để xác định cách thức tiến hành và hỗ trợ. Sáng kiến của Anthropic phản ánh phương pháp hướng tới tương lai và hợp tác cần thiết cho thời điểm này.

—— Pat Opet, Giám đốc An ninh Thông tin hàng đầu của JPMorgan Chase

Google rất vui khi chứng kiến sự hình thành của sáng kiến an ninh mạng liên ngành này và cung cấp Mythos Preview cho các bên tham gia thông qua Vertex AI. Sự hợp tác của ngành trong các vấn đề an ninh mới nổi luôn cực kỳ quan trọng, bất kể đó là mật mã sau lượng tử, tiết lộ có trách nhiệm các lỗ hổng zero-day, an ninh phần mềm nguồn mở, hay phòng thủ chống lại các cuộc tấn công dựa trên AI. Chúng tôi luôn tin rằng AI vừa mang đến những thách thức mới vừa mở ra cơ hội mới trong phòng vệ mạng, chính vì vậy chúng tôi đã xây dựng các công cụ do AI dẫn dắt như Big Sleep và CodeMender để phát hiện và sửa chữa các lỗi phần mềm quan trọng. Chúng tôi sẽ tiếp tục đầu tư vào các nền tảng an ninh mạng hàng đầu và văn hóa lấy việc bảo vệ người dùng, khách hàng, hệ sinh thái và an ninh quốc gia làm trung tâm.

—— Heather Adkins, Phó chủ tịch kỹ thuật an ninh của Google

Trong vài tuần qua, chúng tôi đã sử dụng mô hình Claude Mythos Preview để phát hiện các lỗ hổng phức tạp mà các mô hình thế hệ trước hoàn toàn bỏ sót. Điều này không chỉ thay đổi hoàn toàn cách thức phát hiện lỗ hổng ẩn, mà còn có nghĩa là các kẻ tấn công sẽ nhanh chóng phát hiện và khai thác nhiều lỗ hổng zero-day hơn bao giờ hết. Rõ ràng, những mô hình này cần được trao cho chủ sở hữu các dự án mã nguồn mở và tất cả những người phòng thủ, để phát hiện và vá lỗ hổng trước khi kẻ tấn công có quyền truy cập. Có lẽ quan trọng hơn nữa: mọi người đều cần chuẩn bị cho sự xuất hiện của các kẻ tấn công được hỗ trợ bởi AI. Các cuộc tấn công sẽ nhiều hơn, nhanh hơn và phức tạp hơn. Giờ là lúc nâng cấp toàn diện hệ thống an ninh mạng. Chúng tôi đánh giá cao Anthropic đã hợp tác với ngành công nghiệp để đảm bảo những khả năng mạnh mẽ này được ưu tiên phục vụ phòng thủ.

—— Lee Klarich, Chief Product and Technology Officer của Palo Alto Networks

Claude Mythos Preview có khả năng bảo mật mạng mạnh mẽ, xuất phát từ khả năng mã hóa và suy luận vượt trội của nó. Các kết quả đánh giá dưới đây cho thấy mô hình này đạt điểm cao nhất trong tất cả các mô hình đã biết trên nhiều nhiệm vụ mã hóa phần mềm.

Agent encoding

hình ảnh

Reasoning

hình ảnh

Tìm kiếm tác nhân và sử dụng máy tính

hình ảnh

Ghi chú:

SWE-bench Xác minh, Pro và Đa ngôn ngữ: Các nhãn kiểm tra ghi nhớ đã được đánh dấu một số câu hỏi. Sau khi loại bỏ các câu hỏi có khả năng ghi nhớ, lợi thế của Mythos Preview so với Opus 4.6 vẫn không thay đổi.
SWE-bench Đa phương tiện: Sử dụng triển khai nội bộ, điểm số không thể so sánh trực tiếp với bảng xếp hạng công khai.
Terminal-Bench 2.0: Sử dụng khung Terminus-2, chế độ tư duy thích ứng với nỗ lực tối đa, ngân sách tổng cộng 1 triệu token cho mỗi nhiệm vụ, tài nguyên được cấu hình với tỷ lệ đảm bảo 1 lần / giới hạn tối đa 3 lần, trung bình 5 lần thử nghiệm cho mỗi nhiệm vụ. Sau khi tăng giới hạn thời gian chờ lên 4 giờ và cập nhật lên Terminal-Bench 2.1, điểm Mythos Preview đạt 92,1%.
BrowseComp: Claude Mythos Preview đạt điểm cao hơn Opus 4.6, đồng thời tiêu tốn chỉ 1/4.9 số token so với后者.
Bài kiểm tra cuối cùng của nhân loại: Mythos vẫn hoạt động tốt ở chế độ nỗ lực thấp, có thể tồn tại mức độ ghi nhớ nhất định.

Để biết thêm thông tin về khả năng, thuộc tính bảo mật và các đặc điểm cơ bản của mô hình này, vui lòng tham khảo Claude Mythos Preview System Card.

Chúng tôi không có kế hoạch mở rộng Claude Mythos Preview cho công chúng, nhưng mục tiêu cuối cùng là cho phép người dùng triển khai an toàn các mô hình cấp Mythos quy mô lớn — không chỉ cho an ninh mạng mà còn cho nhiều giá trị khác mà các mô hình năng lực cao này sẽ mang lại. Để làm được điều này, chúng tôi cần tiến bộ trong việc phát triển các biện pháp bảo mật an ninh mạng (và các biện pháp khác) có thể phát hiện và ngăn chặn các đầu ra nguy hiểm nhất của mô hình. Chúng tôi dự kiến triển khai các biện pháp bảo mật mới trong mô hình Claude Opus sắp ra mắt, giúp chúng tôi cải tiến và hoàn thiện các biện pháp này bằng một mô hình không có mức độ rủi ro tương đương với Mythos Preview.

Bước tiếp theo của Project Glasswing

今天的发布是长期努力的开端。要成功，需要技术行业内外的广泛参与。

Các đối tác của Project Glasswing sẽ được truy cập vào Claude Mythos Preview để phát hiện và khắc phục các lỗ hổng và điểm yếu trong hệ thống cơ sở của họ—những hệ thống này chiếm một tỷ lệ lớn diện tích tấn công mạng được chia sẻ toàn cầu. Các trọng tâm công việc dự kiến bao gồm phát hiện lỗ hổng tại chỗ, kiểm thử hộp đen nhị phân, củng cố điểm cuối và kiểm thử xâm nhập hệ thống.

Anthropic đã cam kết 100 triệu USD quyền sử dụng mô hình cho Project Glasswing và các bên tham gia khác, đủ để đáp ứng nhu cầu sử dụng lớn trong giai đoạn xem trước nghiên cứu. Sau đó, Claude Mythos Preview sẽ được cung cấp cho các bên tham gia với mức giá 25 USD / 125 USD mỗi triệu token đầu vào / đầu ra (các bên tham gia có thể truy cập mô hình thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry).

Ngoài hạn mức sử dụng mô hình, chúng tôi còn quyên góp 2,5 triệu USD cho Alpha-Omega và OpenSSF thông qua Quỹ Linux, cùng 1,5 triệu USD cho Quỹ Phần mềm Apache để hỗ trợ các nhà duy trì phần mềm nguồn mở ứng phó với bối cảnh thay đổi này (các nhà duy trì quan tâm có thể đăng ký truy cập thông qua chương trình Claude for Open Source).

Chúng tôi dự định mở rộng phạm vi công việc này trong nhiều tháng, chia sẻ càng nhiều kinh nghiệm càng tốt để các tổ chức khác có thể áp dụng những kinh nghiệm này vào an ninh của chính họ. Các đối tác sẽ chia sẻ thông tin và thực tiễn tốt nhất với nhau trong phạm vi cho phép; trong vòng 90 ngày, Anthropic sẽ công bố báo cáo công khai về các phát hiện của chúng tôi, cùng với các lỗ hổng đã được sửa và các biện pháp cải tiến có thể tiết lộ. Chúng tôi cũng sẽ hợp tác với các tổ chức an ninh hàng đầu để xây dựng một bộ hướng dẫn thực tế về sự phát triển của các thực hành an ninh trong thời đại AI, có thể bao gồm: quy trình tiết lộ lỗ hổng, quy trình cập nhật phần mềm, an ninh mã nguồn mở và chuỗi cung ứng, vòng đời phát triển phần mềm và các thực hành thiết kế an toàn, tiêu chuẩn ngành được quản lý, phân loại mở rộng và tự động hóa, cũng như tự động hóa bản vá.

Anthropic vẫn đang tiếp tục thảo luận với các quan chức chính phủ Mỹ về khả năng an ninh mạng phòng thủ và tấn công của Claude Mythos Preview. Bảo vệ cơ sở hạ tầng then chốt là ưu tiên an ninh quốc gia hàng đầu của các quốc gia dân chủ—sự xuất hiện của các khả năng an ninh mạng này một lần nữa cho thấy Mỹ và các đồng minh phải duy trì lợi thế quyết định trong công nghệ AI. Chính phủ đóng vai trò không thể thay thế trong việc hỗ trợ duy trì lợi thế này, cũng như đánh giá và giảm thiểu các rủi ro an ninh quốc gia liên quan đến mô hình AI. Chúng tôi sẵn sàng hợp tác với các đại diện chính phủ ở mọi cấp độ để hỗ trợ thực hiện những nhiệm vụ này.

Chúng tôi hy vọng Project Glasswing sẽ thúc đẩy một nỗ lực quy mô lớn hơn, bao gồm cả ngành công nghiệp và khu vực công, trong đó các bên cùng nhau giải quyết những vấn đề lớn nhất liên quan đến tác động an ninh của các mô hình mạnh mẽ. Chúng tôi kêu gọi các thành viên khác trong ngành AI tham gia cùng chúng tôi để xây dựng các tiêu chuẩn ngành. Về trung hạn, một tổ chức bên thứ ba độc lập — có khả năng tập hợp các tổ chức từ khu vực tư nhân và công cộng — có thể là nền tảng lý tưởng để tiếp tục thực hiện các dự án an ninh mạng quy mô lớn này.

Ghi chú

Dự án này được đặt tên theo loài bướm cánh trong suốt (Greta oto). Ẩn dụ này có hai tầng nghĩa: đôi cánh trong suốt của bướm giúp nó hòa vào vô hình, giống như những lỗ hổng ẩn giấu trong mã được đề cập trong bài viết này; đôi cánh trong suốt cũng giúp nó tránh khỏi tổn thương, giống như phương pháp minh bạch mà chúng ta ủng hộ.
Mythos xuất phát từ tiếng Hy Lạp cổ đại, có nghĩa là "narrative" hoặc "story": hệ thống câu chuyện mà nền văn minh sử dụng để hiểu thế giới.
Các chuyên gia an ninh bị ảnh hưởng bởi các biện pháp bảo mật này có thể đăng ký chương trình xác minh an ninh mạng sắp ra mắt (Cyber Verification Program).