Anthropic запускает модель Mythos, временно ограниченную аудитами безопасности инфраструктуры

Anthropic запускает сверхмощную ИИ-модель под кодовым названием Mythos, которая превосходит все существующие топовые модели, включая Claude Opus 4.6, по таким параметрам, как программирование, логические рассуждения и поиск уязвимостей; из-за ее прорывных возможностей в области безопасности модель пока не была выпущена в открытый доступ, а вместо этого запущен проект Project Glasswing, в рамках которого Anthropic сотрудничает с 12 ключевыми технологическими компаниями, включая AWS, Apple и Microsoft, а также с открытыми организациями, такими как Linux Foundation, для первоначального применения модели в аудите и укреплении безопасности критически важных цифровых инфраструктур по всему миру.

Автор статьи: Тан Жэнь

Источник: Huoxing Caijing

Я считаю, что человечество, возможно, движется к тому, что ИИ догоняет его с невероятной скоростью.

Не знаю, как обстоят дела у вас, но по крайней мере я уже полностью завис от ИИ — как минимум 50% моей ежедневной работы выполняется с помощью ИИ.

Кроме того, этот коэффициент продолжает расти.

В то же время, с выходом новых моделей поколение за поколением, как моя производительность и качество работы, так и мои ежемесячные расходы на токены, быстро растут.

Вчера вечером я увидел новость, что Anthropic выпустила модель, которую сами не осмеливаются публично предоставлять всем, потому что она действительно слишком мощная.

Новое название модели — «Mythos», что на китайском языке означает «миф».

Сейчас это предварительная версия, поэтому официально она называется «Mythos Preview». Однако на этот раз она запущена в виде проекта под названием «Project Glasswing».

О этом проекте я расскажу позже.

Мифос

В прошлом месяце внутренний документ Anthropic был случайно раскрыт, в котором упоминалось, что разрабатывается модель, большая и мощная, чем Opus, под кодовым названием Mythos.

Затем Anthropic приписала утечку «человеческому фактору» и не привела дальнейших пояснений.

Сейчас модель под кодовым названием Mythos официально анонсирована.

Официальное объявление — это одно, но оно еще не было официально запущено. То есть обычные пользователи пока не могут использовать его.

Причина проста: Anthropic считает, что эта модель слишком мощная и не подходит для открытого доступа до тех пор, пока не будут реализованы соответствующие механизмы безопасности.

Я думаю, эту фразу стоит на мгновение остановиться и подумать.

Обычно компания, занимающаяся ИИ, с нетерпением запускает новую модель, чтобы как можно скорее занять рынок, но на этот раз действия Anthropic явно необычны.

На мой взгляд, не то чтобы они не хотели отправлять, а то, что они боятся это делать.

Потому что модель под названием Mythos действительно мощная.

Сначала рассмотрим несколько тестовых данных, опубликованных официально.

В плане кодирования между Mythos и текущим самым мощным открытым Claude Opus 4.6 существует значительная разница: Mythos практически полностью побеждает Opus 4.6 во всех тестах.

Мифос

В способности к логическому рассуждению, в тесте GPQA Diamond (вопросы по науке на уровне аспирантуры), результат составил 94,6% против 91,3% — Mythos побеждает.

В тестах с инструментами и без инструментов в Humanity's Last Exam Mythos также одержал победу.

Мифос

В отношении компьютерных навыков, связанных с Agent, OSWorld-Verified (самостоятельное выполнение компьютерных задач) показал результат 79,6%, превысив 72,7% у Oputs 4.6.

По каждому параметру Mythos превосходит Opus 4.6, причем в некоторых случаях — значительно.

Мифос

В некоторых задачах разрыв уже не является небольшим пошаговым улучшением, а представляет собой значительный скачок. Например, SWE-bench Multimodal вырос с 27,1% до 59%, почти удвоившись.

Одна из самых ключевых причин, почему они не осмеливаются выходить в сеть Mythos, заключается в том, что он обладает чрезвычайно сильными способностями к преодолению защитных барьеров в программном мире.

Проще говоря, все системы и программы в мире имеют уязвимости, а Mythos может обнаруживать и атаковать эти уязвимости на уровне, превосходящем человеческий.

Предположим, что эта способность попадет в руки хакеров — тогда операционные системы и программное обеспечение по всему миру пострадают, особенно некоторые общественные инфраструктуры и национальная безопасность.

В объявлении Anthropic было написано следующее, и после прочтения мне стало по-настоящему страшно.

Мифос

Кодировочные способности ИИ-моделей достигли чрезвычайно высокого уровня, и в обнаружении и использовании уязвимостей программного обеспечения они могут превзойти всех, кроме самых опытных людей.

Что касается этого предложения, я хотел бы немного расширить его.

Я出身于程序员背景，因此我知道软件是如何构建的，以及不同人编写的代码差异有多大。

Кроме того, ни одно программное обеспечение не осмеливается утверждать, что в нем нет уязвимостей, даже если эта уязвимость никогда не была обнаружена.

Ранее существовавшие уязвимости могли десятилетиями бездействовать в системе не потому, что система была достаточно безопасной.

А потому что поиск уязвимостей требует высочайшей профессиональной компетентности, огромной выдержки и энергии, а также значительного количества времени.

Слишком мало людей участвуют, а тех, кто осмеливается вкладывать, еще меньше.

Эта «редкость способностей» составляет скрытую предпосылку всего мира программной безопасности. После вмешательства ИИ эта предпосылка начинает ослабевать.

ИИ может работать способами, превосходящими возможности большинства не顶尖 людей, и мы можем использовать его как для атаки на уязвимости, так и для их устранения.

Чтобы решить эту проблему, далее я расскажу, что такое Project Glasswing от Anthropic.

Проще говоря, это проект, использующий возможности Mythos для поиска ошибок в инфраструктурных системах по всему миру.

Участниками являются AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation и еще 5 организаций.

Мифос

Этот состав охватывает облачные вычисления, операционные системы, чипы, браузеры, финансовую инфраструктуру, кибербезопасность и экосистему с открытым исходным кодом.

In other words, almost all key players in the global digital infrastructure are involved in this project.

Основная логика этого проекта проста: дать защитникам возможность использовать возможности этой топовой AI-модели.

Потому что, если атакующая сторона получит инструменты того же уровня, окно, как только откроется, будет сложно закрыть. Anthropic обязалась предоставить 100 миллионов долларов США в виде кредитов на использование модели, покрывающих период предварительного просмотра исследований.

Помимо 12 ключевых институциональных участников, более 40 организаций, поддерживающих критически важную программную инфраструктуру, получили доступ для сканирования своих систем и открытых проектов с помощью Mythos.

В то же время Anthropic пожертвовала 2,5 миллиона долларов США Linux Foundation и 1,5 миллиона долларов США Apache Software Foundation — обе эти организации являются инфраструктурой программного мира.

Скажем так, все приложения, веб-сайты и системы, которые мы сейчас используем, в основном построены на их базовой архитектуре.

На мой взгляд, Anthropic сделала хорошее дело: не только запустила более мощную модель, но и потратила деньги на глобальную информационную инфраструктуру, чтобы улучшить её.

After all, going naked benefits no one.

Возможно, до сих пор вы не до конца ощущаете, насколько сильна Mythos. Я нашел три конкретных примера из официального текста, и, по моему мнению, они лучше цифр демонстрируют это.

Мифос

Первый — OpenBSD.

Это признанная одной из самых безопасных операционных систем, на которой работают многие критически важные инфраструктуры, включая операционную систему iPhone iOS, которую мы используем, систему Android и даже некоторые внутренние системы предприятий и организаций.

Mythos обнаружил уязвимость, существовавшую 27 лет: атакующему достаточно подключиться к целевому устройству, чтобы вызвать его удаленный сбой.

27 лет! Не то чтобы никто не обращал внимания, а просто никто не нашел.

Второй, FFmpeg.

Почти все программы, обрабатывающие видео, зависят от него — вы используете различные видеоплееры, в которых он присутствует.

Уязвимость пряталась в строке кода, написанной 16 лет назад; автоматизированные тестовые инструменты атаковали её более 5 миллионов раз, но так и не обнаружили.

Однако Mythos был найден.

Третий — ядро Linux.

Это не требует дополнительных пояснений — это практически инфраструктура всего интернета, и к этому стоит относиться с особой осторожностью.

Mythos не просто обнаружил несколько отдельных уязвимостей, а объединил несколько уязвимостей в одну цепочку атаки.

Начиная с прав обычного пользователя, повышайте привилегии, пока не получите полный контроль над всей машиной.

Что касается Linux, это совершенно иной случай по сравнению с двумя предыдущими.

Поиск уязвимостей — это способность к анализу.

Но уязвимость цепочки — это способность стратегии.

Как и многие менеджеры продуктов, которые могут создавать прототипы, писать документацию и проводить анализ данных — это одиночные навыки. Но соединить бизнес, продукт и коммерцию воедино — это стратегические способности.

Модель, способная планировать путь атаки, уже не просто инструмент аудита — она ближе к агенту, способному действовать активно в цифровой среде.

Во всех трех случаях Anthropic действовала по принципу: обнаружение, сообщение, устранение, затем раскрытие — все проблемы уже устранены.

Увидев это, вы поймете, насколько силен Mythos — он подобен дикому зверю, которого пока не выпускают из клетки, и реальный мир должен подготовиться к его появлению.

Я хочу здесь высказать несколько наблюдений, которые, возможно, станут началом настоящих изменений.

Во-первых, предположения о безопасности в программном мире перестают работать.

Стабильность программного обеспечения, которой мы сегодня привыкли пользоваться, не полностью обусловлена достаточной качественностью системного дизайна. В значительной степени она зависит от редкости способности к атакам.

Проще говоря, не то чтобы программа недостаточно сильна, а человек недостаточно силен.

Поиск уязвимостей требует затрат, создание цепочки эксплуатации занимает время, а масштабное сканирование требует ресурсов. Поэтому многие технические долги, давние баги и устаревшие системы продолжают существовать, так и не будучи серьезно устранены.

Как и при разработке продуктов, мы считаем, что логика замкнута и всё в порядке, но это не означает, что всё действительно безопасно — возможно, мы достигли предела своих возможностей.

Возможности Mythos сократили временной интервал между обнаружением уязвимости и её эксплуатацией с месяцев до нескольких минут.

Что означают несколько минут?

Это означает, что темп выпуска патчей и процесс устранения уязвимостей уже не успевают за скоростью атак.

Во-вторых, давление в первую очередь ощутят в открытом мире.

Сегодня большинство современных программных решений основаны на множестве открытых зависимостей. Обычно они невидимы, но при уязвимости затрагивают всю отрасль одновременно.

Возможно, некоторые читатели не очень хорошо понимают эту логику; проще говоря, все программное обеспечение, которое мы сейчас используем, основано на открытых проектах, исходный код которых доступен всем.

В будущем, когда модели смогут постоянно и масштабно сканировать открытые проекты, уровень давления, с которым столкнутся сопровождающие открытых сообществ, будет совершенно другим.

Это также причина, по которой Anthropic делает пожертвования Фонду Linux и Фонду Apache.

Это не о благотворительности, а о признании того, что открытая инфраструктура — это самая уязвимая, но также самая незаменимая основа цифрового мира в эпоху ИИ; они просто не хотят, чтобы их считали плохими людьми.

В-третьих, люди будут ослаблены, и ИИ начнёт взаимодействовать с ИИ.

Раньше ценность команды безопасности интернет-продуктов заключалась в человеческом суждении, накопленном опыте и глубоком понимании систем.

В будущем это событие изменит логику.

Речь идет о том, чья модель сильнее, чьи инструменты быстрее интегрируются и кто сможет встроить AI-аудит в самое начало процесса разработки.

Речь идет не о замене программистов, а о перестройке методов производства в самой индустрии безопасности.

С другой стороны, тысячи критических уязвимостей могут быть обнаружены в течение нескольких недель. Проблема в том, что злоумышленники неизбежно получат аналогичные инструменты.

К тому времени безопасность программного продукта больше не будет противостоянием человека с человеком, а станет игрой в攻防 между моделями.

На этот раз Anthropic представила не только возможности, но и риски. Возможно, это именно та честность, которую отрасль больше всего нуждается увидеть на данном этапе.

Все говорят о том, как ИИ меняет производительность труда, и это абсолютно правильно.

Но Mythos также напоминает нам, что прорыв в возможностях ИИ в конечном итоге распространится от мира контента на мир программного обеспечения, а затем — на всю цифровую инфраструктуру.

Мир контента переписан, это влияет на логику трафика.

Мир программного обеспечения переписан — затронуты основы.

В этот момент я вспомнил цитату из фильма «2012», которая станет завершением этой статьи.

Кто бы вы ни были, независимо от расы и страны, завтра у нас не будет различий!