Anthropic запускає модель Mythos AI, тимчасово обмежену аудитами безпеки інфраструктури

Anthropic запускає надпотужну AI-модель під кодовою назвою Mythos, яка повністю перевершує поточні топові моделі Claude Opus 4.6 у таких аспектах, як кодування, міркування та виявлення вразливостей; через наявність проривної здатності до створення безпекових загроз модель ще не опублікована, а замість цього запущено проект Project Glasswing, який у співпраці з AWS, Apple, Microsoft та 12 іншими ключовими технологічними організаціями та відкритими організаціями, зокрема Linux Foundation, використовується для безпекового аудиту та підсилення глобальних критичних цифрових інфраструктур.

Автор статті: Тан Рен

Джерело: Mars Finance

Я вважаю, що люди, можливо, переганяються ШІ зі швидкістю, що перевищує звичайне розуміння.

Не знаю, як у вас справи, але я вже повністю не можу обійтися без ШІ — щонайменше 50% моєї роботи я виконую з допомогою ШІ.

Крім того, цей відсоток продовжує зростати.

Тим часом, зі введенням нових моделей покоління за поколінням, як моя продуктивність і якість роботи, так і мої щомісячні витрати на токени швидко зростають.

Вчора вночі я побачив новину, що Anthropic випустила модель, яку навіть вони самі не наважуються публічно надавати всім, бо вона дійсно надзвичайно потужна.

Нова модель називається «Mythos», що у перекладі з китайської означає «міф».

Зараз це попередня версія, тому офіційно її називають «Mythos Preview». Однак цей запуск відбувається у формі проекту під назвою «Project Glasswing».

Про цей проект я розповім трохи пізніше.

Міфос

Минулого місяця внутрішній документ Anthropic був випадково розкритий, у якому згадувалося, що розробляється модель, яка більша й потужніша за Opus, під кодовою назвою Mythos.

Після цього Anthropic приписала цей витік «людському фактору» і не надала додаткових пояснень.

Зараз ця модель під кодовою назвою Mythos офіційно оголошена.

Офіційне оголошення — це одне, але він ще не був офіційно запущений. Іншими словами, звичайні користувачі ще не можуть ним користуватися.

Причина дуже проста: Anthropic вважає, що ця модель занадто потужна і не підходить для відкритого доступу до тих пір, поки не будуть встановлені механізми безпеки.

Я вважаю, що цей вираз варто на мить зупинитися і подумати.

Зазвичай AI-компанія, випускаючи нову модель, прагне якомога швидше вийти на ринок, але на цей раз дії Anthropic явно виглядають незвично.

На мою думку, не те, що вони не хочуть відправляти, а те, що не сміють.

Тому що ця модель під назвою Mythos дійсно дуже потужна.

Спочатку розглянемо кілька офіційно опублікованих тестових даних.

У плані кодування різниця між Mythos і найсильнішим на даний момент відкритим Claude Opus 4.6 є значною, і Mythos майже повністю перевершує Opus 4.6 у всіх тестах.

Міфос

У здатності до міркувань у тесті GPQA Diamond (наукові питання та відповіді на рівні аспірантури) результат становить 94,6% проти 91,3%, Mythos перемагає.

У тестах з інструментами та без інструментів у Humanity's Last Exam також перемогу здобув Mythos.

Міфос

Щодо комп’ютерних навичок, пов’язаних з Agent, OSWorld-Verified (самостійне виконання комп’ютерних завдань) показав 79,6%, що перевищує 72,7% у Oputs 4.6.

На кожному аспекті Mythos перевершує Opus 4.6, деякі навіть значно перевершують.

Міфос

У деяких завданнях різниця вже не є невеликим поступовим покращенням, а значною стрибком. Наприклад, SWE-bench Multimodal зросла з 27,1% до 59%, майже подвоївшись.

Однією з найважливіших причин, чому вони не наважуються входити в Mythos, є його надзвичайно сильна здатність подолувати безпеку програмного світу.

Просто кажучи, у всіх систем і програм по всьому світу є вразливості, а Mythos може виявляти та атакувати ці вразливості на рівні, що перевищує людський.

Припустимо, що цю здатність отримають хакери — тоді операційні системи та програмне забезпечення по всьому світу зазнають ушкоджень, особливо деякі суспільні інфраструктури та національна безпека.

У оголошенні Anthropic було таке речення, і після його прочитання мені стало жахливо.

Міфос

Кодувальна здатність моделей ШІ досягла надзвичайно високого рівня, і виявлення та використання вразливостей програмного забезпечення вони майже можуть перевершити всіх, крім найбільш досвідчених людей.

Щодо цього речення я хочу розгорнути це докладніше.

Я походжу з програмістів, тому знаю, як будуються програми, і наскільки відрізняється код, написаний різними людьми.

Крім того, жоден програмний продукт не може стверджувати, що в ньому немає дірок, навіть якщо ці дірки ніколи не були виявлені.

Попередні вразливості могли десятиліттями спокійно перебувати в системі не тому, що система була достатньо безпечною.

Але пошук вразливостей вимагає надзвичайно високих професійних навичок, величезної терпіння та енергії, а також багато часу.

Людей, які беруть участь, замало, а тих, хто наважується інвестувати, ще менше.

Ця «недостатність здібностей» є неявним передумовним припущенням усього світу програмної безпеки. Після втручання ШІ ця передумова починає руйнуватися.

Штучний інтелект може працювати на рівні, що перевищує здібності більшості не найкращих людей, і ми можемо використовувати його як для атаки на вразливості, так і для їх усунення.

Щоб вирішити цю проблему, далі я розповім, що це за Project Glasswing, який розробляє Anthropic.

Просто кажучи, це проект, який використовує здібності Mythos для пошуку помилок у інфраструктурних системах по всьому світу.

Учасниками є AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Фонд Linux та ще 5 організацій.

Міфос

Цей склад охоплює хмарні обчислення, операційні системи, чіпси, браузери, фінансову інфраструктуру, кібербезпеку та екосистему відкритого коду.

Іншими словами, майже всі ключові учасники глобальної цифрової інфраструктури залучені до цього проекту.

Основна логіка цього проекту полягає лише в одному: дати захисникам можливість використовувати здібності цієї топової моделі ШІ.

Оскільки, якщо атакуюча сторона отримає інструменти того ж рівня, вікно, як тільки відкриється, важко закрити. Anthropic обіцяє надати 100 мільйонів доларів США на використання моделей, що охоплює період дослідницького попереднього огляду.

Крім 12 основних інституцій, доступ отримали понад 40 організацій, які підтримують ключову програмну інфраструктуру, щоб використовувати Mythos для сканування своїх систем та відкритих проектів.

Також Anthropic пожертвувала 2,5 мільйона доларів США Фонду Linux та 1,5 мільйона доларів США Фонду Apache — обидва є інфраструктурою світу програмного забезпечення.

Скажімо так, всі додатки, вебсайти та системи, які ми зараз використовуємо, базуються на їхній нижчій архітектурі.

На мою думку, Anthropic зробила добрі справи: вона не лише запустила потужнішу модель, але й витратила гроші на глобальну інфраструктуру інформації, щоб вдосконалити її.

After all, going naked benefits no one.

Можливо, на цьому етапі ви все ще не відчуваєте, наскільки сильним є Mythos. Я знайшов три конкретні приклади з офіційного тексту, і вважаю, що вони краще підтверджують це, ніж цифри.

Міфос

Перший — OpenBSD.

Це визнана надзвичайно безпечна операційна система, на якій працює багато критичної інфраструктури, включаючи наші iPhone з iOS, системи Android та деякі внутрішні системи підприємств та організацій.

Mythos виявив уразливість, яка існувала 27 років: атакувач, підключившись до цільового пристрою, може викликати його віддалене збоєв.

27 років! Не те, щоб ніхто не цікавився, а просто ніхто не знайшов.

Другий, FFmpeg.

Майже всі програми, які обробляють відео, залежать від нього — ваші різні програми для відтворення відео майже завжди містять його.

Ураза приховалась у рядку коду, написаному 16 років тому, і автоматизовані інструменти тестування атакували його понад 5 мільйонів разів, але ніколи не знайшли.

Але Mythos знайшли.

Третій — ядро Linux.

Це не вимагає пояснень — це майже вся інфраструктура Інтернету, і з цим слід бути найбільш обережним.

Mythos не просто виявив кілька окремих уразливостей, а поєднав кілька уразливостей у ланцюжок атак.

Починаючи з прав звичайного користувача, підвищуйте права доступу, щоб у кінцевому підсумку отримати повний контроль над усією машиною.

Щодо Linux це зовсім інша справа, ніж у двох попередніх випадках.

Пошук вразливостей — це здатність до аналізу.

Але вразливість у ланцюзі — це питання стратегічних можливостей.

Як і багато продукт-менеджерів, які вміють робити прототипи, писати документацію та аналізувати дані, це окремі навички. Але поєднання бізнесу, продукту та комерції — це стратегічна здатність.

Модель, яка може планувати шляхи атаки, вже не є лише інструментом аудиту — вона ближча до інтелектуального агента, здатного діяти в цифровому середовищі.

У трьох наведених випадках Anthropic дотримувалася підходу: спочатку виявлення, потім повідомлення, потім виправлення, і лише після цього розголошення — усі проблеми вже виправлено.

Бачачи це, ви розумієте, наскільки сильний Mythos — це як звір, якого ще не випустили з клітки, і реальний світ повинен спочатку підготуватися до нього.

Я хочу висловити кілька спостережень, можливо, це буде початком справжніх змін.

По-перше, припущення безпеки в світі програмного забезпечення перестають діяти.

Стабільність програмного забезпечення, яку ми сьогодні вважаємо само собою зрозумілою, не походить повністю з добре спроектованих систем. Велика частина її залежить від рідкісності здатності до атак.

Сказати простіше — не програма недостатньо сильна, а люди.

Пошук вразливостей вимагає витрат, створення ланцюжка експлойтів — часу, а масштабне сканування — ресурсів. Тому багато технічного боргу, давніх багів та застарілих систем існують так само, ніколи не були серйозно прибрані.

Як і при розробці продукту, коли ми вважаємо, що логіка замкнена і все в порядку, це не означає, що все справді безпечніше — ймовірно, ми досягли своєї межі можливостей.

Можливості Mythos полягають у тому, що часове вікно між виявленням та використанням вразливості скоротилося з кількох місяців до кількох хвилин.

Що означає кілька хвилин?

Це означає, що темп випуску патчів і процес виправлення вже не встигають за темпом атак.

Друге, тиск найперше відчує відкрите джерело.

Сьогодні більшість сучасного програмного забезпечення базується на величезній кількості відкритих залежностей. Вони невидимі в звичайній роботі, але, якщо їх буде вразено, це вплине на всю галузь одночасно.

Можливо, деякі читачі не дуже добре розуміють цю логіку — простими словами, всі програми, які ми зараз використовуємо, мають у своїй основі відкриті проекти, код яких доступний для всіх.

У майбутньому, коли моделі зможуть постійно та масштабно сканувати відкриті проекти, тиск, якому піддаються супроводжувачі відкритих спільнот, буде зовсім іншим.

Ось чому Anthropic робить пожертви Фонду Linux та Фонду Apache.

Це не про благодійність, а про визнання того, що відкрите програмне забезпечення — це найвразливіша й найважливіша основа цифрового світу в епоху ШІ, і вони просто не хочуть, щоб їх вважали злими людьми.

Третє, люди будуть ослаблені, а ІІ почне грати з ІІ.

Раніше цінністю команди безпеки інтернет-продуктів були людська суджена, накопичений досвід та глибоке розуміння системи.

У майбутньому ця справа змінить логіку.

Йдеться про те, чий моделі сильніші, чий інструменти швидше підключаються та хто зможе вбудувати AI-аудит у найраніші етапи розробки.

Це не питання заміни програмістів, а те, що виробничі методи безпекової галузі самі по собі будуть перебудовані.

З іншого боку, тисячі критичних уразливостей можна знайти протягом кількох тижнів. Проблема в тому, що атакуючі сторони рано чи пізно отримають такі ж інструменти.

Тоді безпека програмного продукту більше не буде залежати від боротьби між людьми, а стане грою в атаку та захист між моделями.

На цей раз Anthropic не лише представила можливості, а й ризики. Можливо, це саме та щирість, якої галузь найбільше потребує на цьому етапі.

Всі говорять про те, як ШІ змінює ефективність роботи, і це не помилка.

Але Mythos також нагадує, що стрибок здібностей ШІ в кінцевому підсумку пошириться з світу контенту на світ програмного забезпечення, а потім — на інфраструктуру всього цифрового світу.

Світ контенту було переписано, що впливає на логіку трафіку.

Світ програмного забезпечення переписується, торкаючись фундаменту.

Зараз я згадав цитату з фільму «2012», яка стане фіналом цієї статті.

Хто б ти не був, незалежно від раси чи країни, завтра ми всі однакові!