Anthropic зустрічає опір уряду щодо моделі Fable AI

Автор: Бен Томпсон

Переклад: Deep潮 TechFlow

Огляд Shenchao: Нову модель Anthropic Fable було негайно призупинено урядом США через два місяці після запуску — на поверхні через «порушення безпеки», а насправді це розкриває подвійну війну між лабораторіями ШІ, урядом та індустрією програмного забезпечення. Компанія, яка позиціонує себе як «безпечна», перетворює нарратив безпеки на комерційний бар’єр, але її справжнім цільовим об’єктом є користувацькі дані компаній, як Microsoft.

Я розумію позицію тих, хто насміхається, — вони завжди вважають, що публічні заяви Anthropic, особливо ті, що робляться під час запуску моделей, є маркетинговим прийомом для розповсюдження паніки. Два місяці тому Anthropic оголосила про запуск Mythos Preview, стверджуючи, що ця модель занадто небезпечна для публікації, зокрема через її потужні здібності в кібербезпеці. А через два місяці компанія публічно випустила Fable — версію Mythos з різними безпековими обмеженнями.

З моїм обмеженим досвідом використання, Fable дійсно є надзвичайно відмінною моделлю. Зараз, крім програмної продуктивності, важко об’єктивно оцінити моделі, але суб’єктивні враження все ще є — я відчув, що взаємодія з Fable є надзвичайно відмінною; вона робить інші моделі, включаючи GPT 5.5 та Opus 4.8, здаються маленькими та глупими. Раніше я відчував це лише двічі: один раз з GPT-4, і один раз з Grok 4 — обидві вони представляли нове покоління базових моделей за розміром та складністю; я вважаю, що Fable походить з нового попереднього навчання і є першою моделлю нового покоління.

Тому я повністю приймаю, що Fable/Mythos справді краще виявляє та використовує безпекові проблеми, і обережний запуск Anthropic є логічним. Але проблема публічного випуску моделі полягає в тому, що захисні механізми можна обійти — і, ясно, це відбулося всього через декілька днів після випуску.

Anthropic знову стикається з урядом США

Що відбулося далі, трохи невідомо. Anthropic у блоговому пості написала:

Уряд США, посилаючись на повноваження у сфері національної безпеки, випустив указ про експортний контроль, який призупиняє доступ всіх іноземних громадян до Fable 5 та Mythos 5, незалежно від місця перебування, включаючи іноземних співробітників Anthropic. Практичним наслідком цього наказу є те, що ми змушені раптово вимкнути доступ до Fable 5 та Mythos 5 для усіх клієнтів, щоб забезпечити відповідність. Доступ до всіх інших моделей Anthropic не стосується.

Ми отримали наказ від уряду сьогодні о 17:21 за східним часом США. У листі не наведено конкретних деталей щодо занепокоєнь національної безпеки. Ми розуміємо, що уряд вважає, що було знайдено спосіб обійти або «вийти за межі» Fable 5. Ми перевірили демонстрацію використання цієї конкретної технології для виявлення невеликої кількості відомих малих вразливостей. Ці вразливості здаються відносно простими, і ми виявили, що інші публічно доступні моделі також здатні виявляти їх без обходу.

Anthropic далі аргументує, що неуніверсальні втіки є неуникненними та обмеженими за масштабом, і немає доказів наявності універсальних втік; виявлені втіки, схоже, були повідомлені Amazon, що варто зауважити, оскільки Amazon є інвестором Anthropic, а також основним постачальником сервісів висновування компанії. На момент написання цієї статті керівники Anthropic перебували у Вашингтоні, намагаючись вирішити питання, яке вони стверджують є непорозумінням, а представники Білого дому намікають на байдужість керівництва компанії до законних національних безпекових занепокоєнь.

Оскільки існує надто багато спірних фактів, я не маю чого додати до поточного конфлікту; але я не здивований тим, що конфлікт відбувається: я вже пояснив у статті «Anthropic та вирівнювання», що конфлікт між урядом США та Anthropic є неуникненим. У цьому контексті ті, хто вважає, що Mythos ще недостатньо потужний, щоб вартий жорстких дій уряду, пропускають суть: якщо зараз він ще недостатньо потужний, то наступний буде, або навіть наступний після нього, особливо зараз, коли моделі стають все більш корисними у створенні своїх наступників.

Однак це викликає інше питання — питання, яке, здається, підтверджує думку насмішників: якщо Mythos настільки небезпечний, чому взагалі випускати Fable і чому вступати у конфлікт із урядом, щоб зробити те, що ви стверджуєте, що хочете зробити? Насправді, я вважаю, що дії Anthropic зовсім зрозумілі; унікальність компанії полягає в тому, як вона обґрунтовує ці дії — саме ці обґрунтування надають насмішникам паливо, але й надають Anthropic магії.

Економічна необхідність

На початкових етапах розвитку ШІ найбільша економічна вартість потекла до обчислювальних потужностей — причина очевидна: ми не мали достатньо пропозиції, щоб задовольнити попит, що призвело до стрімкого зростання цін; найбільшими отримувачами були NVIDIA, TSMC та виробники пам’яті (SK Hynix, Samsung і Micron). Тим часом Anthropic і OpenAI разом втратили сотні мільярдів доларів на розробці передових моделей, які після публікації були дистильовані та комерціалізовані відкритими моделями, переважно з Китаю.

Це відображає пессимістичний сценарій для лабораторій — вони ніколи не зможуть покрити витрати, оскільки їхня диференціація тимчасова, а безкоштовні альтернативи стають «достатньо хорошими» — я вважаю це обґрунтованим. У світі, де моделі взаємозамінні, моделі стають товарами, а велика частина вартості направляється кудись інше. Зараз це обчислювальні ресурси, але з часом, коли у нас буде достатньо обчислювальних ресурсів, найбільш цінне місце в ланцюжку створення вартості залишиться там, де воно завжди було найціннішим: у володінні точками зв’язку з користувачами.

Тому для передових лабораторій існує економічна необхідність бути ближче до користувачів — це завжди було для мене зрозумілим. Якщо ви володієте точками зв’язку з користувачами, то ви маєте значуще закріплення, а найкращий спосіб володіти точками зв’язку з користувачами — це стати полотном, на якому вони роблять усе необхідне. Це, у свою чергу, означає, що передові лабораторії входять у конфлікт із програмними компаніями: програмне забезпечення володіє точками зв’язку з користувачами, а довгостроковий інтерес передових лабораторій полягає не в тому, щоб просто стати товарним вхідним елементом для програмного забезпечення, а в прямому заміщенні програмного забезпечення.

Тим часом програмні компанії прагнуть робити протилежне. Сатя Наделла в статті на X описав свою ідею того, як компанії повинні будувати на моделях:

Кожна компанія повинна створити людський капітал і токенний капітал, про які я говорив. Людський капітал включає знання, судження, зв’язки, оригінальність та виявлення шаблонів її працівників, а токенний капітал — це здатність компанії будувати та володіти штучним інтелектом. Важливо, що зі зростанням токенного капіталу людський капітал не стає менш цінним. Він стає лише ціннішим! Я вірю, що людська ініціатива буде двигуном зростання токенного капіталу. Люди встановлюватимуть амбітні цілі, з’єднуватимуть точки між різними сферами, будуватимуть зв’язки та виявлятимуть найважливіші шаблони. Без людського керівництва ваші обчислювальні потужності працюють вхолосту.

Це означає, що справжня можливість полягає не у виборі найкращої моделі, а у створенні навчального циклу над моделлю, який дозволяє капіталу людей та токенів зростати складними відсотками. Ви можете делегувати завдання, навіть цілу роботу, але ніколи не можете делегувати своє навчання. Майбутнє компаній полягає у здатності забезпечити, щоб це навчання зростало складними відсотками між людьми та ШІ. Для цього потрібен новий архітектурний підхід, який дозволить кожній компанії будувати системи агентів, що покращуються з часом, зберігаючи при цьому контроль над своєю інтелектуальною власністю. Компанії повинні мати можливість замінювати «універсальні» моделі, не втрачаючи при цьому експертизу «вітряних» працівників, вбудовану в їхні системи навчання. Це ключовий «тест» на контроль та суверенітет у майбутньому.

Наделла розпочав це бачення попередженням:

Ми не хочемо бачити світ, у якому кожна компанія кожного індустріального сектору передає свою вартість декількома моделями, що поглинають все. Якщо вся вартість зосередиться лише в руках декількох моделей, політична економіка просто не зможе це терпіти. Суспільство не дозволить майбутнього, у якому ШІ знищує цілі індустрії.

Подумайте, що сталося на першому етапі глобалізації: вся промислова економіка була вивезена за кордон. На поверхні цифри ВВП виглядали добре, але втрати робочих місць були реальними, і наслідки цього до сьогодні відчуваються. Давайте не переноситимемо цю динаміку в епоху ШІ, коли кілька систем ШІ захоплюють усі економічні вигоди, а цілі галузі виявляють, що їхні знання були комерціалізовані прямо перед їхніми очима.

Проблема цієї аналогії полягає в тому, що глобалізація дійсно відбулася, а промислові економіки дійсно були опорожнені. Це може бути не попередженням, а пророцтвом; не дивно, що Наделла попереджає, оскільки Microsoft може бути одним із постраждалих. Аналогічно, економічна необхідність виробників моделей саме в тому, щоб досягти цього.

Необхідність даних

Ці моделі — навіть Mythos — ще не дійшли до цього етапу. Їм потрібно не лише більше обчислювальних потужностей, а й більше кращих даних. Покращення моделей все частіше походить із підсиленого навчання; деякі з них можуть бути синтезовані, але найпотужнішим важелем для передових лабораторій є використання у реальному світі.

Я вважаю, що саме це є основною причиною, чому OpenAI та Anthropic пропонують значні субсидовані підписки. SemiAnalysis недавно оцінив, що план за 200 доларів дає вам доступ до Claude-токенів на вартість 8000 доларів та Codex-токенів на вартість 14000 доларів. Звичайно, обидві компанії борються за частку усвідомленості користувачів і розробників, але також борються за доступ до даних про реальне використання для покращення моделей.

Anthropic значно посилює свої зусилля на Fable, оголосивши, що зберігатимуть усі використані дані протягом 30 днів, навіть для корпоративних планів, які раніше обіцяли нульове зберігання даних. Компанія стверджує, що не використовуватиме ці дані для навчання, але не встановила жодних гарантій, щоб забезпечити, що в майбутньому цього не станеться (наприклад, зберігання даних у третіх осіб). Якщо ця зміна політики (коли Fable знову увімкнеться) не призведе до масового відтоку клієнтів, я сумніваюся, що використання даних — це лише питання часу: це надто цінно для їхньої кінцевої мети.

Також зверніть увагу на позитивний цикл з підйомом до точок зіткнення з користувачем: чим більше робочих процесів виконується безпосередньо за допомогою Claude або Codex, тим більше даних отримує кожна компанія для зворотного зв’язку в навчанні, що робить їхні продукти потужнішими та кориснішими, розширює кількість робочих процесів, які вони можуть обслуговувати, і збільшує доступ до даних.

Надела підкреслив важливість цих даних, але Натур вважає, що вони повинні бути незалежними від моделі:

Компанії потрібно перетворити робочі процеси, галузеві знання та накопичені судження на систему ШІ, яка покращується з кожним використанням. Приватні оцінки повинні фіксувати, чи дійсно модель покращує результати, що мають значення для бізнесу (не лише зовнішній бенчмарки!). Приватне середовище підсиленого навчання має робити модель сильнішою на основі реальних траєкторій всередині організації. Її база знань робить інституційну пам’ять запитуваною та ефективнішою щодо використання токенів.

Цей цикл став новою інтелектуальною власністю компанії. Я сприймаю його як гірську машину. На відміну від більшості активів, він є складним. Кожне вдосконалення робочого процесу генерує кращі тренувальні сигнали, що прискорює накопичення неявних знань, власних для компанії. Компанії, які рано створили це, матимуть важко відтворювану перевагу, незалежно від будь-яких нових можливостей окремих моделей.

Цей цикл став новим інтелектуальним активом компанії. Я сприймаю його як машину для підйому вгору. На відміну від більшості активів, він здатний до складного зростання. Кожне вдосконалення робочого процесу генерує кращі сигнали для навчання, прискорюючи накопичення неявних знань, власних для компанії. Компанії, які рано розроблять цю здатність, отримають важко відтворювану перевагу, незалежно від того, наскільки зростатиме здатність окремих моделей у майбутньому.

Однак що, якщо компанії, які дотримуються політики даних Anthropic, зараз можуть отримувати кращі результати? Або що, якщо існуючі компанії чинять опір, залишаючи можливість для нових компаній — або навіть самих виробників моделей — перемогти їх на ринку? Anthropic дійсно перевіряє вирішучість, закликану Наделлою.

Піднесення вимог до влади

Щодо політики зберігання даних Fable/Mythos, це навіть не найбільш суперечлива частина публікації. Навпаки, Anthropic заявила при публікації, що якщо Fable використовуватиметься для розробки LLM, то її продуктивність буде тихо знижена; у системній картці зазначено:

Ми також додали заходи захисту, пов’язані з передовим розробленням великих мовних моделей. Як обговорювалося в розділі 6.1 нашого звіту про ризики за лютого 2026 року, ми стурбовані ризиком прискорення загального темпу розвитку ШІ, хоча ступінь серйозності цих ризиків залишається невизначеним. Зокрема, наша стурбованість полягає — як ми писали тоді — у «прискоренні розробки іншими розробниками ШІ потужних ШІ-систем, подібних до нашої, але без відповідних заходів захисту».

У зв’язку з тим, що останні моделі здатні прискорювати власний розвиток, ми впровадили нові заходи, щоб обмежити ефективність Claude при запитах, пов’язаних із розробкою передових LLM (наприклад, створення пайплайну попереднього навчання, інфраструктури розподіленого навчання або проектування ML-прискорювачів). Вже раніше використання Claude для розробки конкурентних моделей порушувало наші умови надання послуг, але за допомогою захисних заходів ми змогли забезпечити виконання цього обмеження та запобігти прискоренню діяльності тих, хто найбільш готовий порушувати ці умови.

На відміну від наших втручань у сфері кібербезпеки, біохімії та дистиляції, ці захистні заходи є невидимими для користувачів. Fable 5 не буде відкатуватися до іншої моделі. Натомість ефективність буде обмежена за допомогою методів, таких як зміна підказок, наведення векторів або ефективна тонка настройка параметрів (PEFT). Ці втручання не впливатимуть на більшість програмних завдань. Ми оцінюємо, що вони вплинуть приблизно на 0,03% трафіку, зосередженого в менш ніж 0,1% організацій. Коли ці заходи вступлять у дію, ми очікуємо, що вони майже не вплинуть на поведінку моделі, крім обмеження її ефективності у розробці передових LLM. Claude все ще надаватиме корисні відповіді на запити користувачів. Ми продовжимо покращувати точність методів виявлення після запуску цієї моделі.

Anthropic відмінила цю зміну — Fable буде передавати запити, пов’язані з LLM, Opus 4.8, і повідомляти користувачів про таке передавання — але я вважаю, що початкова політика була дуже інформативною. З одного боку, я насправді не звинувачую Anthropic у бажанні не допомагати конкурентам; з іншого боку, має бути дуже ясно, що Anthropic вважає, що ніхто, крім них самих, не повинен створювати передові LLM.

Ще більш захоплюючим є те, що ця політика була прийнята лише через два місяці після суперечки між Anthropic і Міністерством війни: останнє хотіло використовувати Claude для будь-яких законних цілей, тоді як перше прагнуло встановити більш суворий контроль над спостереженням та автономними зброєю. Ця зниження позиції відображає як здатність Anthropic таємно змінювати свої моделі для реалізації своїх політичних уподобань, так і її готовність до цього. Іншими словами, Anthropic активно підтвердила найбільші занепокоєння критиків щодо того, що вона є ризиком для ланцюга поставок.

Однак більш загальний висновок, зроблений з цієї події, полягає в тому, що Anthropic вважає, що вони повинні мати остаточний контроль над використанням Anthropic; враховуючи їхню думку, що лише вони повинні розробляти передові ШІ, вони фактично вважають, що лише вони повинні мати остаточний контроль над ШІ загалом. Коли ви поєднуєте це розуміння з заявою компанії про те, що ШІ здатний здійснювати всі економічні дії, ви розумієте, що лідерство Anthropic фактично бажає мати владу над усім і всіма.

Безпечний сценарій

Звичайно, Anthropic ніколи не висловлюватиме це так прямо; натомість історія стосується безпеки:

Я передбачаю, що Anthropic все частіше буде відкривати можливості своїх моделей для кінцевих користувачів через все більш спеціалізовані для різних робочих процесів ендпоінти, навіть коли почне обмежувати API. Така заміна програмного забезпечення та обмеження доступу будуть здійснюватися на підставі безпеки, навіть якщо Anthropic виконує свої економічні потреби, спрямовані на кінцевих користувачів.

Антропік пояснює свої значні зміни в політиці зберігання даних безпекою. Зокрема, компанія стверджує, що зберігання всіх даних користувачів протягом 30 днів необхідне для запобігання втікам, які викликають занепокоєння уряду США. Я, звичайно, можу уявити майбутнє, коли міркування безпеки змусять їх також використовувати ці дані для навчання, щоб краще захищатися від зловживань.

Вся історія виникнення Anthropic ґрунтується на переконанні засновників, що OpenAI недостатньо серйозно ставиться безпеці; компанія вважає, що лише вона може контролювати ШІ, і через те, що вона унікально турбується про безпеку, вона має підстави намагатися контролювати всіх інших, включаючи уряд США.

Щодо цих причин безпеки, проблема полягає в тому, що я вважаю їх дійсними, бо для Anthropic вони не є причинами. Компанія справді вірить, що вона є єдиною, хто вірить у суперінтелект, і тому єдиною, хто належним чином ставиться до небезпек. Це оправдовує одне рішення за іншим, одну політику за іншою, один конфлікт за іншим — для зовнішніх спостерігачів це виглядає як дивна комбінація цинізму та наївності.

Велика різниця порівняно з OpenAI: на мою думку, один із способів зрозуміти, як і чому OpenAI втратила лідерство, полягає в тому, що протягом кількох років після запуску ChatGPT компанія перебувала в стані внутрішнього конфлікту, коли колишній дослідницький лабораторії раптово була завантажена обов’язками випадкової споживчої технологічної компанії; під час вирішення цього конфлікту OpenAI втратила велику кількість талантів на користь таких компаній, як Anthropic.

З іншого боку, Anthropic має ідеальну згідність між талантом, місією та бізнесом. Компанія може продавати дослідникам ідею створення машинного бога, оточену аурою людей, які турбуються про небезпеки і достатньо розумні, щоб представляти інтереси людства у вирішенні цих небезпек; а кожна з виниклих політичних змін випадково вигідна для бізнесу — це найчарівніша з усіх збігів у світі.

Я поважаю цю послідовність і одночасно боюся її. Я поважаю її, бо вона очевидно дуже ефективна; найближчим аналогом може бути Apple, яка завжди прикриває кожен егоїстичний крок ідеєю, що робить для користувачів правильну річ — і часто це дійсно так. Anthropic діє так само. Однак мене тривожить те, що дозволити тим, хто переконаний, що найкраще розуміє, створювати смартфон, який я можу прийняти чи відхилити, — це одне; але дозволити їм створювати надінтелект, здатний порівнятися з владою національних держав або навіть великих корпорацій — це набагато більш тривожна справа. Історія розумних людей, які були переконані, що знають, чого потребує людство, — брудна, саме тому, що вони переконали себе, що їхні наміри добрі, і таким чином обґрунтували дії, які насправді такими не були.