Anthropic призывает глобальные лаборатории ИИ замедлить разработку из-за рисков самоусовершенствования

Anthropic заявила, что мир должен иметь возможность замедлить или временно приостановить развитие передовых ИИ, если ведущие ИИ-лаборатории и правительства смогут создать достоверный способ проверки соблюдения всеми участниками.

В новом отчете Института Anthropic компания заявила, что пауза может дать регуляторам, исследователям и гражданскому обществу больше времени для решения рисков, связанных с все более способными ИИ-системами. Однако компания предупредила, что замедление улучшит безопасность только в том случае, если оно будет применяться одновременно в нескольких хорошо финансируемых лабораториях на передовой или рядом с ней.

Anthropic заявила, что односторонняя приостановка одной компанией была бы проще в реализации, но значительно менее эффективна, поскольку это просто передало бы лидерство менее осторожным участникам. Компания отметила, что любая значимая приостановка потребует, чтобы разработчики в нескольких странах остановили работу при одинаковых условиях и подтвердили, что конкуренты также прекратили деятельность.

Предупреждение поступает на фоне заявления Anthropic о том, что ИИ-системы уже ускоряют разработку новых ИИ-моделей. По состоянию на май 2026 года более 80% кода, включенного в кодовую базу Anthropic, было написано Claude, по сравнению с низкими единицами процентов до запуска Claude Code в исследовательском превью в феврале 2025 года.

Компания сообщила, что типичный инженер Anthropic сливал в восемь раз больше кода в день во втором квартале 2026 года, чем в 2024 году. Внутренний опрос в марте 2026 года также показал, что исследователи, использующие Mythos Preview, оценили, что их объем вывода примерно в четыре раза выше, чем без использования моделей ИИ.

Anthropic заявила, что этот рост указывает на более широкий сдвиг в том, как создаются передовые ИИ-системы. Человеческие инженеры и исследователи по-прежнему ставят цели, проверяют результаты и определяют, какие проблемы важны, но Claude берет на себя большую часть работы по выполнению — в области программирования, тестирования, отладки и оптимизации экспериментов.

Компания описала эту тенденцию как первый шаг к рекурсивному самоусовершенствованию — сценарию, при котором системы ИИ станут способны автономно проектировать и разрабатывать собственных преемников. Anthropic заявила, что такая система пока не существует и не является неизбежной, но предупредила, что она может появиться раньше, чем большинство институтов готовы к этому.

Если это произойдет, Anthropic заявила, что темпы развития ИИ могут стать более напрямую связанными с доступностью вычислительных ресурсов и повышением эффективности, в то время как люди перейдут к контролю, проверке и верификации. Это сделает системы, используемые для мониторинга развития передовых ИИ-моделей, еще более важными, особенно если ИИ-модели начнут играть более значительную роль в создании будущих версий самих себя.

Anthropic отметила, что проблема заключается в том, что проверка приостановки развития ИИ сложнее, чем мониторинг многих других технологий. Обучение можно скрыть, его входные данные имеют универсальное назначение, а стимул тайно нарушить соглашение будет огромным, если один участник сможет получить преимущество, пока другие остановятся.

Компания заявила, что достоверная пауза потребует четких правил, определяющих, что ее запускает, что ее завершает, и кто решает, были ли выполнены условия. Она сравнила эту задачу с режимами контроля над вооружениями для других сложных технологий, отметив при этом, что на создание таких систем ушли десятилетия, и ИИ может не оставить правительствам столько времени.

Anthropic заявила, что планирует в ближайшие месяцы провести диалоги с политиками, исследователями, гражданским обществом и другими компаниями в области ИИ, чтобы изучить рекурсивное самоусовершенствование и возможные механизмы координации для развития передовых ИИ.

Компания заявила, что ожидает замедления или временной приостановки разработки, если другие разработчики передовых технологий также сделают это проверяемым образом.