В конечном итоге, тому, чему мы учим модель, то же самое, чему мы учим детей.

Автор статьи, источник: Machine Learning China

Многие говорят, что во времена ИИ вкус — это последняя защитная линия человечества. Но Борис Черни так не считает.

Он является членом технической команды Anthropic и одним из ключевых разработчиков Claude Code. Каждый день он пишет код с помощью модели и использует модель для изучения моделей. Тенденция, которую он наблюдает: так называемый «вкус» также быстро осваивается моделями.

Если даже «что делать» может быть освоено моделью, то что же остается у человека?

В недавнем интервью Борис обсудил эту тему.

Как Claude Code фундаментально меняет корпоративные системы;

Когда модели могут писать подавляющее большинство кода, стоит ли нанимать инженеров? Если да, то на что следует обращать внимание?

Почему внутри Anthropic многие являются Member of Technical Staff, без четких уровней и разделения обязанностей?

Противоречащий интуиции совет всем предпринимателям: почему «нанимайте меньше людей, но давайте больше токенов»?

……

Эти вопросы на поверхности касаются рождения и итераций продукта, но каждый уровень ответов указывает на одно и то же более фундаментальное изменение: способ функционирования организации перedefинируется самой моделью.

А ответ Бориса заслуживает спокойного размышления.

Как появился Claude Code?

Когда ведущий спросил о происхождении Boris Claude Code, его ответ был несколько неожиданным.

В его рассказе Claude Code не был изначально запланированным ключевым продуктом Anthropic и даже можно сказать, что он стал случайным результатом.

В конце 2024 года Борис присоединился к команде Labs в Anthropic. Задача этой команды — не поддерживать существующие продукты, а исследовать будущие формы продуктов. С одной стороны, они постоянно расширяют границы возможностей моделей; с другой — ищут новые продукты, способные по-настоящему раскрыть эти возможности.

В тот момент команда испытывала очень сильное ощущение: модель уже обладала возможностями, значительно превосходящими существующие продукты, но на рынке ещё не появилось продуктов, способных полностью использовать эти возможности. Особенно это касалось области программирования.

В то время большинство инструментов ИИ для программирования на рынке были ограничены двумя направлениями: одно — автодополнение, помогающее разработчикам завершить следующую строку кода; другое — помощник с вопросами и ответами, где разработчики могли спрашивать о значении определенного фрагмента кода или решении ошибки. Но Борис считал, что настоящего Coding Agent в то время еще не существовало.

Тогда команда решила сделать более смелый эксперимент: вместо того чтобы использовать модель в качестве вспомогательного инструмента, они превратили её непосредственно в основу разработки. Они хотели узнать, что произойдет, если создать программный продукт, полностью построенный вокруг агента, с нуля.

Однако Борис также откровенно признал, что изначальная версия Claude Code была неудобной.

В течение длительного времени он мог выполнять только около 10–20% его работы. Большая часть кода всё ещё требовала его личного написания. Claude Code, который люди видят сегодня, — это совершенно другая вещь по сравнению с продуктом того периода.

Почему Anthropic уделяет такое внимание кодированию?

Многие считают, что причина, по которой Anthropic уделяет внимание программированию, проста — рынок программирования достаточно велик и имеет высокую коммерческую ценность. Но Борис дает совершенно иное объяснение.

Он сказал, что если случайно остановить любого сотрудника в офисе Anthropic и спросить, почему он здесь, скорее всего, ответ будет один и тот же: AI Safety.

По мнению Бориса, самой важной миссией Anthropic с момента основания всегда была безопасность ИИ. Будь то исследования по интерпретируемости, исследования по согласованию или другие направления безопасности, все они в сущности стремятся понять поведение моделей. Однако все эти исследования в конечном итоге сталкиваются с одной и той же проблемой: просто наблюдать за моделями в лаборатории недостаточно — исследователи должны также наблюдать, что происходит с моделями после их выхода в реальный мир.

А Coding как раз является почти идеальным полем для экспериментов.

В отличие от письма, рисования или других открытых задач, программирование обладает чрезвычайно четким механизмом обратной связи. Код работает или не работает, программа проходит тесты или не проходит, компиляция успешна или неудачна — ответы часто однозначны. В то же время интернет предоставляет огромное количество кода в качестве обучающих данных. По сравнению с задачами, такими как написание стихов, где может существовать бесчисленное множество отличных решений, пространство правильных решений в программировании гораздо более сходится, что делает его легче для проверки способностей модели.

Поэтому Anthropic с самого начала уделяла большое внимание таким направлениям, как кодирование, использование инструментов и работа с компьютером. Эти направления не только обладают коммерческой ценностью, но и, что важнее, предоставляют естественную экспериментальную среду для изучения того, как модели взаимодействуют с реальным миром.

С этой точки зрения Claude Code никогда не был просто инструментом для повышения производительности программистов. В повествовании Бориса он также служит важной экспериментальной платформой Anthropic для понимания будущих ИИ-систем.

Почему Claude Code внезапно стал сильнее?

После представления происхождения Claude Code ведущий задал вопрос, который интересует многих: если в начале Claude Code мог выполнять лишь около 10–20% работы Бориса, то что же произошло дальше? Ведь сегодня Борис открыто заявил, что не писал код собственноручно уже полгода. Между тем, как способность выполнять лишь небольшую часть задач и полное принятие на себя разработки, произошли огромные изменения.

На этот вопрос ответ Бориса оказался неожиданно простым. Он сказал, что внешние наблюдатели часто сосредотачиваются на функциях продукта, но если он вспоминает моменты, действительно принесшие скачок в возможностях, то главная причина всегда одна: модель стала сильнее.

За последний год команда Anthropic действительно постоянно улучшала сам Claude Code. Они проделали огромную инженерную работу, добавив различные новые способы взаимодействия и формы продукта. Изначально Claude Code был всего лишь инструментом командной строки, затем постепенно расширившись до настольных, мобильных приложений, Slack, GitHub и других сценариев. Команда также постоянно экспериментировала с новыми функциями, такими как режим планирования (Plan Mode) и другие механизмы, помогающие разработчикам взаимодействовать с агентом. Но, по мнению Бориса, все это является приращением.

Фактическим ограничением для Claude Code является сама базовая модель.

Он упомянул несколько ключевых этапов: от Sonnet 4 и Opus 4 до последующего Opus 4.5 — каждое повышение возможностей модели напрямую отражалось на производительности Claude Code.

Затем ведущий спросил, повлияет ли опыт использования Claude Code на разработку модели. Ответ Бориса был следующим: внутри Anthropic практически все ежедневно используют Claude Code — как разработчики модели, так и создатели продуктов… Вся компания его использует.

Следовательно, специального канала для обратной связи не существует. Обратная связь сама по себе является частью повседневной работы компании.

Когда исследователи обнаруживают проблемы в процессе использования, команда модели сразу же видит эти проблемы; после улучшения возможностей модели все сразу ощущают изменения в реальной работе. Продукт и модель — это не две параллельные линии, а единый цикл совместной эволюции.

На сколько Claude Code повысил производительность Anthropic?

Борис говорит, что после долгой работы в лаборатории ИИ люди привыкают мыслить в терминах экспоненциального роста. Многие внутренние показатели — будь то доход, объем использования или способности модели — выглядят как экспоненциальные кривые, поэтому они даже привыкли использовать логарифмическую шкалу для наблюдения за изменениями.

Также наблюдается аналогичная тенденция в выводе кода.

Согласно данным, ранее опубликованным Anthropic, после широкого внедрения Claude Code внутри компании объем кода, создаваемого каждым инженером, увеличился примерно в три раза. Однако Борис особо подчеркнул, что эти данные уже устарели. Фактический рост значительно превышает это число.

Более интересно то, что этот рост произошел на фоне быстрого расширения масштабов компании.

Согласно традиционному опыту, чем больше инженеров в компании, тем ниже средняя производительность. Новые сотрудники должны изучать систему, а опытные сотрудники должны отвечать на вопросы, что приводит к постоянному росту затрат на организационную коммуникацию.

Но Борис наблюдает обратную ситуацию: раньше новому инженеру могло потребоваться несколько недель, чтобы действительно освоить внутренние системы, а теперь этот процесс часто занимает всего два дня.

Причина не в революционных изменениях в системе обучения, а в том, что люди уже привыкли сразу спрашивать у Claude. Новым сотрудникам не нужно знать, как запрашивать базу данных. Им даже не нужно знать, к кому обращаться. В Anthropic, когда кто-то спрашивает «как запросить базу данных», часто отвечают: «Откройте Claude и попросите Claude запросить базу данных». Многие скрытые знания, которые раньше требовались от опытных инженеров, начинают передаваться агентам. По мнению Бориса, это, возможно, и есть самое важное изменение.

Claude Code повышает не только скорость генерации кода, но и постепенно снижает стоимость передачи знаний внутри организаций. Раньше компании полагались на иерархическую передачу знаний от опытных к новичкам. Сейчас всё больше знаний напрямую инкапсулируются в модели.

От перфокарт до Vibe Coding человечество снова подняло уровень абстракции программирования

Поскольку Claude Code такой мощный, то инженеры, недавно принятые Anthropic, всё ещё пишут код? Когда ведущий задал этот вопрос, фокус обсуждения сразу сместился на: как вы определяете «написание кода»?

По мнению Бориса, история развития программной инженерии по сути является историей постоянного повышения уровней абстракции.

Его дедушка программировал с помощью перфокарт в советские времена. В ту эпоху программисты должны были просверливать отверстия на бумажных картах, а затем отправлять их в компьютер и ждать результатов. Позже появился ассемблер, затем — Fortran и COBOL, за ними — Java, Python и JavaScript. Каждый повышение уровня абстракции вызывало мнение: «Это уже не настоящее программирование». Программисты на ассемблере презирали тех, кто писал на языках высокого уровня, а те, кто писал на C, считали Python слишком простым. Но Борис считает, что сегодняшние события по сути ничем не отличаются: человечество снова повысило уровень абстракции в программировании.

Он описал изменения в своей работе за прошедший год. Изначально он, как и большинство разработчиков: открывал IDE, писал код и иногда использовал автозаполнение — это традиционный подход к разработке программного обеспечения.

После появления Claude Code его подход изменился на следующий: описывать требования Claude, заставлять Claude писать код и самостоятельно проверять и исправлять его. На этом этапе человек по-прежнему напрямую управляет моделью — только код генерируется моделью. Однако Борис считает, что это всего лишь переходный этап.

Самые интересные изменения произошли недавно. Он говорит: «Сейчас я даже не пишу промпты для Claude напрямую». Его работа приняла другую форму. Он пишет различные автоматизированные процессы и циклы, которые отвечают за постановку вопросов Claude, разбиение задач, управление контекстом и координацию работы нескольких экземпляров Claude.

Другими словами: раньше человек давал инструкции Claude. Теперь программы дают эти инструкции от его имени. Его работа превратилась в создание этих автоматизированных систем. Он кратко резюмировал это одной фразой: моя работа теперь — писать Loops.

Похоже, Борис не просто передал код на аутсорс Клауду, а автоматизировал сам процесс взаимодействия с Клаудом. Это уже не та знакомая всем модель Copilot. Это скорее система, в которой несколько агентов работают непрерывно.

Борис упомянул, что в ноябре прошлого года он даже удалил свою IDE. Причина была не символической демонстрацией, а тем, что он обнаружил, что не открывал IDE уже целый месяц. Поскольку он полностью не использовал её, логично было удалить. В то время он обычно запускал пять-десять экземпляров Claude одновременно, причём разные экземпляры Claude выполняли разные задачи, а он в основном контролировал весь процесс.

Инженеры перестали писать код — на что обращать внимание при найме?

В этот момент ведущий задал интересный вопрос: если сегодня инженер хочет присоединиться к Anthropic, как Anthropic будет его оценивать? Или другими словами: в мире, где все меньше людей пишут код вручную, какие именно люди нужны компаниям?

Ответ Бориса почти напрямую привел к последующему обсуждению организационной структуры. Он сказал, что наиболее любимым типом людей командой Claude Code являются: Generalist (универсалы).

Причина проста: в прошлом программные организации имели четкое разделение труда — исследователи пользователей занимались пониманием пользователей, дизайнеры — проектированием продуктов, менеджеры продуктов — планированием требований, инженеры — реализацией функций, и каждый работал в своей сфере, как на конвейере.

Однако команда Claude Code обнаружила за последние полгода, что такое разделение труда быстро разрушается. Каждый инженер в команде почти ежедневно выполняет самые разные задачи, которые ранее не входили в обязанности «инженера». Кто-то напрямую общается с пользователями, кто-то занимается дизайном интерфейса, кто-то собирает данные, проводит анализ и создает дашборды. Никто не ограничивается узким участком работы.

Борис привёл ещё более крайний пример: дизайнеры Anthropic тоже пишут код, и финансовые коллеги тоже пишут код. Сатья Наделла называет такую роль «Builder». Этот термин может быть точнее, чем «инженер», потому что настоящая граница теперь не в том, «умеешь ли ты писать код», а в том, «сможешь ли ты превратить идею в реальность».

С точки зрения Бориса, ИИ не просто заменяет программистов — он по-настоящему меняет отношения между знаниями и исполнением. Раньше человек не мог одновременно выполнять несколько ролей в основном из-за слишком высокой стоимости обучения. Сейчас модели постоянно снижают стоимость перехода между этими навыками. Поэтому в будущем самыми преимущественными будут не те, кто является самым глубоким экспертом в одной области, а те, кто может быстро переходить между различными областями и постоянно интегрировать ресурсы.

Вот почему Борис считает: мы вступаем в золотой век генералистов. Для тех, кто готов заниматься многим, сейчас, возможно, лучшее время в истории.

Member of Technical Staff — это не рекламный ход, а предварительный просмотр будущего

Ведущий перевел разговор от продукта к культуре и организационному дизайну. Он заметил, что у Бориса звание не «директор по продукту» или «директор по инженерии», а Member of Technical Staff, и что во многих случаях у сотрудников Anthropic такое же звание. Он хотел узнать: какие преимущества это дает? Есть ли недостатки?

Борис очень откровенен. Он сказал, что худшее в этом — это когда ты пишешь сообщение человеку в Slack, у которого титул MTS, и ты совершенно не знаешь, является ли он дизайнером, инженером или менеджером, и над каким проектом он вообще работает. Но он очень любит этот титул.

Он вспоминает свой опыт работы в Meta. Все программисты в Meta имели только одну должность: Software Engineer, без иерархии вроде senior или principal. Сначала он не понимал этого, но позже понял, что это было культурным решением. Если дать человеку звание «старшего», другие будут стесняться оспаривать его плохие идеи из-за deference (вежливого подчинения). А когда всех помещают в равные условия, это заставляет людей конкурировать не за стаж, а за качество своих идей.

Конечно, он признает, что ранг не исчезает просто потому, что титул убран. Вы знаете, что человек — L7, просто титул не указан. Но интересно то, что часто вы действительно не знаете.

Он рассказал историю о том, как работал инженером уровня L4 в Facebook. У него появилась идея, и он напрямую обратился к вице-президенту, отвечающему за подключение, и сказал: «Вот моя идея, давайте сделаем это вместе». Этот вице-президент даже не знал, какого он уровня. Он обратился к другому вице-президенту — и снова неудача. В третий раз — успех. Они собрали команду и начали разрабатывать продукт.

Борис говорит, что сейчас в команде Claude Code он каждый день видит одно и то же: опытные инженеры с 20–30 лет стажа вынуждены тратить месяцы на то, чтобы «перестать учиться» — отказаться от устаревших привычек, которые больше не работают. А недавно окончивший университет студент, наоборот, может научить его, как лучше использовать Claude Code, потому что молодежь естественно мыслит в терминах модели.

Каждый раз, когда появляется новая модель, всем нужно заново калиброваться. Опыт в эту эпоху не накапливается линейно, а иногда даже становится бременем.

Таким образом, расплывчатая должность «Member of Technical Staff», по мнению Бориса, является предвосхищением надвигающейся реальности: к концу года границы между инженерами, менеджерами продуктов, дизайнерами и исследователями пользователей практически исчезнут. Вместо того чтобы пассивно принимать это изменение, лучше активно объединить всех под одной должностью — Builder.

Совет всем основателям: нанимайте меньше людей, выпускайте больше токенов

Ведущий просит Бориса дать более общие рекомендации основателям и компаниям с точки зрения Anthropic: как следует изменить мышление до конца 2026 года?

Первые слова Бориса прозвучали с юмором: «Дайте всем как можно больше токенов». Как знаменитая фраза Хуэна Нюна: «Чем больше вы покупаете, тем больше экономите».

Это не шутка. Он серьезен. Его конкретные рекомендации касаются двух вещей:

Во-первых, давайте как можно больше токенов, чтобы все могли безумно экспериментировать.

Во-вторых, каждому проекту намеренно «выделяют немного людей». Если вы считаете, что проекту нужны четыре инженера, назначьте только двух и дайте им большое количество токенов, чтобы они сами нашли решение. Вы обнаружите, что они, скорее всего, действительно справятся. Они автоматизируют всё, что можно автоматизировать, и благодаря автоматизации следующие задачи будут выполняться быстрее и дешевле. Это эффект сложного процента.

Ведущий кратко резюмировал это предложение: использовать меньше людей и перевести бюджет с зарплат на токены. Это увеличит ваши первоначальные затраты, но значительно снизит постоянные расходы. Как предварительная компиляция — вы однажды выполняете всю тяжелую работу, и каждый последующий запуск становится почти бесплатным.

Борис полностью согласен. Ведущий задал более острый вопрос: раньше люди очень гордились своей дисциплиной (профессиональной областью). PM гордились написанными ими продуктами, дизайнеры — своими безупречными портфолио. Неужели за 12 месяцев все должны отказаться от идентичности «я — кто-то» и превратиться в «гибкий мешок, потребляющий токены»?

Борис сказал: «Я мог бы использовать немного другие формулировки, но… да, примерно так и есть».

Вкус также будет разъеден моделью? В итоге останется только «ценности»

Ведущий упомянул тему, которую ранее обсуждал с другим участником Anthropic, Джаредом, и хотел бы услышать мнение Бориса: как вы понимаете «вкус»?

Ответ Бориса был очень искренним. Он сказал, что каждый раз, когда он чувствовал, что у него есть «особый вкус» в программировании, это в итоге оказывалось ошибкой.

Он раньше очень любил функциональное программирование, такие языки, как Haskell и Scala. В ранней версии кодовой базы Claude Code он установил правило: нельзя использовать class, только function. Инженеры в выходные тайно отправляли коммиты с class, а по понедельникам он их отклонял. Позже модель начала писать код в большом масштабе и прямо писала class. Он долго смотрел на это, а затем сказал: ладно, возможно, модель права. Моя приверженность, возможно, вообще не имела смысла — бизнес-результат достигнут, быстрее, и код не хуже.

Затем он сделал более смелое предположение. Сейчас все говорят: «Вкус продукта — последний альфа». Но он считает, что этот альфа тоже быстро исчезает.

Сейчас у него одновременно запущено несколько сотен экземпляров Claude. Некоторые из них скроллят Twitter и собирают обратную связь, другие анализируют GitHub issues, третьи следят за Slack, а затем самостоятельно определяют, какие функции следует реализовать на следующем этапе. Пока большинство идей плохие — примерно 20% хорошие. Но через следующую модель, через 3–6 месяцев — большинство идей, вероятно, будут хорошими.

Ведущий задает дополнительный вопрос: А что же тогда остается уникальным у людей? Есть ли что-то, что модель никогда не сможет сделать?

Борис подумал и сказал: «Ценности».

Он сказал, что в конечном итоге мы учим модель тому же самому, чему учим детей: как быть хорошим существом. Как делать правильные вещи, а не просто правильно делать вещи.