Как использовать динамические рабочие процессы Claude для глубокого исследования

За эти три года я уже не могу обойтись без использования ИИ для отраслевых исследований, поэтому создал целый ряд навыков и вспомогательных систем для решения задач фильтрации, обобщения, связывания, проверки и накопления информации.

Только после того, как на этой неделе глубоко познакомился с динамическим рабочим процессом Claude Code, я по-настоящему понял смысл фразы: «Не стоит противостоять большой эпохе».

Еще раз подумайте: что именно следует изучать глубоко человеку в эпоху ИИ и как построить сотрудничество и дополнение между мной и ИИ.

Один. Начнем с ловушек исследования

Проведение технического исследования на самом деле полон ловушек (как для людей, так и для ИИ), ведь с самого начала исследования поступает огромное количество информации, мнений становится все больше, а выводы — все более расплывчатыми. Поэтому важно постоянно возвращаться к самой цели.

Вот почему ИИ до сих пор недостаточно совершенен: с точки зрения внимания и ассоциаций, он более скован текущим объемом информации и слабо способен к действительно ценным междисциплинарным ассоциациям.

Тем не менее, сильной стороной ИИ является его исполнительная способность: он может последовательно искать, обобщать и суммировать информацию в виде агентов, полностью избегая потерь деталей.

Хотя я почти не публиковал материалы в официальном канале последние полгода, я всесторонне отслеживаю и изучаю все основные направления отрасли, а основой для этого ввода и вывода является моя собственная система глубокого исследования.

А учитывая, что на прошлой неделе Claude Code запустил функцию Dynamic Workflows, я хочу провести соревнование, чтобы проверить, сможет ли его базовая производительность полностью превзойти мою.

Что такое Dynamic Workflows

Динамические рабочие процессы (Dynamic Workflows) основаны на идее: перед выполнением задачи AI автоматически разрабатывает оптимальный рабочий процесс для её выполнения, а затем запускает его.

Это принципиально отличается от ранее использовавшихся нами «режима планирования» и «навыков». Режим планирования разбивает задачи на более мелкие части, но не обязательно соответствует какой-либо рациональной рабочей процедуре; показатели приемки могут быть добавлены только в зависимости от того, как вы структурируете свои подсказки (это критически важно для исследований). Аналогично, он сможет лучше предустановить некоторые правила проверки только в том случае, если у вас есть подсказки.

Но динамический рабочий процесс автоматически включает в себя логику приемки, сходимость результатов и контрольную проверку.

Способ активации прост: просто используйте /deep-research в cc, затем предоставьте несколько шаблонов исследования и входных материалов. Если вы хотите использовать возможности динамического рабочего процесса отдельно, используйте подсказку или просто скажите ultracode. Перед использованием обратите внимание: потребление токенов примерно в десятки раз выше обычного.

Три: шесть встроенных режимов рабочих процессов

В основе динамического рабочего процесса лежат шесть основных режимов планирования, официально определенных командой, именно поэтому он мощнее обычных диалогов/агентов/навыков.

На самом деле за этими шестью режимами стоят только две ключевые проблемы: как разбить задачу и как объединить результат? Разделение на шесть режимов — это просто различные комбинации этих двух аспектов.

3.1 Режим маршрутизации (Classify-And-Act)

Сначала агент определяет тип задачи, а затем передает ее наиболее подходящему специализированному агенту. Основная логика — это выбор маршрута, а не параллельное или итеративное выполнение. Каждая задача проходит только по одному пути, остальные пути полностью не выполняются.

Например, я могу сначала задать три предустановленных подагента: агент анализа, строго проверяющий данные, агент вывода, хорошо пишущий, и агент поиска уязвимостей. Маршрутизирующий уровень будет определять, кому из них подходит текущая подзадача, а не поручать всё одному агенту.

Ценность этой модели заключается в точности и экономичности: промпты для каждого агента могут быть полностью независимыми и не подвержены влиянию других целей, обеспечивая глубокое вертикальное исследование. Минимальное потребление токенов и максимальная скорость ответа. Границы ответственности четко определены.

Недостатки также очевидны: слабая способность обрабатывать задачи с нечеткими границами (например, «и техническая проблема, и проблема с аккаунтом»).

3.2 Разделение и объединение (Fan-out & Merge)

Это также мой самый часто используемый подход: параллельная обработка + объединение. Задача разбивается на N независимых подзадач, которые выполняются одновременно, а после завершения всех объединяются в одну.

Преимущество заключается в скорости и изоляции. Общее время примерно равно времени самого медленного подзадания, а не сумме всех подзаданий. Каждое подзадание имеет независимый контекст, не влияет друг на друга и не подвержено загрязнению шумом от других подзаданий.

Слабое место заключается в том, что стоимость токена увеличивается в N раз последовательно, а сама синтезирующая прослойка (Synthesize) также представляет сложность — как объединить N выходов с неоднородной структурой, является вызовом в проектировании. Неправильное разделение подзадач может привести к пропускам или повторному покрытию.

3.3 Адверсарная верификация

Основная логика заключается в проверке: для одного и того же вывода несколько агентов должны оспаривать его с точки зрения возражений, и решение считается принятым, если за него проголосовала большинство.

Преимущество заключается в том, что поскольку Verifier не знает рассуждений Worker, а оценивает только результат, автоматически устраняется предвзятость самооценки, возникающая при проверке кода, написанного моделью.

Этот подход решает проблему, которая долго меня беспокоила: мы часто общаемся с ИИ на разговорном языке, но ИИ склонен отвечать в соответствии с вашими ожиданиями, что приводит к "подтверждению предвзятости". Противопоставляющая проверка заставляет ИИ искать контрпримеры и опираться на данные и эксперименты, а не подстраиваться под ваши идеи.

Однако, при проверке этого факта, если он сделает неверное суждение, это может сбить с пути Worker, заставив его стремиться угодить Verifier. Поэтому предпочтительно опираться на воспроизводимые факты, а не на мнения.

Шутка ли, но если вы попросите ИИ искать проблемы, он сможет бесконечно их находить, поэтому вам нужно ограничить границы поиска проблем.

3.4 Генерация и фильтрация

Основная логика — расширение, затем сужение. Сначала намеренно создается избыточное количество вариантов, затем с помощью критериев отсеиваются до самых ценных, оставляя только результаты с высокой степенью уверенности.

Лучше, чтобы агент сгенерировал десять вариантов, а затем фильтрующий слой отобрал лучший, чем выдал один ответ «нормально». Преимущество заключается в разнообразии. Несколько генераторов могут использовать разные стратегии и промпты, чтобы создать решения, которые трудно предсказать человеку, а этап фильтрации обеспечивает высокую концентрацию качества итогового результата.

Слабое место заключается в том, что качество rubric Filter напрямую определяет конечный результат; ошибка в проектировании rubric равносильна полному сбою всего процесса.

Подходит для ситуаций, когда правильный ответ заранее неизвестен, требуется выбрать наилучший из нескольких вариантов и существует четкая потребность в разнообразии.

Только поверхностно похоже на Fanout-And-Synthesize: оба имеют структуру "множественное параллельное → единственный выход", и их легче всего перепутать.

Ключевое различие заключается в намерении: каждая ветвь Fanout обрабатывает разную часть задачи, и результаты дополняют друг друга — при объединении каждая ветвь вносит вклад; каждая ветвь Generate-And-Filter обрабатывает одну и ту же задачу, и результаты конкурируют — при объединении большинство отбрасываются. Первая — это «пазл», вторая — «конкурс красоты».

3.5 Режим турнира (Tournament)

Основная логика — конкуренция и отбор. N агентов независимо выполняют одну и ту же задачу, проходят поэтапное исключение на основе попарного сравнения, в результате чего выбирается оптимальное решение.

Я раньше это делал вручную — запускал одно и то же изменение кода в двух-трех версиях, а затем заставлял ИИ сравнить, какая лучше. Теперь это можно напрямую интегрировать в рабочий процесс.

Преимущество заключается в оценке стабильности. Попарное сравнение ("Какой лучше: A или B?") намного стабильнее абсолютной оценки ("Оцените A"), поскольку исключает проблему смещения критериев оценки. Результаты проходят несколько раундов соревнования, и победитель обладает высокой достоверностью.

Также поверхностно похоже на Generate-And-Filter: оба метода выбирают наилучший вариант из нескольких кандидатов. Ключевое различие заключается в механизме отбора: Tournament использует попарное сравнение, то есть «заставляет кандидатов конкурировать друг с другом». Это более надежно, когда критерии трудно количественно оценить, а оценка по своей сути относительна.

3.6 Циклический режим (Loop)

Основная логика — адаптивная итерация, постоянные попытки, при возникновении препятствий сбор ошибок, дополнение контекста и повторные попытки до тех пор, пока не будут выполнены условия приемки.

Суть в противодействии случайности ИИ: пробуйте несколько раз — рано или поздно вы получите лучший результат. Однако более зрелый подход — сочетать противодействие с верификацией, чтобы каждый цикл выполнялся с большей информацией, а не полагался исключительно на случайность.

Преимущество заключается в способности обрабатывать задачи с неизвестным объемом работы. Все остальные пять режимов предполагают, что границы задачи определены; Loop Until Done — единственный режим, способный обрабатывать задачи, где неизвестно, сколько циклов потребуется.

Слабое место — потенциальный риск потери контроля: плохой дизайн условий остановки может привести к бесконечному циклу. Каждый агент в каждом цикле имеет новый контекст и не может накапливать состояние между циклами (если только не записывать его явно в файл).

Четвертый: Моя собственная компетенция против официального рабочего процесса

До появления динамического рабочего процесса я специально разработал собственную систему глубокого исследования. Логика моих навыков была примерно такой:

Просто сообщите информацию (например, о новой функции проекта)
Пусть ИИ найдет все соответствующие материалы: официальную документацию, исходный код, рыночные отзывы
Сожмите информацию в осмысленное резюме
Несколько агентских ролей проводят противостоящий анализ и генерируют отчет
Автоматическое удаление дубликатов, так как содержимое нескольких агентов имеет высокий уровень повторения

Я использовал его некоторое время, и мне он кажется вполне удобным. Однако у него есть фундаментальный недостаток: отсутствие целенаправленной сходимости.

И часто, даже при наличии пятого шага удаления дубликатов, он часто удаляет полезную информацию; если не удалять дубликаты, то skill может предоставить вам статью объемом в десять тысяч слов, с полной информацией, но без прямого ответа на вопрос: «Как это относится к вам и что вам следует делать?»

Однако исследования проводятся для того, чтобы служить «принятию решений», именно поэтому многие навыки остаются лишь на уровне исследований: они дают 80 баллов, но не хватает самых важных 20 баллов.

Таким образом, после первоначального завершения исследования ИИ должен продолжить десять циклов размышлений и диалогов, чтобы достичь удовлетворительного и всестороннего вывода.

Что еще делает официальный рабочий процесс

Эксперименты с несколькими сложными исследовательскими задачами этой недели показали, что встроенная рабочая процедура deep research в Claude Code (обратите внимание, что это не просто навык, а модуль, встроенный в cc), по сравнению с моими собственными навыками, включает несколько ключевых этапов:

Слой разбиения вопроса: он не начинает поиск сразу, а сначала задает вопросы, разбивая мой вопрос на несколько подвопросов: что именно вы хотите понять? как это связано с вами? какие аспекты заслуживают глубокого анализа? Раньше я пропускал этот шаг.
Оценка надежности: оцените фальсифицируемость каждой информации, аналогично рейтингу авторитетности в традиционном SEO — надежен ли источник? Сколько раз его цитируют? Это этап, который я раньше не рассматривал.
Перекрестное удаление вместо усредненного объединения: Раньше я усреднял все выводы, поэтому документ был очень большим. Динамический рабочий процесс проводит голосование нескольких агентов по каждому выводу и удаляет те, у которых недостаточно голосов, а не просто объединяет их.
Целевая выдача: итоговый отчет — это не скопление информации, а оценки и рекомендации, основанные на вашей исходной цели. Ключом к достижению этого является использование предустановленных возможностей нескольких агентов. Раньше мои навыки часто lacked целевой направленности, потому что после обработки огромного объема информации происходило ослабление веса инструкций.

Какие проблемы решают эти механизмы?

Речь идет о нескольких типичных проблемах, с которыми сталкиваются ИИ при выполнении длинных задач:

Смещение цели: в начале задачи состояние хорошее, но к середине становится непонятно, что именно делается, а к концу снова восстанавливается ритм — как у человека, который отвлекается на уроке. Чем дольше задача, тем явнее это проявляется.

Слишком ранняя остановка: бегая и сталкиваясь с трудностями, ИИ считает, что «закончил», хотя критерии приемки вообще не выполнены.

Загрязнение контекста: при выполнении сложных задач одним агентом большое количество предыдущих промптов сокращает доступное пространство для последующего выполнения. Лучше ограничить предыдущие промпты несколькими килобайтами и распределить контекст между несколькими агентами.

Склонность к выводу: ИИ склонен следовать вашим ожиданиям, и разговорный стиль вопроса легче провоцирует эту проблему.

Динамический рабочий процесс решает эти четыре проблемы структурированным способом: автоматическое добавление метрик приемки для предотвращения преждевременной остановки; параллельная изоляция контекста; противодействие верификации, снимающей смещение вывода; разбиение задачи с поэтапным ограничением — ИИ сначала понимает цель, а затем действует.

Пять. Краткое резюме

В заключение, как постоянный исследователь, я восхищаюсь новым механизмом CC: его шесть встроенных режимов — выбор маршрута, разделение и объединение, противодействующая проверка, генерация и фильтрация, турнирный отбор, цикл Loop — охватывают большинство потребностей в планировании сложных исследовательских задач.

Мне больше не нужно вручную проектировать планирование агентов или самостоятельно выполнять дедупликацию и перекрестную проверку — всё это встроено в сам рабочий процесс.

И он особенно подходит для мышления в условиях недостатка информации и исследования открытых вопросов, поскольку естественное многопоточное планирование агентов и разбиение целей задач повышают его универсальность. Еще три года назад ИИ уже отлично справлялся с решением четко определенных мелких задач при строгих ограничениях, но настоящий качественный скачок ИИ произошел именно благодаря универсальности — переход от простого кода к настоящему агенту, от фиксированного решения одной задачи к адаптации под любые задачи.

Таким образом, Dynamic Workflows — это не «более умный одноразовый диалог», а структурирование самого процесса исследования.

Раньше мне требовалось провести десятки отдельных диалогов для исследования, теперь это сократилось до 3–4. Хотя соответствующее потребление токенов увеличилось в десятки раз.

Почему тогда требуется еще 3–4 раза? Я считаю, что коренная причина заключается в различиях этих требований.

Во-первых, строгость механизма проверки: я в основном исследую новые технологии в блокчейне, и во многих случаях официальная документация устарела, тогда как более ценными источниками являются открытый код, цепочка транзакций и другие данные, однако в настоящее время ИИ по умолчанию опирается на официальную документацию, а не на фактическую проверку.

Во-вторых, это глубокое мышление в совершенно разных областях. Хотя некоторые аспекты этого можно решить с помощью предустановленных рабочих процессов (предварительное определение различных подагентов по разным измерениям) для анализа одной и той же проблемы, ИИ все же лучше справляется с распространенными моделями мышления и несколько слабее в работе с совершенно новыми, глубокими вопросами, где отсутствуют данные.

Третье — проектирование и проверка решения. Значение решения заключается не в его предложении, а в проверке и поддержке; оно основывается на оценке существующих механизмов, вложений и затрат. Если хорошо настроить ИИ, можно добиться лучших результатов, однако это противоречит универсальности.

Наконец, максимальное сжатие информации требует понимания уровня аудитории: некоторым нужен человекообразный подход из-за отсутствия базовых знаний, а другим достаточно одного предложения, чтобы зацепить.