Claude Code lance des workflows dynamiques pour l'exécution de tâches multi-agents

icon MarsBit
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Claude Code a lancé des flux de travail dynamiques pour améliorer l'exécution des tâches multi-agents, permettant à l'IA de coordonner plusieurs agents pour des opérations complexes. Le nouveau système prend en charge la division des tâches, le traitement parallèle et la validation des résultats, ce qui le rend adapté à l'exécution automatisée de contrats intelligents et aux applications de calcul multipartite (MPC). Il améliore l'efficacité des tâches à long terme en prévenant des problèmes tels que la dérive d'objectif et le biais des agents, ce qui le rend utile pour la recherche, la vérification des faits et l'analyse de plans d'affaires.

Note de la rédaction : Claude Code évolue d’un assistant de code vers une plateforme d’agents ordonnançables.

Les workflows présentés dans cet article ont pour valeur centrale de permettre à Claude de ne plus se limiter à « réfléchir puis agir » dans une même fenêtre de contexte, mais de générer dynamiquement un cadre d'exécution : décomposer la tâche, attribuer des sous-agents, traiter en parallèle, effectuer des validations croisées, itérer en boucle, et même faire concurrencer différents agents avant de synthétiser les résultats.

Cela signifie que les scénarios d'utilisation de Claude Code s'étendent clairement au-delà du cadre technique. Il ne s'applique pas seulement à la migration, la重构, la reproductibilité des tests et la revue de code, mais peut également être utilisé pour des tâches non techniques telles que la recherche approfondie, la vérification des faits, le filtrage de CV, l'analyse d'incidents, la formalisation de règles, l'évaluation de plans commerciaux et le brainstorming de noms. De nombreuses tâches complexes sont fondamentalement similaires à la programmation : elles nécessitent de décomposer les problèmes, d'isoler les contextes, de valider les hypothèses, de gérer un grand nombre de détails et de choisir parmi plusieurs pistes possibles.

Les workflows dynamiques visent à résoudre plusieurs problèmes courants des grands modèles lors de tâches longues : l'« inertie des agents » qui consiste à déclarer la tâche terminée à mi-chemin, le « biais de préférence propre » qui pousse à privilégier ses propres conclusions, ainsi que la « dérive d'objectif » qui survient après plusieurs itérations. En confiant la tâche à plusieurs Claude disposant de contextes indépendants, il transforme les tâches complexes d'un « marathon à un seul agent » en une « collaboration entre plusieurs agents ».

Bien sûr, les workflows ne sont pas une solution universelle. Ils consomment généralement plus de tokens et ne sont pas toujours adaptés à chaque tâche de codage courante. Mais ils offrent une direction importante : la concurrence future entre les outils d'IA ne reposera peut-être plus seulement sur la performance d'un modèle individuel, mais sur sa capacité à organiser des processus d'exécution fiables, réutilisables et auditables autour d'objectifs complexes.

Voici le texte original :

Bien que le cadre d'exécution par défaut de Claude Code soit conçu pour la programmation, il s'applique également à de nombreuses autres types de tâches. Il s'est avéré que beaucoup de tâches ont une structure similaire à celle des tâches de programmation. Toutefois, pour obtenir les meilleures performances sur certains types de tâches spécifiques, nous devons toujours construire des cadres d'exécution personnalisés au-dessus de Claude Code, par exemple pour la recherche, l'analyse de sécurité, la collaboration d'équipes d'agents ou la revue de code.

Les workflows permettent de créer dynamiquement un cadre d'exécution, permettant à Claude de résoudre de manière plus native les problèmes mentionnés ci-dessus, ainsi que d'autres types de problèmes au sein de Claude Code. Vous pouvez également partager et réutiliser ces workflows avec d'autres.

Dans cet article, je partagerai mon expérience et mes retours d'expérience initiaux avec les workflows pour vous aider à exploiter pleinement leurs capacités.

Cependant, il convient de noter que les meilleures pratiques associées sont encore en cours de définition. Les flux de travail dynamiques consomment généralement plus de tokens, donc vous devez réfléchir attentivement à quand et comment les utiliser.

Remarque : Cet article est également publié sur le blog de Claude.

Exemple de prompt

Avant d’entrer dans les détails techniques, je souhaite d’abord fournir quelques exemples de prompt pour vous aider à comprendre les possibilités des workflows :

Ce test échoue environ une fois toutes les 50 exécutions. Mettez en place un workflow pour le reproduire, formulez des hypothèses, et effectuez des tests adverses dans différents worktrees. /goal Ne arrêtez pas tant qu'une hypothèse n'a pas été vérifiée.

Utilisez le workflow pour revoir mes 50 dernières sessions, extrayez les corrections que j'ai répétées et transformez ces problèmes récurrents en règles CLAUDE.md.

Utilisez le workflow pour consulter le canal #incidents de Slack des six derniers mois et identifier les causes racines récurrentes qui n'ont pas fait l'objet de tickets.

Utilisez mon plan d'affaires pour exécuter un workflow, en faisant analyser par différents agents respectivement du point de vue des investisseurs, des clients et des concurrents.

Il y a un dossier contenant 80 CV. Utilisez le workflow pour les trier selon les critères du poste backend, puis vérifiez les dix meilleurs. Posez-moi des questions à l’aide de l’outil AskUserQuestion pour établir vos critères d’évaluation.

Je dois nommer cet outil CLI. Utilisez le brainstorming par workflow pour générer une liste d'options, puis sélectionnez les trois meilleures via un mécanisme de tournoi.

Utilisez le workflow pour renommer notre modèle User en Account partout.

Lisez mon brouillon de blog et vérifiez chaque jugement technique à l’aide du workflow en comparaison avec le dépôt de code. Je ne veux pas publier de contenu erroné.

Comment fonctionne le flux de travail dynamique ?

Le flux de travail dynamique exécute un fichier JavaScript contenant plusieurs fonctions spéciales pour générer et coordonner les sous-agents.

Workflow dynamique

Le flux de travail dynamique inclut également des fonctions JavaScript standard, telles que JSON, Math et Array, pour traiter les données.

Il convient de noter particulièrement que le flux de travail dynamique peut déterminer quel modèle un agent utilise, ainsi que si les sous-agents s'exécutent dans leur propre worktree. Cela permet à Claude de choisir automatiquement le niveau d'intelligence et le degré d'isolation requis en fonction des besoins de la tâche.

Si un workflow est interrompu, par exemple par une action manuelle de l'utilisateur ou la fermeture du terminal, après la reprise de la session, le workflow peut reprendre à partir de l'endroit où il a été interrompu.

Pourquoi un flux de travail dynamique est-il nécessaire ?

Lorsque vous faites exécuter une tâche par le cadre par défaut de Claude Code, celui-ci doit accomplir à la fois la planification et l'exécution dans la même fenêtre de contexte. Pour de nombreuses tâches de programmation, cette approche est très efficace, mais elle peut parfois échouer dans le cas de tâches à exécution prolongée, fortement parallélisées ou hautement structurées et adversariales.

La raison en est que plus Claude traite des tâches complexes sur une fenêtre de contexte unique, plus il est susceptible de présenter certains types de défaillances spécifiques :

L'« agentic laziness » (paresse des agents) désigne le fait que Claude interrompe prématurément un processus lorsqu'il traite des tâches particulièrement complexes et composées de plusieurs parties, en déclarant la tâche terminée alors qu'elle n'est pas encore achevée, n'ayant réalisé qu'une partie des progrès. Par exemple, lors d'un examen de sécurité, il ne traite que 20 des 50 éléments et déclare le travail terminé.

Le biais d’autoprédilection désigne la tendance de Claude à privilégier ses propres résultats ou découvertes, notamment lorsqu’on lui demande de vérifier ou d’évaluer son propre contenu selon un ensemble de critères d’évaluation.

Le drift d'objectif (goal drift) désigne la diminution progressive de la fidélité de Claude envers l'objectif initial au cours de plusieurs itérations, notamment après compression du contexte. Chaque résumé entraîne une perte d'information, et certaines exigences détaillées, comme les cas limites ou les contraintes du type « ne pas faire X », peuvent être perdues.

Créer un workflow aide à atténuer ces problèmes, car il permet d'orchestrer plusieurs Claude indépendants, chacun disposant de sa propre fenêtre de contexte et se concentrant sur des tâches ciblées et isolées les unes des autres.

Workflow dynamique et workflow statique

Vous avez peut-être déjà créé des flux de travail statiques via le Claude Agent SDK ou claude -p pour coordonner plusieurs instances de Claude Code.

Cependant, en raison du besoin de couvrir diverses situations limites, les flux de travail statiques sont généralement plus universels. Avec l'apparition de Claude Opus 4.8 et des flux de travail dynamiques, Claude est désormais suffisamment intelligent pour créer un cadre d'exécution sur mesure adapté à votre cas d'utilisation spécifique.

Workflow dynamique

Modèles pratiques lors de l'utilisation de flux de travail dynamiques

Vous pouvez directement demander à Claude de créer un flux de travail dynamique, ou utiliser le mot-clé « ultracode » pour garantir que Claude Code crée un workflow.

Cependant, si vous parvenez à établir un modèle mental du fonctionnement des flux de travail dynamiques, il sera plus facile de déterminer quand les utiliser et de guider Claude via des invites.

Claude utilise et combine fréquemment les modèles suivants lors de la création de workflows :

Workflow dynamique

Classer et exécuter : utiliser un agent de classification pour déterminer le type de tâche, puis acheminer en fonction du type de tâche vers un agent ou un comportement différent. Un classificateur peut également être utilisé à la fin du processus pour évaluer le résultat de sortie.

Décomposition et synthèse : divisez une tâche en plusieurs étapes plus petites, chaque étape étant traitée par un agent distinct, puis combinez les résultats finaux. Cette approche est particulièrement adaptée aux tâches comportant de nombreuses étapes mineures, ou lorsque chaque étape nécessite une fenêtre de contexte propre pour éviter les interférences ou la contamination croisée. L'étape de synthèse agit comme un « point de synchronisation » : elle attend que tous les agents décomposés aient terminé, puis fusionne leurs sorties structurées en un seul résultat.

Vérification adversariale : pour chaque agent généré, exécutez un agent indépendant qui vérifie de manière adversariale sa sortie selon un ensemble de critères ou de normes d'évaluation.

Générer et filtrer : produire un grand nombre d'idées autour d'un thème, puis les filtrer selon des critères d'évaluation ou un processus de validation, en éliminant les doublons et en ne conservant que les idées les plus qualitatives et testées.

Tournoi : ne pas décomposer le travail, mais faire concurrencer les agents entre eux. Générez N agents, chacun essayant de accomplir la même tâche avec une méthode différente. Ensuite, utilisez un prompt ou un modèle pour évaluer les résultats des agents par comparaison par paires, jusqu'à désigner le gagnant.

Continuer jusqu'à achèvement : pour les tâches dont l'ampleur est inconnue, ne fixez pas un nombre de boucles déterminé, mais générez des agents en boucle jusqu'à ce qu'une condition d'arrêt soit remplie, par exemple lorsqu'aucune nouvelle découverte n'apparaît plus ou qu'aucune erreur ne figure plus dans les journaux.

Scénarios d'utilisation

Vous pouvez réfléchir de manière plus créative à quand et comment faire en sorte que Claude Code crée des flux de travail dynamiques. J'ai constaté que les workflows sont parfois encore plus utiles dans des tâches non techniques.

Workflow dynamique

Migration et重构

Bun a été réécrit de Zig à Rust en utilisant des workflows. Vous pouvez lire le post de Jarred sur X pour en savoir plus sur le processus.

L'essentiel est de décomposer la tâche en une série d'étapes à traiter, telles que les points d'appel, les tests d'échec, les modules, etc. Démarrez un sous-agent dans le worktree pour chaque tâche de correction afin qu'il la réalise ; puis faites effectuer une revue antagoniste par un autre agent, avant de fusionner les résultats. Vous pouvez explicitement indiquer à l'agent de ne pas utiliser de commandes gourmandes en ressources, afin de maximiser le parallélisme sans épuiser les ressources de la machine locale.

Étude approfondie

Nous avons publié une compétence de recherche approfondie (/deep-research) dans Claude Code, qui utilise un flux de travail dynamique. Plus précisément, elle décompose les tâches en effectuant des recherches web, en extrayant les sources, en vérifiant de manière contestataire les affirmations pertinentes, puis en synthétisant un rapport complet avec des citations.

Mais ce type d'étude ne s'applique pas uniquement à la recherche sur le web. Par exemple, vous pouvez également demander à Claude de compiler un rapport d'état à partir du contexte Slack ou d'explorer en profondeur une base de code pour comprendre comment une fonctionnalité fonctionne.

Validation approfondie

Workflow dynamique

D'autre part, si vous disposez d'un rapport et souhaitez vérifier chaque affirmation factuelle et chaque source citée, vous pouvez créer un workflow : un agent identifie d'abord toutes les affirmations factuelles, puis déclenche un sous-agent pour chaque affirmation afin d'effectuer une vérification détaillée. Vous pouvez également faire intervenir un agent de validation pour évaluer la qualité des sources des sous-agents chargés de la traçabilité.

Sort

Workflow dynamique

Vous pouvez avoir un ensemble de projets que vous souhaitez trier selon un indicateur qualitatif, et vous pensez que Claude Code est compétent pour évaluer ce type d'indicateur. Par exemple, trier les tickets de support selon la gravité des bogues.

Mais si vous essayez de trier plus de 1000 lignes dans un seul prompt, la qualité diminue et la fenêtre de contexte ne peut pas les contenir. Une meilleure approche consiste à exécuter un mécanisme de tournoi, en établissant une chaîne de agents qui effectuent des comparaisons deux à deux, car les jugements comparatifs sont généralement plus fiables que les notes absolues ; ou bien effectuer d’abord un tri par compartiments en parallèle, puis fusionner les résultats. Chaque comparaison est effectuée par un agent indépendant, ce qui permet de maintenir la structure du tournoi grâce à une boucle déterministe, tout en ne conservant dans le contexte que l’ordre d’exécution actuel.

Mémoire et respect des règles

Workflow dynamique

Si vous avez un ensemble de règles spécifiques et que Claude omet ou applique mal ces règles, même lorsqu'elles sont mentionnées dans CLAUDE.md, vous pouvez créer un workflow qui liste ces règles et fait vérifier chaque règle par un agent de validation dédié. Créer un sous-agent avec une personnalité de « sceptique » pour examiner la validité de ces règles aide également à éviter les faux positifs excessifs.

On peut également procéder dans l'autre sens : analyser vos conversations récentes et vos commentaires de revue de code pour identifier les corrections que vous répétez fréquemment ; faire regrouper ces problèmes par un agent parallèle ; puis vérifier de manière adversariale chaque règle candidate pour déterminer si elle empêche véritablement une erreur réelle ; enfin, intégrer les règles ayant passé le filtre dans CLAUDE.md.

Investigation de la cause racine

La manière la plus efficace de déboguer consiste à formuler plusieurs hypothèses indépendantes et à les tester une par une. Toutefois, si vous n'utilisez qu'une seule fenêtre de contexte, Claude pourrait tomber dans un biais de préférence personnelle.

Le workflow peut prévenir ce type de situation structurellement : il peut lancer plusieurs agents, les faisant générer des hypothèses basées sur des preuves non chevauchantes. Par exemple, faire en sorte que différents agents examinent respectivement les journaux, les fichiers et les données. Ensuite, chaque hypothèse peut être soumise à l'examen d'un ensemble de validateurs et de réfuteurs.

Cela ne s'applique pas uniquement au code. Les workflows peuvent également être utilisés pour l'analyse des ventes, par exemple « Pourquoi les ventes ont-elles diminué en mars ? » ; pour l'ingénierie des données, par exemple « Pourquoi ce pipeline a-t-il échoué ? » ; ou pour toute rétrospective post-événement.

Tri à grande échelle

Workflow dynamique

Chaque équipe dispose d'une file d'attente de support, de rapports de bugs ou d'autres tâches en retard que les humains ne peuvent pas gérer entièrement. Un workflow de tri permet de classer chaque élément, d'éliminer les doublons avec les problèmes déjà suivis, et de prendre des mesures. Cela peut signifier tenter de corriger le problème ou le transférer à un utilisateur humain pour traitement.

Pour le flux de triage, un modèle utile est la mise en quarantaine. Cela signifie interdire aux agents qui lisent du contenu public non fiable d'effectuer des opérations à haut privilège ; ces opérations à haut privilège doivent être réalisées par des agents dédiés à l'action.

Vous pouvez combiner les workflows de triage avec /loop pour permettre à Claude d'exécuter continuellement ces tâches.

Explorer et juger le goût

Les workflows sont utiles lorsque vous devez explorer différentes voies de solution, notamment pour des tâches impliquant un jugement esthétique comme la conception ou la dénomination, et qui peuvent bénéficier d’un ensemble de critères d’évaluation.

Vous pouvez permettre à Claude d'explorer un grand nombre de solutions et de fournir à l'agent de révision un ensemble de critères d'évaluation pour déterminer ce qu'est une « bonne solution ». Lorsque l'agent de révision juge que les résultats répondent aux critères, la tâche est terminée. Les différentes solutions peuvent également être classées ou filtrées selon ces critères d'évaluation par un mécanisme de tournoi.

Évaluations

Vous pouvez exécuter des évaluations légères pour une tâche spécifique en démarrant un agent indépendant dans le worktree, puis en lançant un agent de comparaison pour évaluer et noter la sortie selon des critères définis. Par exemple, vous pouvez évaluer et améliorer un skill que vous avez créé pour vérifier s’il répond à certaines normes spécifiques.

Modélisation et routage intelligent des niveaux : vous pouvez créer un agent de classification optimisé pour votre tâche, qui détermine quel modèle utiliser. Cette approche est utile lorsque la tâche implique de nombreux appels d'outils et que mener des recherches avant l'exécution aide à identifier le modèle le plus approprié.

Par exemple, pour la tâche « expliquer comment fonctionne le module auth », le modèle le plus adapté dépend du nombre de fichiers dans le module auth et de la structure du dépôt de code. L'agent de classification peut d'abord effectuer cette recherche, puis acheminer la tâche vers Sonnet ou Opus en fonction de la complexité attendue.

Quand ne pas utiliser un workflow dynamique

Les workflows restent une nouveauté. Bien qu'ils puissent offrir des résultats bien supérieurs aux méthodes conventionnelles dans de nombreux scénarios d'utilisation, tous les travaux n'en ont pas besoin, et ils peuvent considérablement augmenter la consommation de tokens.

Utilisez les workflows pour des tâches qui permettent d'étendre les limites des capacités de Claude Code de nouvelles manières. Pour les tâches de programmation courantes, demandez-vous d'abord : cette tâche nécessite-t-elle vraiment plus de ressources de calcul ? Par exemple, la plupart des tâches de programmation traditionnelles n'ont pas besoin d'un groupe de cinq relecteurs.

Conseils pour construire des flux de travail dynamiques

Conception du prompt

Lors de la rédaction d'un prompt pour un flux de travail dynamique, plus les détails sont complets, mieux c'est, en particulier lors de l'utilisation des techniques spécifiques mentionnées ci-dessus.

Les workflows ne s'appliquent pas uniquement aux grandes tâches. Vous pouvez également demander au modèle d'utiliser un « quick workflow ». Par exemple, vous pouvez créer un processus rapide d'examen adversarial pour vérifier une hypothèse.

À utiliser avec /goal et /loop

Lorsque vous utilisez des workflows exécutables en boucle, tels que des workflows de triage, de recherche ou de vérification, vous pouvez les associer à /loop pour les faire s'exécuter à intervalles réguliers, tout en définissant des exigences de terminaison strictes avec /goal.

Budget d'utilisation du jeton

Vous pouvez définir un budget explicite d'utilisation de tokens pour les flux de travail dynamiques afin de limiter la quantité de tokens consommés par une tâche. Vous pouvez inclure une exigence de budget dans votre prompt, par exemple « use 10k tokens », ce qui fixera la limite à 10 000 tokens.

Sauvegarder et partager des flux de travail dynamiques

Vous pouvez appuyer sur « s » dans le menu workflow pour enregistrer les workflows. Vous pouvez les soumettre à ~/.claude/workflows ou les distribuer via des compétences.

Workflow dynamique

Pour les partager via skill, placez les fichiers de workflow JavaScript dans le dossier skill et faites référence à ceux-ci dans SKILL.md. Pour plus de flexibilité, vous pouvez également demander à Claude de considérer les workflows du skill comme des modèles, et non comme des scripts à exécuter mot pour mot.

Workflow dynamique

Un tout nouveau monde

Les workflows sont un nouvel outil utile pour étendre Claude Code. Nous vous encourageons à les considérer comme un point de départ. Il reste beaucoup à explorer sur la meilleure façon de les utiliser. N'hésitez pas à nous faire part de vos découvertes.

Thariq Shihipar et Sid Bidasaria (@sidbid) sont membres de l'équipe technique d'Anthropic, chargés des travaux liés à Claude Code.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.