Rapport DWF : L'IA surpasse les humains dans l'optimisation des rendements DeFi, mais peine dans les opérations complexes

Auteur : DWF Ventures

Traduction : Deep潮 TechFlow

Deep潮导读 : Les agents IA représentent déjà près d'un cinquième du volume des transactions DeFi et surpassent effectivement les humains dans des scénarios bien définis comme l'optimisation des rendements. Toutefois, lorsqu'il s'agit de négocier de manière autonome, les meilleures IA performances sont inférieures au cinquième de celles des meilleurs humains. Cette étude analyse les performances réelles de l'IA dans différents scénarios DeFi et mérite l'attention de tous ceux qui s'intéressent à la négociation automatisée.

Points clés

L'automatisation et les activités des agents représentent actuellement environ 19 % de l'ensemble des activités sur chaîne, mais une autonomie complète de bout en bout n'a pas encore été atteinte.

Dans des cas d'utilisation étroits et bien définis, tels que l'optimisation des rendements, les agents ont démontré une performance supérieure à celle des humains et des bots. Toutefois, pour des actions complexes comme le trading, les humains surpassent les agents.

Entre les agents, le choix du modèle et la gestion des risques ont le plus grand impact sur les performances des transactions.

Avec l'adoption à grande échelle des agents, plusieurs risques liés à la confiance et à l'exécution existent, notamment les attaques de Sybil, le congestion stratégique et les compromis en matière de confidentialité.

L'activité de l'agent continue de croître

Au cours de la dernière année, l'activité des agents a connu une croissance stable, avec une augmentation du volume et du nombre de transactions. Nous avons observé que le protocole x402 de Coinbase a conduit des développements majeurs, tandis que des acteurs comme Visa, Stripe et Google ont rejoint le mouvement en lançant leurs propres normes. La majeure partie de l'infrastructure en cours de construction vise à servir deux scénarios : des canaux entre agents ou des appels d'agents déclenchés par un humain.

Bien que les échanges de stablecoins soient largement pris en charge, l'infrastructure actuelle repose toujours sur des passerelles de paiement traditionnelles en tant que couche sous-jacente, ce qui signifie qu'elle dépend toujours de contreparties centralisées. Par conséquent, la fin envisagée d'un agent « entièrement autonome » capable de se financer lui-même, de s'exécuter lui-même et de s'optimiser en continu selon les conditions changeantes n'a pas encore été atteinte.

Les agents ne sont pas entièrement étrangers au DeFi. Depuis des années, des automatisations via des bots existent dans les protocoles sur chaîne, permettant de capturer du MEV ou d'obtenir des rendements supplémentaires impossibles sans code. Ces systèmes fonctionnent très bien dans des paramètres bien définis, qui ne changent pas fréquemment ou ne nécessitent pas de surveillance supplémentaire. Toutefois, le marché est devenu plus complexe avec le temps. C’est là que nous voyons l’arrivée d’une nouvelle génération d’agents, devenus ces derniers mois un terrain d’expérimentation sur chaîne.

La performance réelle de l'agent

Selon le rapport, l'activité des agents a connu une croissance exponentielle, avec plus de 17 000 agents lancés depuis 2025. Le volume total des activités automatisées/agents est estimé couvrir plus de 19 % de toutes les activités sur chaîne. Cela n'est pas surprenant, car plus de 76 % des transferts de stablecoins sont générés par des bots. Cela indique un potentiel de croissance considérable pour les activités d'agents dans le DeFi.

L'autonomie des agents s'étend sur une large gamme, allant d'expériences de type chatbot nécessitant une supervision humaine intensive, à des agents capables de formuler des stratégies adaptées aux conditions du marché à partir d'entrées d'objectifs. Par rapport aux bots, les agents présentent plusieurs avantages clés, notamment la capacité de répondre et d'exécuter de nouvelles informations en quelques millisecondes, ainsi que la possibilité d'étendre leur couverture à des milliers de marchés tout en conservant le même niveau de rigueur.

La plupart des agents sont actuellement au niveau analyste à co-pilote, car la plupart d'entre eux sont encore en phase de test.

Optimisation des revenus : l'agent affiche d'excellentes performances

La fourniture de liquidité est un domaine déjà largement automatisé, avec un TVL total détenu par les agents dépassant 39 millions de dollars américains. Ce chiffre mesure principalement les actifs déposés directement par les utilisateurs chez les agents, mais exclut le capital acheminé via les coffres.

Giza Tech est l'un des plus grands protocoles dans ce domaine et a lancé fin l'année dernière sa première application d'agent, ARMA, conçue pour améliorer la capture de rendement des principaux protocoles DeFi. Elle a attiré plus de 19 millions de dollars d'actifs sous gestion et généré plus de 40 milliards de dollars de volume d'transactions d'agents. Le ratio élevé entre le volume d'transactions et le total des actifs sous gestion indique que les agents rééquilibrent fréquemment les capitaux, permettant ainsi une capture de rendement plus élevée. Une fois les capitaux déposés dans le contrat, l'exécution est automatisée, offrant aux utilisateurs une expérience simple en un seul clic, nécessitant presque aucune supervision.

La performance d'ARMA est mesurablement excellente, générant un rendement annuel supérieur à 9,75 % pour l'USDC. Même après prise en compte des frais supplémentaires de rééquilibrage et des frais de performance de 10 % de l'agent, le rendement reste supérieur à celui des prêts classiques sur Aave ou Morpho. Toutefois, l'évolutivité reste un enjeu majeur, car ces agents n'ont pas encore été testés en conditions réelles pour gérer ou s'étendre à l'échelle des principaux protocoles DeFi.

Trade: Humans are significantly ahead

Cependant, pour des actions plus complexes telles que le trading, les résultats sont beaucoup plus variés. Les modèles de trading actuels fonctionnent avec des entrées définies par l'homme et fournissent des sorties selon des règles prédéfinies. L'apprentissage automatique étend cela en permettant aux modèles de mettre à jour leur comportement en fonction de nouvelles informations sans nécessiter de reprogrammation explicite, les faisant passer au rôle de copilote. Avec l'arrivée d'agents entièrement autonomes, le paysage du trading connaîtra un changement considérable.

Plusieurs compétitions de trading ont été organisées entre agents et entre humains contre des agents, révélant d'importantes différences entre les modèles. Trade XYZ a organisé une compétition humain contre agent pour les actions listées sur sa plateforme. Chaque compte disposait d'un capital initial de 10 000 dollars, sans restriction sur l'effet de levier ou la fréquence des transactions. Les résultats ont massivement favorisé les humains, les meilleurs participants humains surpassant les meilleurs agents de plus de cinq fois.

Dans le même temps, Nof1 a organisé une compétition d'échanges d'agents entre modèles, faisant s'affronter plusieurs modèles (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) pour tester différentes configurations de risque, de la préservation du capital à l'effet de levier maximal. Les résultats ont révélé plusieurs facteurs pouvant expliquer les différences de performance :

Durée de détention des positions : un modèle qui détient en moyenne chaque position pendant 2 à 3 heures présente une forte corrélation et surpasse nettement les modèles à retournement fréquent.

Valeur attendue : Cela mesure si le modèle gagne de l'argent en moyenne par transaction. Il est intéressant de noter que seuls les trois premiers modèles ont une valeur attendue positive, ce qui signifie que la plupart des modèles effectuent plus de transactions perdantes que gagnantes.

Effet de levier : des niveaux d'effet de levier plus faibles, en moyenne de 6 à 8 fois, ont démontré de meilleures performances que des modèles utilisant un effet de levier supérieur à 10 fois ; des niveaux élevés accélèrent les pertes.

Stratégie de suggestion : Monk Mode est le modèle ayant obtenu les meilleurs résultats à ce jour, tandis que Situational Awareness a obtenu les pires résultats. En fonction des caractéristiques du modèle, il apparaît qu'une concentration sur la gestion des risques et une réduction des sources externes conduisent à de meilleures performances.

Modèle de base : Grok 4.20 surpasse les autres modèles de plus de 22 % selon différentes stratégies de提示 et est le seul modèle à générer un profit moyen.

D'autres facteurs, tels que les préférences long/short, la taille des transactions et les scores de confiance, ne disposent pas de données suffisantes ou n'ont pas démontré de corrélation positive avec les performances du modèle. Globalement, les résultats indiquent que l'agent tend à mieux performer dans des contraintes bien définies, ce qui signifie que l'intervention humaine reste très nécessaire en matière de configuration des objectifs.

Comment évaluer un Agent

Étant donné que l'agent est encore en phase précoce, aucun cadre d'évaluation complet n'est actuellement disponible. Les performances historiques sont généralement utilisées comme référence pour évaluer l'agent, mais elles sont influencées par des facteurs fondamentaux qui constituent des indicateurs plus forts d'une performance robuste de l'agent.

Performance under different volatility levels: disciplined loss control during deteriorating conditions, demonstrating the agent’s ability to identify off-chain factors affecting trading profitability.

Transparence et confidentialité : les deux parties font leurs propres compromis. Un agent transparent, s'il peut être copié activement, n'aura pratiquement aucun avantage stratégique. Un agent confidentiel risque l'extraction interne par son créateur, qui peut facilement anticiper ses propres utilisateurs.

Sources d'information : les sources de données auxquelles l'agent accède sont essentielles pour déterminer comment l'agent prend ses décisions. Il est crucial de s'assurer que ces sources sont fiables et qu'il n'existe pas de dépendance unique.

Security: It is crucial to have smart contract audits and an appropriate fund custody architecture to ensure fallback measures in the event of a black swan event.

La prochaine étape de l'agent

Pour une adoption à grande échelle des agents, de nombreux travaux restent à accomplir en matière d’infrastructure. Cela se résume à des questions clés liées à la confiance et à l’exécution des agents. Les actions des agents autonomes ne sont pas encadrées, et des cas de mauvaise gestion des fonds ont déjà été observés.

ERC-8004 a été lancé en janvier 2026, devenant le premier registre sur chaîne permettant aux agents autonomes de se découvrir mutuellement, d'établir une réputation vérifiable et de collaborer en toute sécurité. Il s'agit d'un déblocage clé de la composable DeFi, car les scores de confiance sont intégrés directement dans les contrats intelligents, permettant des activités sans autorisation entre agents et protocoles. Cela ne garantit pas pour autant que les agents fonctionneront toujours de manière non malveillante, car des vulnérabilités telles que la collusion de réputation ou les attaques de Sybil peuvent toujours se produire. Il reste donc un grand potentiel à exploiter en matière d'assurance, de sécurité et de mise en gage économique des agents.

Avec l'expansion des activités d'agents dans le DeFi, le regroupement des stratégies devient un risque structurel. Les fermes de rendement constituent le premier exemple le plus clair : à mesure qu'une stratégie devient populaire, ses rendements se compriment. La même dynamique pourrait s'appliquer aux transactions d'agents. Si de nombreux agents sont formés sur des données similaires et optimisent des objectifs similaires, ils convergeront vers des positions et des signaux de sortie similaires.

Le papier CoinAlg, publié en janvier 2026 par l'Université de Cornell, formalise une version de ce problème. Les agents transparents peuvent être arbitrés, car leurs transactions sont prévisibles et peuvent être anticipées. Les agents privés évitent ce risque, mais introduisent un risque différent : le créateur conserve un avantage informationnel sur ses utilisateurs et peut extraire de la valeur à partir des connaissances internes que l'opacité était censée protéger.

Les activités des agents ne feront que s'accélérer ; l'infrastructure posée aujourd'hui déterminera comment fonctionnera la prochaine étape de la finance sur chaîne. Avec l'augmentation de l'utilisation des agents, ils s'auto-itéreront et deviendront plus réactifs aux préférences des utilisateurs. Ainsi, les principaux facteurs de différenciation se résumeront à l'infrastructure digne de confiance, qui obtiendra la plus grande part de marché.