LangChain ajoute l'auto-QC pour les agents IA afin d'assurer la complétion des tâches

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Les plateformes d'actualités sur l'IA et la crypto rapportent que LangChain, en collaboration avec MetaEra, a lancé RubricMiddleware pour sa série Deep Agents. Cet outil permet aux agents IA de vérifier automatiquement les résultats selon des critères prédéfinis, tels que les tests de code ou l'exhaustivité des rapports. Si les résultats échouent, la tâche est révisée jusqu'à ce qu'elle réussisse ou atteigne la limite d'itérations. Le système cible les tâches longues où le formatage et la qualité du contenu sont cruciaux. De nouvelles listings de jetons et des avancées en IA comme celle-ci attirent l'attention des développeurs et des traders. LangChain affirme que cet outil est idéal pour les tâches aux normes claires, telles que les tests de code ou les vérifications de citations, rendant l'IA plus fiable au-delà de simples conversations.
ME AI Message, selon l'observation de Beating, LangChain a lancé le nouvel composant Deep Agents, RubricMiddleware, destiné à permettre aux agents IA de vérifier et de modifier leurs propres sorties selon des critères prédéfinis. Les développeurs peuvent d'abord définir clairement les « critères de réussite » de la tâche, par exemple : le code doit passer les tests, le rapport doit couvrir les chapitres spécifiés, et les réponses ne doivent pas contenir de contenu interdit. À chaque fois que l'agent est sur le point de livrer un résultat, le système appelle un modèle d'évaluation pour vérifier chaque critère ; tant que les exigences ne sont pas satisfaites, les commentaires sont renvoyés à l'agent d'origine pour qu'il continue à modifier sa sortie jusqu'à ce qu'il passe l'examen ou atteigne la limite d'itérations. Ce mécanisme résout le problème courant des agents lors de l'exécution de tâches longues : « manquer la dernière étape ». Beaucoup d'agents ne sont pas incapables de faire la tâche, mais ils omettent facilement des exigences concrètes telles que le format, les tests, les citations ou les chapitres. RubricMiddleware agit comme un contrôleur de qualité automatique intégré dans la chaîne de tâches, permettant à l'agent de comprendre ce qui constitue une réalisation véritable, et non simplement une réponse qui semble proche. La documentation de LangChain précise explicitement que cette approche convient particulièrement aux tâches ayant des critères d'acceptation clairs, par exemple : vérifier si les syllabes d'un haïku sont correctes, si les tests passent après une refactorisation du code, ou si le rapport contient toutes les parties nécessaires. Pour les utilisateurs ordinaires, sa valeur ne réside pas dans une meilleure capacité de conversation de l'agent, mais dans sa capacité à agir comme un exécutant qui remet un travail conforme à une checklist. (Source : MLion)
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.