L'industrie de l'IA se concentre sur le « génie de harness » pour améliorer la précision des modèles

iconMetaEra
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
L'actualité sur l'IA et la crypto montre que l'industrie tend vers l'« ingénierie de montage » pour améliorer la précision des modèles. Ce système inclut des règles, des validations, des outils et des boucles de rétroaction. Les erreurs sont enregistrées de manière permanente pour éviter les répétitions. Une étude Stanford-Tsinghua a révélé qu'un même modèle d'IA peut performer six fois mieux avec une conception de montage améliorée. Les tendances de l'industrie mettent en lumière le rôle croissant des contrôles structurés dans le développement de l'IA.
Le concept émergent de l'industrie de l'IA, « Harness Engineering » (ingénierie de harnais), suscite une grande attention. Ce terme désigne l'ensemble des systèmes de contrôle construits autour des modèles d'IA, incluant des règles, des mécanismes de vérification, des outils et des boucles de rétroaction, permettant à l'IA de passer de « savoir faire » à « bien faire ». Il s'agit en réalité d'inscrire de manière permanente les erreurs passées de l'IA dans son environnement d'exécution afin d'éviter qu'elles ne se reproduisent. Une étude conjointe de Stanford et de l'Université Tsinghua montre que, selon la conception du Harness, les performances d'un même modèle peuvent varier jusqu'à six fois. L'industrie passe progressivement d'une compétition basée sur la puissance des modèles à une compétition fondée sur la capacité à concevoir des Harnais, ce qui transforme la source fondamentale de la compétitivité dans l'application de l'IA.

Auteur de l'article, source : Kelly Peng

Encore un nouveau mot créé

Si vous suivez l'IA, vous avez probablement entendu récemment ce terme : Harness Engineering.

Ouvrez Twitter, parcourez les comptes WeChat, partout on en parle. OpenAI publie un article, Anthropic suit, le fondateur de HashiCorp le recommande sur son blog, Martin Fowler en écrit dans sa colonne. En deux mois, ce mot est passé de l’inconnu au cœur du vocabulaire de l’IA.

Ma première réaction a été : encore un concept que je n'ai pas suivi.

Honêtement, je suis un peu immunisé contre ce genre de sentiment. L’IA a particulièrement bien appris à créer des termes ces deux dernières années : Prompt Engineering, Context Engineering, Agent, RAG, MCP…

De temps en temps, un nouveau terme apparaît, accompagné d'une sous-entendue : « Si tu ne comprends pas cela, tu es en retard. »

Après avoir étudié Harness Engineering, je veux te dire :

Ce mot n'est pas aussi mystérieux. En fait, vous avez probablement déjà fait cela, sans savoir qu'il portait ce nom.

Dans cet article d'aujourd'hui, nous allons examiner en détail cette question.

01. D'abord, traduis ce mot en langage simple

Harness ce mot, en anglais, signifie équipement de cheval, désignant l'ensemble des accessoires placés sur un cheval : les rênes, la selle, le mors, la bride.

Quelles sont les caractéristiques du cheval ? Il est fort et rapide. Si vous le laissez courir librement, il foncera dans le potager du voisin, s'échappera ou heurtera un mur. Mais une fois harnaché, il peut être guidé avec précision pour tirer la charrette sur la route que vous souhaitez emprunter.

Mémoïsez cette image, car le monde de l’IA l’utilise actuellement comme métaphore.

Dans l'industrie, de plus en plus de personnes utilisent une formule pour décrire les systèmes d'IA actuels :

Un véritable assistant IA productif = le modèle lui-même + l'ensemble du système de contrôle construit autour du modèle

Le modèle, c'est ce cheval-là. Par exemple, GPT, Claude, Gemini, ils offrent de l'intelligence, la capacité de raisonner et de générer.

Harness est l'ensemble des éléments qui entourent le modèle : les règles, les mécanismes de vérification, les outils disponibles, les ressources consultables et les boucles de rétroaction en cas d'erreur.

Il indique à l'IA ce qu'elle peut et ne peut pas faire, lui permettant de savoir si elle effectue correctement ses tâches et de se corriger elle-même en cas d'erreur.

Le modèle est chargé de "savoir faire", tandis que Harness est chargé de "le faire correctement".

Voici une comparaison plus concrète : le modèle est comme un stagiaire très intelligent, mais totalement ignorant de la situation de votre entreprise. Harness, c’est le « manuel de l’employé + normes de travail + liste de vérification automatique + alarme qui se déclenche en cas d’erreur » que vous lui fournissez.

Avoir un stagiaire intelligent ne suffit pas, car il ne connaît pas les règles de votre entreprise, ne sait pas quelles tâches éviter, et personne ne le corrige lorsqu’il se trompe. Vous devez lui imposer un ensemble complet de règles pour qu’il puisse véritablement vous aider à bien accomplir le travail.

02. Définition en une phrase

Maintenant que les préparatifs sont terminés, définissons-le en une phrase :

Harness Engineering : vous ne dépensez pas d'énergie à faire en sorte que l'IA fasse cette fois-ci correctement, mais à faire en sorte que l'IA ne fasse plus jamais cette erreur, ni la prochaine, ni celle d'après, ni jamais.

Ou, de manière plus précise : inscrire de façon permanente une erreur spécifique commise par l’IA dans son environnement d’exécution, pour rendre mécaniquement impossible la répétition de la même erreur.

Cette définition contient trois mots-clés, tous indispensables.

Il s'adresse à des problèmes récurrents, et non à des erreurs ponctuelles.

Deuxièmement, la solution consiste à modifier l'environnement, les règles et les outils, et non à répéter à l'IA.

Troisièmement, l'effet est permanent et mécanique ; il ne s'agit pas de devoir le répéter à chaque fois.

03. Un critère de jugement que vous pouvez utiliser à tout moment

La prochaine fois que vous interagissez avec une IA et qu'elle commet une erreur, essayez de vous poser une question supplémentaire :

Est-ce que je traite cette maladie ou j'éradique sa source ?

Guérir cette maladie = réexpliquer, réindiquer et demander de le refaire dans la conversation. Ce n'est pas Harness.

Arrêter la racine de cette maladie = modifier son environnement de travail pour qu'il ne se reproduise plus jamais. C'est Harness.

À ce stade, je devine que vous commencez à entrevoir

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.