Arbitrum propose une vérification de l'inférence IA pour réduire le temps de preuve à quelques millisecondes

iconCrypto Economy
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Arbitrum introduit un nouveau développement en matière d'IA et de crypto-actualités avec sa méthode proposée de vérification d'inférence IA. La mise à jour du protocole vise à réduire le temps de génération de preuve de 15 minutes à quelques millisecondes. L'article d'Offchain Labs suggère de vérifier les modèles d'IA par échantillonnage aléatoire de chemins internes. Le système utilise la logique de contestation d'Arbitrum One pour détecter la substitution de modèles dans les API IA.

TL;DR:

  • Arbitrum étudie une nouvelle approche de vérification d'inférence IA qui réduit le temps de génération de preuve de 15 minutes à quelques millisecondes.
  • Un article d'Offchain Labs propose de vérifier les inférences de modèles d'IA par échantillonnage aléatoire de chemins internes, sans réexécuter chaque opération.
  • Le protocole utilise la même logique de résolution de litiges qu'Arbitrum One pour détecter la substitution de modèle dans les API IA.

L'économie des agents d'intelligence artificielle fait face à un problème que personne n'avait jusqu'à présent résolu avec suffisamment de rapidité pour être utile en production : vérifier que le modèle d'intelligence artificielle qu'un fournisseur prétend exécuter est bien celui qui est réellement en cours d'exécution.

Un article publié en mars 2026 par Offchain Labs, intitulé *Towards Verifiable AI with Lightweight Cryptographic Proofs of Inference*, propose une solution qui réduit le temps de génération des preuves de environ 15 minutes à quelques millisecondes, et la logique sous-jacente au système n'est pas étrangère à l'écosystème Arbitrum.

Un écart de confiance que le marché a normalisé

Le modèle de tarification par token crée un incitatif économique concret à la fraude. Servir un modèle de 7 milliards de paramètres est moins coûteux que d'en servir un de 70 milliards, et exécuter une inférence quantifiée coûte moins cher qu'une inférence en précision complète. Si un fournisseur peut rediriger une fraction des requêtes vers un modèle plus petit tout en facturant le tarif du modèle plus grand, le bénéfice augmente avec le volume. Des chercheurs de Stanford ont documenté que le comportement de GPT-3.5 et GPT-4 a changé de manière mesurable entre mars et juin 2023 sur les mêmes tâches d'évaluation. Le contrat API actuel ne propose aucun mécanisme pour détecter cette différence.

Agents IA

Les preuves cryptographiques existantes, du même type utilisées par les zk-rollups, peuvent démontrer qu’un serveur a effectué correctement un calcul sans que le client doive le répéter. Le problème réside dans la vitesse. Les schémas tels que zkLLM génèrent une preuve d’inférence pour un modèle de 13 milliards de paramètres en environ 15 minutes, un délai incompatible avec les API qui doivent répondre en moins d’une seconde.

Le même mécanisme qui protège Arbitrum One

La proposition d'Offchain Labs abandonne la preuve exhaustive au profit de l'échantillonnage. Le serveur s'engage à l'avance à une empreinte numérique des poids du modèle et des valeurs internes générées lors d'une requête spécifique. Le client sélectionne ensuite un chemin aléatoire vers la sortie du réseau et demande au serveur de révéler uniquement les valeurs le long de ce chemin. Si le serveur a exécuté un modèle différent, les valeurs seront incohérentes et la vérification échouera. La probabilité de détection s'accumule à chaque requête répétée, transformant le système en un dissuasif efficace contre les adversaires rationnels.

Arbitrum

La connexion avec Arbitrum est explicite dans l'article. Les rollups optimistes fonctionnent selon la même intuition : réexécuter chaque étape d'un long calcul sur chaque machine est coûteux, tandis que l'échantillonnage de l'étape contestée est peu coûteux. Le protocole proposé étend cette logique aux valeurs des réseaux de neurones, en utilisant une procédure de dichotomie qui réduit le désaccord entre deux serveurs en un nombre logarithmique de rounds, la même structure de résolution de litige qui protège Arbitrum One.

Pour les industries réglementées, les équipes de gouvernance des modèles et le marché émergent des agents autonomes, la différence entre une déclaration de transparence et une déclaration vérifiable commence à avoir des conséquences directes. Le protocole n'exige pas que les développeurs modifient leurs piles existantes ; il exige simplement que quelqu'un dans le système, qu'il s'agisse du fournisseur, de l'auditeur ou de la plateforme, produise une déclaration vérifiable.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.