TL;DR:
- Arbitrum étudie une nouvelle approche de vérification d'inférence IA qui réduit le temps de génération de preuve de 15 minutes à quelques millisecondes.
- Un article d'Offchain Labs propose de vérifier les inférences de modèles d'IA par échantillonnage aléatoire de chemins internes, sans réexécuter chaque opération.
- Le protocole utilise la même logique de résolution de litiges qu'Arbitrum One pour détecter la substitution de modèle dans les API IA.
L'économie des agents d'intelligence artificielle fait face à un problème que personne n'avait jusqu'à présent résolu avec suffisamment de rapidité pour être utile en production : vérifier que le modèle d'intelligence artificielle qu'un fournisseur prétend exécuter est bien celui qui est réellement en cours d'exécution.
Un article publié en mars 2026 par Offchain Labs, intitulé *Towards Verifiable AI with Lightweight Cryptographic Proofs of Inference*, propose une solution qui réduit le temps de génération des preuves de environ 15 minutes à quelques millisecondes, et la logique sous-jacente au système n'est pas étrangère à l'écosystème Arbitrum.
Un écart de confiance que le marché a normalisé
Le modèle de tarification par token crée un incitatif économique concret à la fraude. Servir un modèle de 7 milliards de paramètres est moins coûteux que d'en servir un de 70 milliards, et exécuter une inférence quantifiée coûte moins cher qu'une inférence en précision complète. Si un fournisseur peut rediriger une fraction des requêtes vers un modèle plus petit tout en facturant le tarif du modèle plus grand, le bénéfice augmente avec le volume. Des chercheurs de Stanford ont documenté que le comportement de GPT-3.5 et GPT-4 a changé de manière mesurable entre mars et juin 2023 sur les mêmes tâches d'évaluation. Le contrat API actuel ne propose aucun mécanisme pour détecter cette différence.

Les preuves cryptographiques existantes, du même type utilisées par les zk-rollups, peuvent démontrer qu’un serveur a effectué correctement un calcul sans que le client doive le répéter. Le problème réside dans la vitesse. Les schémas tels que zkLLM génèrent une preuve d’inférence pour un modèle de 13 milliards de paramètres en environ 15 minutes, un délai incompatible avec les API qui doivent répondre en moins d’une seconde.
Le même mécanisme qui protège Arbitrum One
La proposition d'Offchain Labs abandonne la preuve exhaustive au profit de l'échantillonnage. Le serveur s'engage à l'avance à une empreinte numérique des poids du modèle et des valeurs internes générées lors d'une requête spécifique. Le client sélectionne ensuite un chemin aléatoire vers la sortie du réseau et demande au serveur de révéler uniquement les valeurs le long de ce chemin. Si le serveur a exécuté un modèle différent, les valeurs seront incohérentes et la vérification échouera. La probabilité de détection s'accumule à chaque requête répétée, transformant le système en un dissuasif efficace contre les adversaires rationnels.

La connexion avec Arbitrum est explicite dans l'article. Les rollups optimistes fonctionnent selon la même intuition : réexécuter chaque étape d'un long calcul sur chaque machine est coûteux, tandis que l'échantillonnage de l'étape contestée est peu coûteux. Le protocole proposé étend cette logique aux valeurs des réseaux de neurones, en utilisant une procédure de dichotomie qui réduit le désaccord entre deux serveurs en un nombre logarithmique de rounds, la même structure de résolution de litige qui protège Arbitrum One.
Pour les industries réglementées, les équipes de gouvernance des modèles et le marché émergent des agents autonomes, la différence entre une déclaration de transparence et une déclaration vérifiable commence à avoir des conséquences directes. Le protocole n'exige pas que les développeurs modifient leurs piles existantes ; il exige simplement que quelqu'un dans le système, qu'il s'agisse du fournisseur, de l'auditeur ou de la plateforme, produise une déclaration vérifiable.

