Microsoft Research vient de lancer un ensemble de modèles d’IA capables de naviguer sur le web mieux que tout ce que OpenAI ou Google a développé. Et, dans une retournement qui devrait mettre mal à l’aise les partisans du code fermé, ces modèles sont à poids ouvert.
La famille Fara1.5, publiée le 22 mai, comprend trois modèles avec 4B, 9B et 27B paramètres. La version phare de 27B a obtenu 72 % au benchmark Online-Mind2Web, un test exigeant qui soumet 300 tâches sur 136 sites web en direct à des agents d’IA utilisant un navigateur. Le modèle Operator d’OpenAI a atteint 58,3 %. Gemini 2.5 Computer Use de Google a atteint 57,3 %. En anglais : Le modèle de Microsoft a réussi presque trois quarts des tâches web réelles, tandis que ses concurrents du Big Tech n’ont pas réussi à en accomplir six sur dix.
L'écart de référence est réel
Le modèle 9B a obtenu 63,4 %, ce qui le place devant les systèmes propriétaires d'OpenAI et de Google, malgré une taille bien inférieure. Il se trouve à une courte distance du Yutori Navigator n1, un agent concurrent qui a obtenu 64,7 %.
Pour contextualiser la rapidité avec laquelle ce domaine évolue : le modèle précédent de Microsoft, Fara-7B, lancé en novembre 2025, avait obtenu seulement 34,1 % sur le même benchmark. Cela signifie que l'équipe a environ doublé les performances en environ six mois.
Les modèles sont construits sur l'architecture Qwen3.5 et utilisent une technologie appelée MagenticLite, une interface de navigateur isolée qui offre à l'agent un environnement contrôlé pour interagir avec les pages web. Ils intègrent également une boucle observe-pense-agit avec une mesure de sécurité impliquant un humain, ce qui signifie que l'agent s'arrête avant d'exécuter des actions critiques telles que des achats ou des modifications de compte et demande la confirmation de l'utilisateur.
Microsoft a mis le modèle 9B à disposition sur Microsoft Foundry, avec les versions 4B et 27B prévues prochainement.
Pourquoi les modèles ouverts sont importants ici
Operator d'OpenAI et Gemini 2.5 Computer Use de Google sont des systèmes propriétaires. Le fait que Fara1.5 soit à poids ouvert signifie que les développeurs peuvent télécharger, modifier et déployer ces modèles sur leur propre matériel. Microsoft a spécifiquement conçu la famille Fara1.5 pour fonctionner efficacement sur du matériel modeste, avec des avantages d'échelle proportionnels à mesure que la taille du modèle augmente.
Le pipeline d'entraînement a également reçu une mise à niveau significative. Microsoft a introduit FaraGen1.5, un pipeline de données synthétiques amélioré qui génère de meilleurs exemples d'entraînement pour les interactions complexes avec navigateur.
Ce que cela signifie pour la crypto et la DeFi
Microsoft n'a pas conçu Fara1.5 avec les cryptomonnaies à l'esprit. Il n'existe aucune intégration directe avec un protocole blockchain, une application DeFi ou un projet Web3.
Les interfaces DeFi sont des applications web. Échanger des jetons sur Uniswap, gérer un coffre sur Aave, pontifier des actifs entre chaînes : ce sont toutes des tâches basées sur navigateur impliquant des formulaires, des confirmations et des flux de travail en plusieurs étapes — exactement le type de choses pour lesquelles Fara1.5 a été formé.
La conception avec une intervention humaine est particulièrement pertinente ici. Les transactions DeFi sont irréversibles. Un agent qui interrompt avant de signer une transaction et demande une confirmation permet de remédier à l’un des principaux risques de l’activité autonome sur chaîne : approuver accidentellement un contrat malveillant ou envoyer des fonds à une mauvaise adresse.
