Microsoft Research acaba de lanzar un conjunto de modelos de IA que pueden navegar por la web mejor que cualquier cosa creada por OpenAI o Google. Y, en un giro que debería incomodar a quienes apoyan el código cerrado, los modelos son de peso abierto.
La familia Fara1.5, lanzada el 22 de mayo, comprende tres modelos con 4B, 9B y 27B parámetros. La variante insignia de 27B obtuvo un 72% en el benchmark Online-Mind2Web, una prueba exigente que presenta 300 tareas en 136 sitios web en vivo a agentes de IA que usan navegadores. OpenAI’s Operator logró un 58.3%. Google’s Gemini 2.5 Computer Use alcanzó un 57.3%. En inglés: El modelo de Microsoft completó con éxito casi tres cuartas partes de las tareas web del mundo real, mientras que sus rivales de la gran tecnología no lograron superar seis de cada diez.
La brecha de referencia es real
El modelo 9B obtuvo un 63,4%, lo que lo coloca por delante de los sistemas propietarios de OpenAI y Google, a pesar de ser una fracción de su tamaño. Se acercó considerablemente al Yutori Navigator n1, un agente competitivo que obtuvo un 64,7%.
Para tener contexto sobre lo rápido que avanza este espacio: el modelo anterior de Microsoft, Fara-7B, se lanzó en noviembre de 2025 y obtuvo solo un 34,1% en el mismo benchmark. Esto significa que el equipo duplicó aproximadamente el rendimiento en unos seis meses.
Los modelos se construyen sobre la arquitectura Qwen3.5 y utilizan algo llamado MagenticLite, una interfaz de navegador en sandbox que proporciona al agente un entorno controlado para interactuar con páginas web. También incorporan un bucle observar-pensar-actuar con una medida de seguridad que incluye a un humano, lo que significa que el agente se detiene antes de ejecutar acciones críticas como compras o cambios en la cuenta y solicita la confirmación del usuario.
Microsoft ha puesto disponible el modelo 9B en Microsoft Foundry, y se espera que sigan las versiones 4B y 27B.
Por qué importa el peso abierto aquí
Operator de OpenAI y Gemini 2.5 Computer Use de Google son sistemas propietarios. Que Fara1.5 sea de peso abierto significa que los desarrolladores pueden descargar, modificar y implementar estos modelos en su propio hardware. Microsoft diseñó específicamente la familia Fara1.5 para funcionar eficientemente en hardware modesto, con beneficios de escalado proporcional a medida que aumenta el tamaño del modelo.
La tubería de entrenamiento también recibió una actualización significativa. Microsoft presentó FaraGen1.5, una tubería de datos sintéticos mejorada que genera ejemplos de entrenamiento superiores para interacciones complejas con navegadores.
Qué significa esto para cripto y DeFi
Microsoft no diseñó Fara1.5 con cripto en mente. No hay integraciones directas con ningún protocolo de cadena de bloques, aplicación DeFi o proyecto Web3.
Las interfaces DeFi son aplicaciones web. Intercambiar tokens en Uniswap, gestionar una vault en Aave, puentear activos entre cadenas: todos estos son tareas basadas en navegador que involucran formularios, confirmaciones y flujos de trabajo multietapa, exactamente el tipo de cosas para las que Fara1.5 fue entrenada.
El diseño con humano en el bucle es particularmente relevante aquí. Las transacciones DeFi son irreversibles. Un agente que se detiene antes de firmar una transacción y solicita confirmación aborda uno de los mayores riesgos en la actividad autónoma en cadena: aprobar accidentalmente un contrato malicioso o enviar fondos a la dirección incorrecta.
