Microsoft Research только что выпустила набор ИИ-моделей, которые могут просматривать веб-сайты лучше, чем любые модели, созданные OpenAI или Google. И, что должно вызвать дискомфорт у приверженцев закрытого исходного кода, эти модели имеют открытые веса.
Семейство Fara1.5, выпущенное 22 мая, включает три модели с 4B, 9B и 27B параметрами. Флагманская версия с 27B параметрами показала результат 72% на бенчмарке Online-Mind2Web — сложном тесте, в котором браузерным ИИ-агентам предлагается выполнить 300 задач на 136 живых веб-сайтах. Модель OpenAI Operator справилась с 58,3%. Модель Google Gemini 2.5 Computer Use достигла 57,3%. На английском: модель Microsoft успешно выполнила почти три четверти реальных веб-задач, в то время как её конкуренты из числа крупных технологических компаний не смогли преодолеть порог в шесть из десяти.
Разрыв по бенчмарку реален
Модель 9B показала результат 63,4%, что позволяет ей опередить как proprietary-системы OpenAI, так и Google, несмотря на то, что она намного меньше по размеру. Она почти достигла уровня Yutori Navigator n1 — конкурентного агента, показавшего 64,7%.
Для контекста, насколько быстро развивается эта область: предыдущая модель Microsoft, Fara-7B, была запущена в ноябре 2025 года и показала всего 34,1% на том же бенчмарке. Это означает, что команда примерно удвоила производительность за шесть месяцев.
Модели построены на архитектуре Qwen3.5 и используют технологию под названием MagenticLite — изолированный веб-интерфейс, предоставляющий агенту контролируемую среду для взаимодействия с веб-страницами. Они также включают цикл «наблюдение-мышление-действие» с контролем со стороны человека, что означает, что агент приостанавливается перед выполнением критически важных действий, таких как покупки или изменения аккаунта, и запрашивает подтверждение у пользователя.
Microsoft сделала модель 9B доступной на Microsoft Foundry, а модели 4B и 27B ожидаются в ближайшее время.
Почему открытый вес имеет значение здесь
Operator от OpenAI и Gemini 2.5 Computer Use от Google — это проприетарные системы. То, что Fara1.5 имеет открытые веса, означает, что разработчики могут загружать, изменять и развертывать эти модели на собственном оборудовании. Microsoft специально разработала семейство Fara1.5 для эффективной работы на скромном оборудовании, с пропорциональным улучшением производительности при переходе к более крупным моделям.
Конвейер обучения также получил значительное улучшение. Microsoft представила FaraGen1.5 — усовершенствованный конвейер синтетических данных, который генерирует более качественные обучающие примеры для сложных взаимодействий с браузером.
Что это означает для криптовалют и DeFi
Microsoft не создавала Fara1.5 с учетом криптовалют. Нет прямых интеграций ни с одним протоколом блокчейн, ни с каким-либо приложением DeFi, ни с каким-либо проектом Web3.
Интерфейсы DeFi — это веб-приложения. Обмен токенов на Uniswap, управление волютом на Aave, мосты активов между цепочками: все это задачи, выполняемые в браузере, с использованием форм, подтверждений и многошаговых рабочих процессов — именно то, для чего Fara1.5 был обучен.
Дизайн с участием человека особенно актуален здесь. Транзакции DeFi являются необратимыми. Агент, который приостанавливается перед подписанием транзакции и запрашивает подтверждение, устраняет один из самых больших рисков автономной деятельности в цепочке: случайное одобрение вредоносного контракта или отправку средств на неправильный адрес.
