Microsoft Fara1.5 AI перевершує OpenAI та Google у веб-завданнях

Microsoft Research лише що випустила набір моделей ШІ, які краще оглядають веб, ніж будь-що, створене OpenAI або Google. І в повороті, який повинен зробити незручними прихильників закритого коду, ці моделі мають відкриті ваги.

Сімейство Fara1.5, випущене 22 травня, включає три моделі з 4B, 9B та 27B параметрами. Флагманська версія з 27B набрала 72% на бенчмарку Online-Mind2Web — складному тесті, який перевіряє AI-агентів, що працюють у браузері, на 300 завданнях на 136 живих веб-сайтах. OpenAI’s Operator показав 58,3%. Google’s Gemini 2.5 Computer Use досяг 57,3%. На англійській: Модель Microsoft вдало виконала майже три чверті реальних веб-завдань, тоді як її конкуренти з великого бізнесу не змогли перевершити шість із десяти.

Розрив у бенчмарку є реальним

Модель 9B показала результат 63,4%, що робить її кращою за власні системи OpenAI та Google, незважаючи на значно менший розмір. Вона майже наздогнала Yutori Navigator n1 — конкурентний агент, який показав 64,7%.

Для контексту, наскільки швидко розвивається ця галузь: попередня модель Microsoft, Fara-7B, була запущена в листопаді 2025 року і показала лише 34,1% на тому ж бенчмарку. Це означає, що команда приблизно подвоїла продуктивність за шість місяців.

Моделі побудовані на архітектурі Qwen3.5 і використовують щось під назвою MagenticLite — ізольований браузерний інтерфейс, який надає агенту контролюване середовище для взаємодії з веб-сторінками. Вони також включають цикл спостереження-мислення-дії з захистом із участью людини, що означає, що агент зупиняється перед виконанням критичних дій, таких як покупки або зміни акаунту, і запитує користувача про підтвердження.

Microsoft зробила модель 9B доступною на Microsoft Foundry, а версії 4B і 27B очікуються в майбутньому.

Чому відкриті ваги мають значення саме тут

Operator від OpenAI та Gemini 2.5 Computer Use від Google — це власні системи. Те, що Fara1.5 має відкриті ваги, означає, що розробники можуть завантажувати, модифікувати та розгортати ці моделі на власному обладнанні. Microsoft спеціально розробила сімейство Fara1.5 для ефективної роботи на скромному обладнанні, з пропорційною перевагою масштабування при збільшенні розміру моделі.

Також значно покращено конвеєр навчання. Microsoft представила FaraGen1.5 — покращений синтетичний конвеєр даних, який генерує кращі приклади навчання для складних взаємодій з браузером.

Що це означає для криптовалют та DeFi

Microsoft не розробляла Fara1.5 з урахуванням криптовалют. Відсутні прямі інтеграції з будь-яким протоколом блокчейн, DeFi-застосунком або Web3-проектом.

Інтерфейси DeFi — це веб-застосунки. Обмін токенів на Uniswap, управління вault на Aave, перенесення активів між ланцюгами: це всі завдання, які виконуються через браузер і передбачають заповнення форм, підтвердження та багатокрокові процеси — саме те, з чим було навчено Fara1.5.

Дизайн з участью людини в циклі особливо актуальний саме тут. Транзакції DeFi є незворотними. Агент, який зупиняється перед підписанням транзакції і запитує підтвердження, вирішує одну з найбільших ризиків автономної он-чейн діяльності: випадкове схвалення зловмисного контракту або надсилання коштів на неправильну адресу.