微軟研究剛剛推出了一組 AI 模型,其網頁瀏覽能力超越了 OpenAI 或 Google 所開發的任何模型。而令人感到不安的是,這些模型採用開放權重,這對閉源陣營來說無疑是一記重擊。
於5月22日發布的Fara1.5系列包含三款型號,參數分別為4B、9B和27B。旗艦型號27B在Online-Mind2Web基準測試中獲得72%的分數,這是一項嚴苛的測試,要求瀏覽器使用的AI代理處理136個實時網站上的300項任務。OpenAI的Operator僅達到58.3%,Google的Gemini 2.5 Computer Use則達到57.3%。在英文中:微軟的模型成功完成了近四分之三的實際網頁任務,而其大型科技競爭對手卻未能達到六成。
基準差距是真實的
9B 模型得分为 63.4%,儘管體積僅為 OpenAI 和 Google 專有系統的一小部分,但仍超越了這兩者。其表現與競爭對手 Yutori Navigator n1(得分为 64.7%)僅一步之遙。
為了解這個領域的發展速度:微軟先前的模型 Fara-7B 於 2025 年 11 月推出,在同一基準測試中僅取得 34.1% 的分數。這意味著該團隊在大約六個月內將性能大致翻倍。
這些模型基於 Qwen3.5 架構構建,並使用一種稱為 MagenticLite 的沙盒式瀏覽器介面,為代理提供受控環境以與網頁互動。它們還整合了觀察-思考-行動迴圈,並設有人工參與的安全保障機制,意味著代理在執行關鍵操作(如購買或帳戶變更)前會暫停,並向用戶請求確認。
Microsoft 已在 Microsoft Foundry 上推出 9B 模型,4B 和 27B 版本預計將隨後推出。
為何開放權重在這裡至關重要
OpenAI 的 Operator 和 Google 的 Gemini 2.5 電腦使用功能均為專有系統。Fara1.5 為開放權重,意味著開發者可下載、修改並在自己的硬體上部署這些模型。微軟特別設計了 Fara1.5 系列,使其能在較低規格的硬體上高效運行,並隨著模型規模增大而獲得相應的擴展效益。
訓練管道也獲得了重大升級。微軟推出了 FaraGen1.5,這是一個增強的合成資料管道,可為複雜的瀏覽器互動生成更優質的訓練範例。
這對加密貨幣和去中心化金融意味著什麼
Microsoft 在設計 Fara1.5 時並未考慮加密貨幣。它與任何區塊鏈協議、DeFi 應用程式或 Web3 專案都沒有直接整合。
DeFi 介面是網頁應用程式。在 Uniswap 上交換代幣、在 Aave 上管理金庫、跨鏈橋接資產:這些都是基於瀏覽器的任務,涉及表單、確認和多步驟工作流程——這正是 Fara1.5 被訓練來處理的類型。
此處特別適用於人機協同設計。DeFi 交易是不可逆的。一個在簽署交易前暫停並要求確認的代理,能應對自主鏈上活動中最大的風險之一:意外批准惡意合約或將資金發送到錯誤的地址。
