Microsoft 的 Fara1.5 AI 在網頁任務中表現優於 OpenAI 和 Google

微軟研究剛剛推出了一組 AI 模型，其網頁瀏覽能力超越了 OpenAI 或 Google 所開發的任何模型。而令人感到不安的是，這些模型採用開放權重，這對閉源陣營來說無疑是一記重擊。

於5月22日發布的Fara1.5系列包含三款型號，參數分別為4B、9B和27B。旗艦型號27B在Online-Mind2Web基準測試中獲得72%的分數，這是一項嚴苛的測試，要求瀏覽器使用的AI代理處理136個實時網站上的300項任務。OpenAI的Operator僅達到58.3%，Google的Gemini 2.5 Computer Use則達到57.3%。在英文中：微軟的模型成功完成了近四分之三的實際網頁任務，而其大型科技競爭對手卻未能達到六成。

基準差距是真實的

9B 模型得分为 63.4%，儘管體積僅為 OpenAI 和 Google 專有系統的一小部分，但仍超越了這兩者。其表現與競爭對手 Yutori Navigator n1（得分为 64.7%）僅一步之遙。

為了解這個領域的發展速度：微軟先前的模型 Fara-7B 於 2025 年 11 月推出，在同一基準測試中僅取得 34.1% 的分數。這意味著該團隊在大約六個月內將性能大致翻倍。

這些模型基於 Qwen3.5 架構構建，並使用一種稱為 MagenticLite 的沙盒式瀏覽器介面，為代理提供受控環境以與網頁互動。它們還整合了觀察-思考-行動迴圈，並設有人工參與的安全保障機制，意味著代理在執行關鍵操作（如購買或帳戶變更）前會暫停，並向用戶請求確認。

Microsoft 已在 Microsoft Foundry 上推出 9B 模型，4B 和 27B 版本預計將隨後推出。

為何開放權重在這裡至關重要

OpenAI 的 Operator 和 Google 的 Gemini 2.5 電腦使用功能均為專有系統。Fara1.5 為開放權重，意味著開發者可下載、修改並在自己的硬體上部署這些模型。微軟特別設計了 Fara1.5 系列，使其能在較低規格的硬體上高效運行，並隨著模型規模增大而獲得相應的擴展效益。

訓練管道也獲得了重大升級。微軟推出了 FaraGen1.5，這是一個增強的合成資料管道，可為複雜的瀏覽器互動生成更優質的訓練範例。

這對加密貨幣和去中心化金融意味著什麼

Microsoft 在設計 Fara1.5 時並未考慮加密貨幣。它與任何區塊鏈協議、DeFi 應用程式或 Web3 專案都沒有直接整合。

DeFi 介面是網頁應用程式。在 Uniswap 上交換代幣、在 Aave 上管理金庫、跨鏈橋接資產：這些都是基於瀏覽器的任務，涉及表單、確認和多步驟工作流程——這正是 Fara1.5 被訓練來處理的類型。

此處特別適用於人機協同設計。DeFi 交易是不可逆的。一個在簽署交易前暫停並要求確認的代理，能應對自主鏈上活動中最大的風險之一：意外批准惡意合約或將資金發送到錯誤的地址。