Microsoft 的 Fara1.5 AI 在網頁任務中表現優於 OpenAI 和 Google

iconCryptoBriefing
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Microsoft 的 Fara1.5 AI 模型系列在 AI + 加密貨幣新聞中受到關注,在網頁任務中表現優於 OpenAI 的 Operator 和 Google 的 Gemini 2.5。27B 版本在 Online-Mind2Web 基準測試中取得 72% 的分數,而對手分別為 58.3% 和 57.3%。這些開放權重模型允許開發者修改並在自己的硬體上部署。Fara1.5 使用沙盒瀏覽器和人工參與的保障機制來處理關鍵操作。Microsoft 將透過 Microsoft Foundry 發布全部三款模型。鏈上新聞顯示,市場對 AI 與區塊鏈基礎設施整合的興趣日益增長。

微軟研究剛剛推出了一組 AI 模型,其網頁瀏覽能力超越了 OpenAI 或 Google 所開發的任何模型。而令人感到不安的是,這些模型採用開放權重,這對閉源陣營來說無疑是一記重擊。

於5月22日發布的Fara1.5系列包含三款型號,參數分別為4B、9B和27B。旗艦型號27B在Online-Mind2Web基準測試中獲得72%的分數,這是一項嚴苛的測試,要求瀏覽器使用的AI代理處理136個實時網站上的300項任務。OpenAI的Operator僅達到58.3%,Google的Gemini 2.5 Computer Use則達到57.3%。在英文中:微軟的模型成功完成了近四分之三的實際網頁任務,而其大型科技競爭對手卻未能達到六成。

基準差距是真實的

9B 模型得分为 63.4%,儘管體積僅為 OpenAI 和 Google 專有系統的一小部分,但仍超越了這兩者。其表現與競爭對手 Yutori Navigator n1(得分为 64.7%)僅一步之遙。

為了解這個領域的發展速度:微軟先前的模型 Fara-7B 於 2025 年 11 月推出,在同一基準測試中僅取得 34.1% 的分數。這意味著該團隊在大約六個月內將性能大致翻倍。

廣告

這些模型基於 Qwen3.5 架構構建,並使用一種稱為 MagenticLite 的沙盒式瀏覽器介面,為代理提供受控環境以與網頁互動。它們還整合了觀察-思考-行動迴圈,並設有人工參與的安全保障機制,意味著代理在執行關鍵操作(如購買或帳戶變更)前會暫停,並向用戶請求確認。

Microsoft 已在 Microsoft Foundry 上推出 9B 模型,4B 和 27B 版本預計將隨後推出。

為何開放權重在這裡至關重要

OpenAI 的 Operator 和 Google 的 Gemini 2.5 電腦使用功能均為專有系統。Fara1.5 為開放權重,意味著開發者可下載、修改並在自己的硬體上部署這些模型。微軟特別設計了 Fara1.5 系列,使其能在較低規格的硬體上高效運行,並隨著模型規模增大而獲得相應的擴展效益。

訓練管道也獲得了重大升級。微軟推出了 FaraGen1.5,這是一個增強的合成資料管道,可為複雜的瀏覽器互動生成更優質的訓練範例。

這對加密貨幣和去中心化金融意味著什麼

Microsoft 在設計 Fara1.5 時並未考慮加密貨幣。它與任何區塊鏈協議、DeFi 應用程式或 Web3 專案都沒有直接整合。

DeFi 介面是網頁應用程式。在 Uniswap 上交換代幣、在 Aave 上管理金庫、跨鏈橋接資產:這些都是基於瀏覽器的任務,涉及表單、確認和多步驟工作流程——這正是 Fara1.5 被訓練來處理的類型。

此處特別適用於人機協同設計。DeFi 交易是不可逆的。一個在簽署交易前暫停並要求確認的代理,能應對自主鏈上活動中最大的風險之一:意外批准惡意合約或將資金發送到錯誤的地址。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露