Ang Fara1.5 ng Microsoft ay lumampas sa OpenAI at Google sa mga benchmark sa pag-browse ng web

Pamagat: Ang open-source na browser agent ng Microsoft na Fara1.5 ay lumalampas sa OpenAI at Google—at itinayo upang matakbo sa ilalim ng iyong kontrol Isipin ang pagpapagsabi sa isang AI na maghanap sa limang website ng paglalakbay, ihambing ang mga opsyon, punan ang form ng pag-book at kumpirmahin ang rental na pinakamalapit sa beach—tapos bumalik ka sa isang naitatapos na gawain. Iyon ang pangako ng “computer use agents”: mga modelo na binabasa ang iyong browser, kumiklik, sumasayaw at sumusulat tulad ng isang tao. Hanggang ngayon, ang pinakamabilis na mga tagapag-ugnay sa larong ito ay mga mahal, proprietary na cloud service: ang OpenAI’s Operator (isang produkto na nagkakahalaga ng $200/buwan na ipinakilala noong Enero 2025, na pagkatapos ay isinama sa ChatGPT Agent) at Google’s Gemini 2.5 Computer Use. Sa linggong ito, sinalakay ng Microsoft Research ang Fara1.5—isang kompakto, open model family na lumalampas sa parehong dalawa sa mga real-world web-browsing benchmark at ipinapahayag ang kanilang weights at inference code. Ano ang Fara1.5 - Isang pamilya ng tatlong modelo (4B, 9B, 27B parameters) na itinayo batay sa Alibaba’s Qwen3.5 base at fine-tuned ng Microsoft para sa browser tasks. (Ang mga parameters ay palaging nagpapahiwatig ng kapasidad ng modelo; mas marami ay nangangahulugan ng mas malaking kakayahan.) - Ang lahat ng model weights ay publikong inilabas at ang inference code ay nasa GitHub, kaya maaari mong matakbo ang mga agent sa hardware na iyong kontrol nang hindi nakasalalay sa isang cloud provider. Paano ito gumagana (mga real web benchmark) Inilayon ng Microsoft ang Online-Mind2Web benchmark—300 realistiko na gawain sa 136 live websites (paghahambing ng produkto, pagpupuno ng form, pag-book) na iskore sa pamamagitan ng tagumpay sa tunay, nagbabago web: - Fara1.5-27B: 72.0% - OpenAI Operator: 58.3% - Google Gemini 2.5 Computer Use: 57.3% - Yutori Navigator n1 (pinakamataas na proprietary na kalaban): 64.7% - Fara1.5-9B: 63.4% (nangunguna na sa OpenAI at Google) Ang mga open-source na kalaban ay naiwan: Alibaba’s GUI-Owl-1.5 (8B) 48.6%; AI2’s MolmoWeb 35.3%; mas nakaraang modelo ng Microsoft na Fara-7B 34.1% (kaya ang bagong release ay halos dumoble ang score ng nakaraang modelo). Sa WebVoyager, isang pangalawang live-web benchmark, ang Fara1.5-27B ay nakakuha ng 88.6% (kumpara sa 87.0% ng OpenAI Operator at H Company’s Holo2-30B sa 83.0%). Bakit ito nananalo Binago ng Microsoft ang development pipeline mula sa simula hanggang dulo. Mga pangunahing elemento: - FaraGen1.5: isang espesyal na data-generation system na gumamit ng GPT-5.4 (OpenAI’s teacher model) upang lumikha ng mataas na kalidad na demonstrations para sa pagtuturo ng Fara1.5—sa maikling salita, ginamit ng Microsoft ang isang top OpenAI model bilang guro upang turuan ang isang open na kalaban. - Synthetic domain training: anim na ganap na gumagana na kopya ng mga totoong website (email, calendar, marketplaces) na nagbigay-daan sa modelo na magsanay sa sensitibo o irreversible workflows (logins, pag-book, pagpapadala ng email) nang hindi nakakaapekto sa totoong account. - Muling disenyo ng mga layunin at orchestration: ang data, training goals, model architecture at runtime orchestration ay pinag-optimize nang sabay-sabay upang gawing matibay ang mga maliit na modelo sa “agentic” tasks. Kaligtasan at kontrol Tekniko ni Microsoft ang mga pagsasagawa. Ang mga modelo ay disenyo upang huminto at humingi ng kumpirmasyon bago gawin ang anumang irreversible action. Isang UI layer (Magnetic-UI) at isang sandboxed browser environment (MagneticLite) ay naglalatag ng bawat aksyon at nagbibigay-daan sa mga user na ipagpatawal ang agent kahit kailan. Ayon kay Yash Lara ng Microsoft, mahalaga ang pagbalanse ng malakas na checkpoints at malinis na user flows upang maiwasan ang approval fatigue habang pinapanatili ang kaligtasan ng mga user. Ito ay nagsasalungat sa mga nakaraang babala mula sa OpenAI tungkol sa pag-access ng mga agent sa sensitibong data kapag naka-sign in sa mga serbisyo; ang paraan ni Microsoft ay nagtatampok ng sandbox at eksplisitong logging. Bakit dapat pansinin ito ng crypto users - Open weights + on-prem inference = self-sovereignty. Ang pagtatakbo ng agentic models sa kontroladong infrastructure ay tumutugma sa pagbibigay-diin ng crypto sa custody at decentralization (isipin ang self-hosted bots na makakaintereksa sa dApps, exchange o DAO tooling nang hindi ipinapakita ang mga key sa third-party clouds). - Auditable behavior: ang sandbox logs at public code ay nagiging mas madali para sa mga auditor at developer na i-verify ang pag-uugali ng agent at i-integrate ang mga safeguard sa smart contract workflows. - Competitive landscape: isang open, mataas na performance agent ay nagbabawas sa risk ng lock-in sa malalaking cloud APIs at maaaring mabilisang palawakin ang mga tooling na nag-iintegrate ng AI agents sa on-chain systems. Kakayahan at susunod na hakbang - Ang Fara1.5-9B ay agad nasa Azure AI Foundry; ang 4B at 27B variants ay darating nang maaga. - Planohin ng Microsoft na palawakin ang Fara1.5 labas sa browser patungo sa desktop at enterprise software. Kabuuan Ang Fara1.5 ay isang milestone: isang publikong inilabas, kompetitibong gumagana browser agent na lumalampas sa proprietary alternatives sa live-web benchmarks habang nag-aalok ng kontrol at transparency na mahalaga sa mga komunidad na may pananagutan sa privacy at decentralized. Kung mahalaga sayo ang pagtatakbo ng makapagpapagana agents sa iyong sariling stack—mula sa automated trading helpers hanggang DAO assistants—ito ay dapat pansinin.