MicrosoftのFara1.5が、Web閲覧ベンチマークでOpenAIおよびGoogleを上回る

Microsoftのオープンソースブラウザエージェント「Fara1.5」、OpenAIやGoogleを上回り、ユーザーの管理下で動作するよう設計されている AIに5つの旅行サイトを調査し、オプションを比較して予約フォームを入力し、ビーチに最も近い宿泊施設を確定するよう指示して、戻ってきたときにすでに完了している状態になっている——それが「コンピュータ使用エージェント」が約束する未来だ。これらのモデルは、ブラウザを読み取り、クリック・スクロール・入力を行い、人間のように動作する。これまでこの分野で最も進んでいたのは高価なプロプライエタリなクラウドサービスだった：OpenAIのOperator（2025年1月に月額200ドルでリリースされ、後にChatGPT Agentに統合された）およびGoogleのGemini 2.5 Computer Use。今週、Microsoft ResearchはFara1.5を発表し、このコンパクトなオープンモデルファミリーが実際のウェブ閲覧ベンチマークで両者を上回り、重みと推論コードを公開した。 **Fara1.5とは** - AlibabaのQwen3.5をベースとし、Microsoftがブラウザタスク用に微調整した3つのモデル（4B、9B、27Bパラメータ）からなるファミリー。（パラメータはモデルの能力を大まかに示す。多いほどより高い能力を意味する。） - すべてのモデル重みが公開されており、推論コードはGitHubに掲載されているため、クラウドプロバイダーに依存せず、自分で管理するハードウェア上でエージェントを実行できる。 **実際のウェブベンチマークでの性能** Microsoftは「Online-Mind2Web」ベンチマークをターゲットにした。これは136のライブウェブサイト（製品比較、フォーム入力、予約など）における300の現実的なタスクで構成され、変化し続ける実際のウェブ上で成功したかで評価される： - Fara1.5-27B：72.0% - OpenAI Operator：58.3% - Google Gemini 2.5 Computer Use：57.3% - Yutori Navigator n1（トップのプロプライエタリ競合）：64.7% - Fara1.5-9B：63.4%（OpenAIとGoogleを既に上回る）オープンソース競合は遅れている：AlibabaのGUI-Owl-1.5（8B）48.6%；AI2のMolmoWeb 35.3%；Microsoftの旧モデルFara-7B 34.1%（新バージョンは前モデルのスコアをほぼ2倍に向上）。第2のライブウェブベンチマーク「WebVoyager」では、Fara1.5-27Bが88.6%を記録（OpenAI Operatorは87.0%、H社のHolo2-30Bは83.0%）。 **勝利の理由** Microsoftは開発パイプラインをエンドツーエンドで再構築した。主な要素： - FaraGen1.5：GPT-5.4（OpenAIの教師モデル）を使用してFara1.5のトレーニング用高品質なデモデータを生成する独自のデータ生成システム——つまりMicrosoftはトップレベルのOpenAIモデルを教師として活用し、オープンな競合モデルを訓練した。 - シンセティックドメイントレーニング：メール・カレンダー・マーケットプレイスなど6つの本物と同等の機能を持つサイトのレプリカを使用し、ログイン・予約・メール送信などのセンシティブまたは不可逆的なワークフローを実際のアカウントに触れることなく反復練習可能。 - 再設計された目的とオーケストレーション：データ・トレーニング目標・モデルアーキテクチャ・ランタイムオーケストレーションを統合して最適化し、小規模モデルでも「エージェント」タスクに堅牢に対応できるようにした。 **セキュリティと制御** Microsoftはセーフガードを強調した。モデルは不可逆的な操作を行う前に一時停止してユーザーの確認を求めることを設計している。UIレイヤー（Magnetic-UI）とサンドボックス化されたブラウザ環境（MagneticLite）がすべての操作をログ記録し、ユーザーがいつでもエージェントを停止できるようにしている。MicrosoftのYash Lara氏によると、強力なチェックポイントとスムーズなユーザー体験のバランスが重要であり、承認疲労を避けつつユーザーを安全に保つ必要がある。これはOpenAIが以前に警告した「エージェントがサービスにログインした際にセンシティブなデータにアクセスする可能性」に対するアプローチとは対照的で、Microsoftはサンドボックスと明示的なログ記録を前面に出している。 **暗号通貨関係者が注目すべき理由** - オープン重み＋オンプレミス推論＝自己主権。制御されたインフラ上でエージェントモデルを実行することは、暗号通貨が重視する保管と分散化と一致する（DAppや取引所、DAOツールとやり取りするセルフホスト型ボットを開発し、鍵をサードパーティクラウドに暴露しないことが可能）。 - 監査可能な行動：サンドボックスログと公開コードにより、監査人や開発者がエージェントの行動を検証し、スマートコントラクトワークフローにセーフガードを統合しやすくなる。 - 競争環境：オープンで高性能なエージェントは大手クラウドAPIへのロックインリスクを低減し、オンチェーンシステムとAIエージェントを統合するツールの開発加速につながる可能性がある。 **利用可能状況と今後の展開** - Fara1.5-9BはすでにAzure AI Foundryで利用可能。4Bおよび27Bバージョンは近日中にリリース予定。 - MicrosoftはFara1.5をブラウザを超えてデスクトップおよびエンタープライズソフトウェアへ拡張する計画。 **まとめ** Fara1.5は画期的な成果だ。公開され、実際のウェブベンチマークでプロプライエタリな競合を上回るブラウザエージェントでありながら、プライバシー重視および分散化コミュニティにとって重要な制御性と透明性を提供している。自動取引アシスタントからDAOアシスタントまで、自らのスタック上で高性能なエージェントを実行したいなら、これは注目に値する。