Microsoft Researchは、OpenAIやGoogleが開発したどのモデルよりもウェブをより良く閲覧できる一連のAIモデルをリリースしました。そして、クローズドソース派を不快にさせるような展開として、これらのモデルはオープンウェイトです。
5月22日にリリースされたFara1.5ファミリーは、4B、9B、27Bのパラメータを備えた3つのモデルで構成されています。フラグシップモデルである27Bバージョンは、136のライブウェブサイトにまたがる300のタスクをブラウザを使用するAIエージェントに課す厳しいテストであるOnline-Mind2Webベンチマークで72%のスコアを記録しました。OpenAIのOperatorは58.3%、GoogleのGemini 2.5 Computer Useは57.3%を達成しました。英語版:マイクロソフトのモデルは、現実のウェブタスクのほぼ3分の2を成功裏に完了したのに対し、大手テクノロジー企業の競合他社は10個中6個もクリアできませんでした。
ベンチマークギャップは現実です
9Bモデルは63.4%のスコアを記録し、そのサイズはわずかだが、OpenAIおよびGoogleの独自システムを上回った。競合エージェントであるYutori Navigator n1(64.7%)に迫る結果となった。
この分野がどれほど速く進んでいるかの背景として:Microsoftの以前のモデルFara-7Bは2025年11月にリリースされ、同じベンチマークで34.1%のスコアを記録しました。つまり、チームは約6ヶ月でパフォーマンスをほぼ2倍に向上させたことになります。
これらのモデルはQwen3.5アーキテクチャに基づいて構築され、MagenticLiteと呼ばれるサンドボックス型ブラウザインターフェースを使用して、エージェントがWebページと安全にやり取りできる環境を提供します。また、観察・思考・行動のループにヒューマン・イン・ザ・ループのセーフガードを組み込んでおり、エージェントは購入や口座変更などの重要な操作を実行する前に一時停止し、ユーザーの確認を求めます。
Microsoftは、9BモデルをMicrosoft Foundryで提供開始し、4Bおよび27Bバージョンも順次提供される予定です。
なぜオープンウェイトがここでは重要なのか
OpenAIのOperatorとGoogleのGemini 2.5 Computer Useはプロプライエタリなシステムです。Fara1.5がオープンウェイトであるということは、開発者がこれらのモデルをダウンロードし、自前のハードウェア上で変更・デプロイできることを意味します。Microsoftは、Fara1.5ファミリーを、控えめなハードウェアでも効率的に動作するように設計し、モデルサイズが大きくなるにつれて比例したスケーリングの利点を提供しています。
トレーニングパイプラインも大幅にアップグレードされました。Microsoftは、複雑なブラウザ操作のためのより優れたトレーニング例を生成する強化されたシンセティックデータパイプライン、FaraGen1.5を導入しました。
これは暗号資産とDeFiにどのような意味を持つのか
MicrosoftはFara1.5を暗号資産を念頭に置いて構築していません。どのブロックチェーンプロトコル、DeFiアプリケーション、またはWeb3プロジェクトとも直接統合されていません。
DeFiインターフェースはウェブアプリケーションです。Uniswapでのトークン交換、Aaveでのバウト管理、チェーン間での資産ブリッジング—allはフォーム、確認、複数ステップのワークフローを伴うブラウザベースのタスクであり、これらはFara1.5が訓練された処理対象とまさに一致します。
ここで特に重要なのは、ヒューマン・イン・ザ・ループの設計です。DeFiの取引は取り消せません。取引に署名する前に一時停止して確認を求めるエージェントは、自動的なオンチェーン活動における最大のリスクの一つ、つまり悪意のある契約を誤って承認したり、資金を間違ったアドレスに送金したりすることを防ぎます。
