Microsoft Research baru saja meluncurkan serangkaian model AI yang dapat menjelajahi web lebih baik daripada apa pun yang dibangun oleh OpenAI atau Google. Dan dalam kejutan yang seharusnya membuat kelompok closed-source merasa tidak nyaman, model-model ini bersifat open-weight.
Keluarga Fara1.5, dirilis pada 22 Mei, terdiri dari tiga model dengan 4B, 9B, dan 27B parameter. Varian unggulan 27B mencapai skor 72% pada benchmark Online-Mind2Web, ujian berat yang menguji 300 tugas di 136 situs web langsung kepada agen AI yang menggunakan browser. OpenAI’s Operator mencapai 58,3%. Gemini 2.5 Computer Use dari Google mencapai 57,3%. Dalam bahasa Inggris: Model Microsoft berhasil menyelesaikan hampir tiga perempat tugas web dunia nyata, sementara pesaing Big Tech-nya tidak mampu mencapai enam dari sepuluh.
Celah patokan itu nyata
Model 9B mendapat skor 63,4%, yang menjadikannya lebih unggul daripada sistem propieter OpenAI dan Google meskipun ukurannya hanya sebagian kecil dari keduanya. Model ini hampir menyamai Yutori Navigator n1, agen kompetitif yang mencatat skor 64,7%.
Sebagai konteks tentang seberapa cepat ruang ini bergerak: model sebelumnya Microsoft, Fara-7B, diluncurkan pada November 2025 dan mendapatkan skor hanya 34,1% pada benchmark yang sama. Artinya, tim tersebut hampir menggandakan kinerja dalam sekitar enam bulan.
Model-model dibangun berdasarkan arsitektur Qwen3.5 dan menggunakan sesuatu yang disebut MagenticLite, antarmuka browser terisolasi yang memberikan agen lingkungan terkendali untuk berinteraksi dengan halaman web. Mereka juga menggabungkan siklus observe-think-act dengan pengaman human-in-the-loop, yang berarti agen berhenti sebelum menjalankan tindakan kritis seperti pembelian atau perubahan akun dan meminta konfirmasi dari pengguna.
Microsoft telah menyediakan model 9B di Microsoft Foundry, dengan versi 4B dan 27B diharapkan menyusul.
Mengapa open-weight penting di sini
Operator OpenAI dan Gemini 2.5 Computer Use dari Google adalah sistem propietari. Fara1.5 yang bersifat open-weight berarti pengembang dapat mengunduh, memodifikasi, dan meng部署 model-model ini pada perangkat keras mereka sendiri. Microsoft secara khusus merancang keluarga Fara1.5 agar berjalan secara efisien pada perangkat keras sederhana, dengan manfaat penskalaan proporsional saat Anda beralih ke model yang lebih besar.
Pipeline pelatihan juga mengalami peningkatan signifikan. Microsoft memperkenalkan FaraGen1.5, pipeline data sintetis yang ditingkatkan yang menghasilkan contoh pelatihan lebih baik untuk interaksi browser yang kompleks.
Apa artinya ini bagi crypto dan DeFi
Microsoft tidak membangun Fara1.5 dengan mempertimbangkan kripto. Tidak ada integrasi langsung dengan protokol blockchain, aplikasi DeFi, atau proyek Web3 apa pun.
Antarmuka DeFi adalah aplikasi web. Menukar token di Uniswap, mengelola vault di Aave, menjembatani aset di berbagai rantai: semua ini adalah tugas berbasis browser yang melibatkan formulir, konfirmasi, dan alur kerja multi-langkah — tepat jenis hal yang dilatih Fara1.5 untuk tangani.
Desain human-in-the-loop sangat relevan di sini. Transaksi DeFi bersifat tidak dapat dibatalkan. Sebuah agen yang menghentikan proses sebelum menandatangani transaksi dan meminta konfirmasi menangani salah satu risiko terbesar dalam aktivitas otomatis di blockchain: secara tidak sengaja menyetujui kontrak jahat atau mengirim dana ke alamat yang salah.
