Fara1.5 Microsoft Ungguli OpenAI dan Google dalam Uji Coba Penjelajahan Web

Headline: Agen browser open-source Microsoft, Fara1.5, ungguli OpenAI dan Google — dan dirancang untuk dijalankan di bawah kendali Anda Bayangkan meminta AI untuk menelusuri lima situs perjalanan, membandingkan pilihan, mengisi formulir pemesanan, dan mengonfirmasi penyewaan terdekat ke pantai—lalu kembali menemukan tugas sudah selesai. Itulah janji dari “agen pengguna komputer”: model yang membaca browser Anda, mengklik, menggulir, dan mengetik seperti manusia. Hingga kini, pemimpin tercepat dalam perlombaan ini adalah layanan cloud proprietary yang mahal: Operator OpenAI (produk $200/bulan yang diluncurkan pada Januari 2025, kemudian digabungkan ke dalam ChatGPT Agent) dan Gemini 2.5 Computer Use milik Google. Pekan ini, Microsoft Research membalikkan keadaan dengan Fara1.5—keluarga model kompak open-source yang mengungguli keduanya dalam benchmark penjelajahan web nyata, serta merilis bobot dan kode inferensinya. Apa itu Fara1.5 - Sebuah keluarga tiga model (4B, 9B, 27B parameter) yang dibangun berdasarkan dasar Qwen3.5 milik Alibaba dan disesuaikan oleh Microsoft untuk tugas browser. (Parameter secara longgar menunjukkan kapasitas model; semakin banyak biasanya berarti semakin mampu.) - Semua bobot model dirilis secara publik dan kode inferensinya tersedia di GitHub, sehingga Anda dapat menjalankan agen pada perangkat keras yang Anda kendalikan, bukan bergantung pada penyedia cloud. Bagaimana kinerjanya (benchmark web nyata) Microsoft menargetkan benchmark Online-Mind2Web—300 tugas realistis di 136 situs web aktif (perbandingan produk, pengisian formulir, pemesanan) yang dinilai berdasarkan keberhasilan di web nyata yang berubah-ubah: - Fara1.5-27B: 72,0% - Operator OpenAI: 58,3% - Google Gemini 2.5 Computer Use: 57,3% - Yutori Navigator n1 (pesaing proprietary teratas): 64,7% - Fara1.5-9B: 63,4% (sudah lebih unggul daripada OpenAI dan Google) Peserta open-source tertinggal: GUI-Owl-1.5 Alibaba (8B) 48,6%; MolmoWeb AI2 35,3%; Fara-7B lama Microsoft 34,1% (sehingga rilis baru hampir menggandakan skor model sebelumnya). Pada WebVoyager, benchmark web aktif kedua, Fara1.5-27B mencetak 88,6% (vs 87,0% milik Operator OpenAI dan Holo2-30B milik H Company pada 83,0%). Mengapa ia menang Microsoft membangun ulang seluruh pipeline pengembangan dari awal hingga akhir. Elemen kunci: - FaraGen1.5: sistem generasi data khusus yang menggunakan GPT-5.4 (model guru OpenAI) untuk menghasilkan demonstrasi berkualitas tinggi guna melatih Fara1.5—singkatnya, Microsoft memanfaatkan model OpenAI teratas sebagai guru untuk melatih pesaing open-source. - Pelatihan domain sintetis: enam replika fungsional penuh dari situs nyata (email, kalender, pasar) memungkinkan model berlatih alur kerja sensitif atau ireversibel (login, pemesanan, mengirim email) tanpa menyentuh akun nyata. - Tujuan dan orkestrasi yang dirancang ulang: data, tujuan pelatihan, arsitektur model, dan orkestrasi runtime dioptimalkan bersama agar model kecil tetap tangguh dalam tugas “agentic”. Keamanan dan kendali Microsoft menekankan perlindungan. Model dirancang untuk berhenti dan meminta konfirmasi sebelum melakukan tindakan ireversibel. Lapisan UI (Magnetic-UI) dan lingkungan browser sandboxed (MagneticLite) mencatat setiap tindakan dan memungkinkan pengguna menghentikan agen kapan saja. Seperti yang dicatat Yash Lara dari Microsoft, menyeimbangkan checkpoint kuat dengan alur pengguna yang lancar sangat penting untuk menghindari kelelahan persetujuan sambil tetap menjaga keamanan pengguna. Ini berbeda dengan peringatan sebelumnya dari OpenAI tentang agen yang mengakses data sensitif saat masuk ke layanan; pendekatan Microsoft menonjolkan sandbox dan pencatatan eksplisit. Mengapa orang kripto harus peduli - Bobot terbuka + inferensi on-prem = kedaulatan diri. Menjalankan model agentic pada infrastruktur terkendali selaras dengan penekanan kripto pada kepemilikan dan desentralisasi (bayangkan bot self-hosted yang dapat berinteraksi dengan dapp, bursa, atau alat DAO tanpa mengekspos kunci ke cloud pihak ketiga). - Perilaku yang dapat diaudit: log sandbox dan kode publik membuatnya lebih mudah bagi auditor dan pengembang untuk memverifikasi perilaku agen serta mengintegrasikan pengamanan ke dalam alur kerja kontrak pintar. - Lanskap kompetitif: agen open-source berkinerja tinggi mengurangi risiko ketergantungan pada API cloud besar dan dapat mempercepat pengembangan alat yang mengintegrasikan agen AI dengan sistem on-chain. Ketersediaan dan langkah selanjutnya - Fara1.5-9B sudah tersedia di Azure AI Foundry; varian 4B dan 27B akan segera hadir. - Microsoft berencana memperluas Fara1.5 melebihi browser ke perangkat lunak desktop dan perusahaan. Intinya Fara1.5 adalah tonggak sejarah: agen browser yang dirilis secara publik, berkinerja kompetitif, mengungguli alternatif proprietary dalam benchmark web nyata, sekaligus menawarkan kendali dan transparansi yang penting bagi komunitas yang peduli privasi dan desentralisasi. Jika Anda peduli menjalankan agen canggih di stack Anda sendiri—dari asisten perdagangan otomatis hingga asisten DAO—ini patut diperhatikan.