Fara1.5 Microsoft Mengungguli OpenAI dan Google dalam Ujian Pelayaran Web

Judul: Agen peramban sumber terbuka Microsoft, Fara1.5, mengungguli OpenAI dan Google — dan dibangun untuk berjalan di bawah kendali Anda Bayangkan meminta AI untuk menjelajahi lima laman perjalanan, membandingkan pilihan, mengisi formulir pemesanan, dan mengonfirmasi penyewaan terdekat ke pantai — lalu kembali menemukan tugas telah selesai. Itulah janji dari “agen penggunaan komputer”: model yang membaca peramban Anda, mengklik, menggulir, dan mengetik seperti manusia. Hingga kini, pemimpin tercepat dalam perlombaan ini adalah layanan cloud eksklusif yang mahal: Operator OpenAI (produk $200/bulan yang diluncurkan pada Januari 2025, kemudian digabungkan ke dalam ChatGPT Agent) dan Gemini 2.5 Computer Use milik Google. Pekan ini, Microsoft Research membalikkan keadaan dengan Fara1.5 — keluarga model ringkas dan sumber terbuka yang mengungguli keduanya dalam uji coba peramban web nyata, serta mempublikasikan bobot dan kode inferensinya. Apa itu Fara1.5 - Sebuah keluarga tiga model (4B, 9B, 27B parameter) yang dibangun di atas dasar Qwen3.5 milik Alibaba dan disesuaikan oleh Microsoft untuk tugas peramban. (Parameter secara longgar menunjukkan kapasitas model; semakin banyak biasanya berarti semakin mampu.) - Semua bobot model dirilis secara publik dan kode inferensinya tersedia di GitHub, sehingga Anda dapat menjalankan agen pada perangkat keras yang Anda kendalikan, bukan bergantung pada penyedia cloud. Bagaimana kinerjanya (uji coba web nyata) Microsoft menargetkan benchmark Online-Mind2Web — 300 tugas realistis di 136 situs web aktif (perbandingan produk, pengisian formulir, pemesanan) yang dinilai berdasarkan keberhasilan di web nyata yang berubah-ubah: - Fara1.5-27B: 72.0% - Operator OpenAI: 58.3% - Google Gemini 2.5 Computer Use: 57.3% - Yutori Navigator n1 (pesaing eksklusif teratas): 64.7% - Fara1.5-9B: 63.4% (sudah di atas OpenAI dan Google) Peserta sumber terbuka tertinggal: GUI-Owl-1.5 Alibaba (8B) 48.6%; MolmoWeb AI2 35.3%; Fara-7B lama Microsoft 34.1% (sehingga rilis baru hampir menggandakan skor model sebelumnya). Pada WebVoyager, benchmark web aktif kedua, Fara1.5-27B mencetak 88.6% (vs 87.0% milik Operator OpenAI dan Holo2-30B milik H Company pada 83.0%). Mengapa ia menang Microsoft membangun ulang alur pengembangan secara keseluruhan. Elemen kunci: - FaraGen1.5: sistem generasi data khusus yang menggunakan GPT-5.4 (model guru OpenAI) untuk menghasilkan demonstrasi berkualitas tinggi guna melatih Fara1.5 — singkatnya, Microsoft memanfaatkan model OpenAI teratas sebagai guru untuk melatih pesaing sumber terbuka. - Pelatihan domain sintetis: enam replika fungsional penuh dari situs nyata (email, kalender, pasar) memungkinkan model berlatih alur kerja sensitif atau ireversibel (login, pemesanan, mengirim email) tanpa menyentuh akaun nyata. - Tujuan dan orkestrasi yang dirancang ulang: data, tujuan pelatihan, arsitektur model, dan orkestrasi runtime dioptimalkan bersama agar model kecil tetap tangguh dalam tugas “agen”. Keamanan dan kendali Microsoft menekankan perlindungan. Model dirancang untuk berhenti dan meminta konfirmasi sebelum tindakan ireversibel. Lapisan antarmuka (Magnetic-UI) dan lingkungan peramban sandbox (MagneticLite) mencatat setiap tindakan dan memungkinkan pengguna menghentikan agen kapan saja. Seperti yang dicatat Yash Lara dari Microsoft, menyeimbangkan titik pemeriksaan kuat dengan alur pengguna yang lancar sangat penting untuk menghindari kelelahan persetujuan sambil tetap menjaga keamanan pengguna. Ini berbeda dengan peringatan sebelumnya dari OpenAI tentang agen yang mengakses data sensitif saat masuk ke layanan; pendekatan Microsoft menonjolkan sandbox dan pencatatan eksplisit. Mengapa orang kripto harus peduli - Bobot sumber terbuka + inferensi on-prem = kedaulatan diri. Menjalankan model agen pada infrastruktur yang dikendalikan selaras dengan penekanan kripto pada kepemilikan dan desentralisasi (bayangkan bot yang dihosting sendiri yang dapat berinteraksi dengan dapp, bursa, atau alat DAO tanpa mengekspos kunci ke cloud pihak ketiga). - Perilaku dapat diaudit: log sandbox dan kode publik membuatnya lebih mudah bagi auditor dan pengembang untuk memverifikasi perilaku agen serta mengintegrasikan perlindungan ke dalam alur kerja kontrak pintar. - Lanskap kompetitif: agen sumber terbuka berkinerja tinggi mengurangi risiko ketergantungan pada API cloud besar dan dapat mempercepat pengembangan alat yang mengintegrasikan agen AI dengan sistem on-chain. Ketersediaan dan langkah selanjutnya - Fara1.5-9B sudah tersedia di Azure AI Foundry; varian 4B dan 27B akan segera hadir. - Microsoft berencana memperluas Fara1.5 melebihi peramban ke perangkat lunak desktop dan perusahaan. Intinya Fara1.5 adalah tonggak sejarah: agen peramban yang dirilis secara publik, berkinerja kompetitif, yang mengungguli alternatif eksklusif dalam uji coba web nyata sambil menawarkan kendali dan transparansi yang penting bagi komunitas yang peduli privasi dan desentralisasi. Jika Anda peduli menjalankan agen berkapasitas tinggi di stack Anda sendiri — mulai dari asisten perdagangan otomatis hingga asisten DAO — ini patut diperhatikan.