Fara1.5 Microsoft Ungguli OpenAI dan Google dalam Uji Coba Penjelajahan Web

iconChainGPT
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita on-chain muncul saat Microsoft Research meluncurkan Fara1.5, agen peramban yang mengungguli OpenAI dan Google dalam uji coba web. Dibangun berdasarkan Qwen3.5, Fara1.5-27B mencapai skor 72,0% di Online-Mind2Web dan 88,6% di WebVoyager. Model ini mencakup varian 4B, 9B, dan 27B, dengan bobot dan kode yang telah di-open-source. Fitur keamanan seperti penelusuran di sandbox selaras dengan tren berita terkait aset nyata (RWA). Fara1.5-9B kini tersedia di Azure AI Foundry, sementara varian lainnya segera menyusul.

Headline: Agen browser open-source Microsoft, Fara1.5, ungguli OpenAI dan Google — dan dirancang untuk dijalankan di bawah kendali Anda Bayangkan meminta AI untuk menelusuri lima situs perjalanan, membandingkan pilihan, mengisi formulir pemesanan, dan mengonfirmasi penyewaan terdekat ke pantai—lalu kembali menemukan tugas sudah selesai. Itulah janji dari “agen pengguna komputer”: model yang membaca browser Anda, mengklik, menggulir, dan mengetik seperti manusia. Hingga kini, pemimpin tercepat dalam perlombaan ini adalah layanan cloud proprietary yang mahal: Operator OpenAI (produk $200/bulan yang diluncurkan pada Januari 2025, kemudian digabungkan ke dalam ChatGPT Agent) dan Gemini 2.5 Computer Use milik Google. Pekan ini, Microsoft Research membalikkan keadaan dengan Fara1.5—keluarga model kompak open-source yang mengungguli keduanya dalam benchmark penjelajahan web nyata, serta merilis bobot dan kode inferensinya. Apa itu Fara1.5 - Sebuah keluarga tiga model (4B, 9B, 27B parameter) yang dibangun berdasarkan dasar Qwen3.5 milik Alibaba dan disesuaikan oleh Microsoft untuk tugas browser. (Parameter secara longgar menunjukkan kapasitas model; semakin banyak biasanya berarti semakin mampu.) - Semua bobot model dirilis secara publik dan kode inferensinya tersedia di GitHub, sehingga Anda dapat menjalankan agen pada perangkat keras yang Anda kendalikan, bukan bergantung pada penyedia cloud. Bagaimana kinerjanya (benchmark web nyata) Microsoft menargetkan benchmark Online-Mind2Web—300 tugas realistis di 136 situs web aktif (perbandingan produk, pengisian formulir, pemesanan) yang dinilai berdasarkan keberhasilan di web nyata yang berubah-ubah: - Fara1.5-27B: 72,0% - Operator OpenAI: 58,3% - Google Gemini 2.5 Computer Use: 57,3% - Yutori Navigator n1 (pesaing proprietary teratas): 64,7% - Fara1.5-9B: 63,4% (sudah lebih unggul daripada OpenAI dan Google) Peserta open-source tertinggal: GUI-Owl-1.5 Alibaba (8B) 48,6%; MolmoWeb AI2 35,3%; Fara-7B lama Microsoft 34,1% (sehingga rilis baru hampir menggandakan skor model sebelumnya). Pada WebVoyager, benchmark web aktif kedua, Fara1.5-27B mencetak 88,6% (vs 87,0% milik Operator OpenAI dan Holo2-30B milik H Company pada 83,0%). Mengapa ia menang Microsoft membangun ulang seluruh pipeline pengembangan dari awal hingga akhir. Elemen kunci: - FaraGen1.5: sistem generasi data khusus yang menggunakan GPT-5.4 (model guru OpenAI) untuk menghasilkan demonstrasi berkualitas tinggi guna melatih Fara1.5—singkatnya, Microsoft memanfaatkan model OpenAI teratas sebagai guru untuk melatih pesaing open-source. - Pelatihan domain sintetis: enam replika fungsional penuh dari situs nyata (email, kalender, pasar) memungkinkan model berlatih alur kerja sensitif atau ireversibel (login, pemesanan, mengirim email) tanpa menyentuh akun nyata. - Tujuan dan orkestrasi yang dirancang ulang: data, tujuan pelatihan, arsitektur model, dan orkestrasi runtime dioptimalkan bersama agar model kecil tetap tangguh dalam tugas “agentic”. Keamanan dan kendali Microsoft menekankan perlindungan. Model dirancang untuk berhenti dan meminta konfirmasi sebelum melakukan tindakan ireversibel. Lapisan UI (Magnetic-UI) dan lingkungan browser sandboxed (MagneticLite) mencatat setiap tindakan dan memungkinkan pengguna menghentikan agen kapan saja. Seperti yang dicatat Yash Lara dari Microsoft, menyeimbangkan checkpoint kuat dengan alur pengguna yang lancar sangat penting untuk menghindari kelelahan persetujuan sambil tetap menjaga keamanan pengguna. Ini berbeda dengan peringatan sebelumnya dari OpenAI tentang agen yang mengakses data sensitif saat masuk ke layanan; pendekatan Microsoft menonjolkan sandbox dan pencatatan eksplisit. Mengapa orang kripto harus peduli - Bobot terbuka + inferensi on-prem = kedaulatan diri. Menjalankan model agentic pada infrastruktur terkendali selaras dengan penekanan kripto pada kepemilikan dan desentralisasi (bayangkan bot self-hosted yang dapat berinteraksi dengan dapp, bursa, atau alat DAO tanpa mengekspos kunci ke cloud pihak ketiga). - Perilaku yang dapat diaudit: log sandbox dan kode publik membuatnya lebih mudah bagi auditor dan pengembang untuk memverifikasi perilaku agen serta mengintegrasikan pengamanan ke dalam alur kerja kontrak pintar. - Lanskap kompetitif: agen open-source berkinerja tinggi mengurangi risiko ketergantungan pada API cloud besar dan dapat mempercepat pengembangan alat yang mengintegrasikan agen AI dengan sistem on-chain. Ketersediaan dan langkah selanjutnya - Fara1.5-9B sudah tersedia di Azure AI Foundry; varian 4B dan 27B akan segera hadir. - Microsoft berencana memperluas Fara1.5 melebihi browser ke perangkat lunak desktop dan perusahaan. Intinya Fara1.5 adalah tonggak sejarah: agen browser yang dirilis secara publik, berkinerja kompetitif, mengungguli alternatif proprietary dalam benchmark web nyata, sekaligus menawarkan kendali dan transparansi yang penting bagi komunitas yang peduli privasi dan desentralisasi. Jika Anda peduli menjalankan agen canggih di stack Anda sendiri—dari asisten perdagangan otomatis hingga asisten DAO—ini patut diperhatikan.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.