Fara1.5 da Microsoft supera OpenAI e Google em benchmarks de navegação na web

Título: O agente de navegador de código aberto da Microsoft, Fara1.5, supera a OpenAI e o Google — e foi projetado para funcionar sob seu controle Imagine dizer a uma IA para pesquisar cinco sites de viagem, comparar opções, preencher um formulário de reserva e confirmar o aluguel mais próximo da praia — e voltar para encontrar a tarefa concluída. Essa é a promessa dos “agentes de uso de computador”: modelos que leem seu navegador, clicam, rolam e digitam como um ser humano. Até agora, os principais avanços nessa corrida eram serviços em nuvem caros e proprietários: o Operator da OpenAI (um produto de US$ 200/mês lançado em janeiro de 2025, posteriormente integrado ao ChatGPT Agent) e o Gemini 2.5 Computer Use do Google. Esta semana, a Microsoft Research inverteu a lógica com o Fara1.5 — uma família compacta de modelos de código aberto que supera ambos nos benchmarks de navegação web reais e publica seus pesos e código de inferência. O que é o Fara1.5 - Uma família de três modelos (4B, 9B, 27B parâmetros) construídos sobre a base Qwen3.5 da Alibaba e finetuneados pela Microsoft para tarefas de navegador. (Parâmetros indicam aproximadamente a capacidade de um modelo; mais parâmetros geralmente significam mais capacidade.) - Todos os pesos dos modelos foram liberados publicamente e o código de inferência está no GitHub, permitindo que você execute agentes em hardware que controla, em vez de depender de um provedor de nuvem. Como ele se desempenha (benchmarks web reais) A Microsoft focou no benchmark Online-Mind2Web — 300 tarefas realistas em 136 sites ao vivo (comparações de produtos, preenchimento de formulários, reservas) avaliadas pelo sucesso na web real e em constante mudança: - Fara1.5-27B: 72,0% - Operator da OpenAI: 58,3% - Gemini 2.5 Computer Use do Google: 57,3% - Yutori Navigator n1 (principal rival proprietário): 64,7% - Fara1.5-9B: 63,4% (já à frente da OpenAI e do Google) Concorrentes de código aberto ficaram para trás: GUI-Owl-1.5 da Alibaba (8B) 48,6%; MolmoWeb da AI2 35,3%; Fara-7B anterior da Microsoft 34,1% (portanto, a nova versão quase duplica a pontuação do modelo anterior). No WebVoyager, segundo benchmark web ao vivo, o Fara1.5-27B obteve 88,6% (contra 87,0% do Operator da OpenAI e 83,0% do Holo2-30B da H Company). Por que ele vence A Microsoft reconstruiu o pipeline de desenvolvimento de ponta a ponta. Elementos-chave: - FaraGen1.5: um sistema bespoke de geração de dados que usou o GPT-5.4 (modelo professor da OpenAI) para produzir demonstrações de alta qualidade para treinar o Fara1.5 — em resumo, a Microsoft aproveitou um dos principais modelos da OpenAI como professor para treinar um concorrente aberto. - Treinamento em domínios sintéticos: seis réplicas totalmente funcionais de sites reais (email, calendário, marketplaces) permitiram ao modelo praticar fluxos sensíveis ou irreversíveis (logins, reservas, envio de e-mails) sem tocar em contas reais. - Objetivos e orquestração redesenhados: dados, objetivos de treinamento, arquitetura do modelo e orquestração em tempo real foram otimizados juntos para tornar modelos pequenos robustos em tarefas “agentes”. Segurança e controle A Microsoft enfatizou salvaguardas. Os modelos foram projetados para pausar e solicitar confirmação antes de ações irreversíveis. Uma camada UI (Magnetic-UI) e um ambiente de navegador isolado (MagneticLite) registram todas as ações e permitem que os usuários parem o agente a qualquer momento. Como observou Yash Lara da Microsoft, equilibrar checkpoints fortes com fluxos suaves do usuário é essencial para evitar fadiga por aprovação enquanto mantém os usuários seguros. Isso contrasta com alertas anteriores da OpenAI sobre agentes acessando dados sensíveis quando conectados a serviços; a abordagem da Microsoft prioriza um sandbox e registro explícito. Por que pessoas de cripto devem se importar - Pesos abertos + inferência on-prem = autossuficiência. Executar modelos agentes em infraestrutura controlada alinha-se com a ênfase da cripto em custódia e descentralização (pense em bots auto-hospedados que podem interagir com dApps, exchanges ou ferramentas DAO sem expor chaves a nuvens de terceiros). - Comportamento auditável: logs do sandbox e código público facilitam a verificação do comportamento do agente e a integração de salvaguardas em fluxos de contrato inteligente por auditores e desenvolvedores. - Landscape competitivo: um agente aberto e de alto desempenho reduz o risco de dependência de grandes APIs de nuvem e pode acelerar ferramentas que integram agentes de IA com sistemas on-chain. Disponibilidade e próximos passos - O Fara1.5-9B já está disponível no Azure AI Foundry; as variantes 4B e 27B chegarão em breve. - A Microsoft planeja expandir o Fara1.5 além dos navegadores para software desktop e corporativo. Conclusão Fara1.5 é um marco: um agente de navegador lançado publicamente, com desempenho competitivo que supera alternativas proprietárias em benchmarks web ao vivo, enquanto oferece controle e transparência essenciais para comunidades conscientes de privacidade e descentralizadas. Se você se importa em executar agentes capazes em sua própria pilha — desde assistentes automatizados de negociação até assistentes DAO — este merece atenção.