माइक्रोसॉफ्ट रिसर्च ने एक सेट एआई मॉडल जारी किए हैं जो वेब का ब्राउज़ करने में ओपनएआई या गूगल द्वारा बनाए गए किसी भी चीज़ से बेहतर हैं। और एक ऐसे मोड़ के साथ जो बंद स्रोत वालों को असहज कर देना चाहिए, मॉडल ओपन-वेट हैं।
22 मई को जारी किए गए Fara1.5 परिवार में 4B, 9B और 27B पैरामीटर वाले तीन मॉडल शामिल हैं। फ्लैगशिप 27B वेरिएंट ने ऑनलाइन-माइंड2वेब बेंचमार्क पर 72% अंक प्राप्त किए, जो एक कठिन परीक्षण है जो 136 लाइव वेबसाइटों पर 300 कार्यों को ब्राउज़र उपयोग करने वाले AI एजेंट्स के सामने रखता है। OpenAI का Operator 58.3% पर पहुँचा। Google का Gemini 2.5 Computer Use 57.3% पर पहुँचा। अंग्रेजी में: माइक्रोसॉफ्ट का मॉडल वास्तविक दुनिया के वेब कार्यों के लगभग तीन-चौथाई को सफलतापूर्वक पूरा करने में सक्षम रहा, जबकि इसके बड़े टेक प्रतिद्वंद्वी दस में से छह को भी पूरा नहीं कर पाए।
बेंचमार्क अंतर वास्तविक है
9B मॉडल ने 63.4% स्कोर किया, जिससे यह अपने आकार के बावजूद OpenAI और Google के निजी प्रणालियों से आगे निकल गया। यह प्रतिस्पर्धी एजेंट Yutori Navigator n1, जिसने 64.7% स्कोर किया, के करीब पहुंच गया।
इस क्षेत्र की गति को समझने के लिए: माइक्रोसॉफ्ट का पिछला मॉडल, Fara-7B, नवंबर 2025 में लॉन्च किया गया था और उसने इसी बेंचमार्क पर केवल 34.1% का स्कोर प्राप्त किया था। इसका मतलब है कि टीम ने लगभग छह महीनों में प्रदर्शन लगभग दोगुना कर दिया।
मॉडल Qwen3.5 आर्किटेक्चर पर बनाए गए हैं और MagenticLite का उपयोग करते हैं, जो एक सैंडबॉक्स्ड ब्राउज़र इंटरफ़ेस है जो एजेंट को वेब पेजों के साथ बन्द वातावरण में बातचीत करने की अनुमति देता है। इनमें एक observe-think-act लूप भी शामिल है जिसमें मानव-द्वारा-नियंत्रित सुरक्षा है, जिसका अर्थ है कि एजेंट क्रिटिकल कार्रवाइयों जैसे खरीदारी या खाता बदलाव को निष्पादित करने से पहले रुक जाता है और उपयोगकर्ता से पुष्टि माँगता है।
माइक्रोसॉफ्ट ने माइक्रोसॉफ्ट फाउंड्री पर 9B मॉडल उपलब्ध करा दिया है, और 4B और 27B संस्करण अगले आने की उम्मीद है।
यहाँ ओपन-वेट क्यों मायने रखता है
OpenAI का Operator और Google का Gemini 2.5 Computer Use प्रपत्रित प्रणालियाँ हैं। Fara1.5 का ओपन-वेट होना इस बात का संकेत है कि डेवलपर्स इन मॉडल्स को अपने हार्डवेयर पर डाउनलोड, संशोधित और डिप्लॉय कर सकते हैं। Microsoft ने Fara1.5 परिवार को विशेष रूप से सामान्य हार्डवेयर पर कुशलतापूर्वक चलाने के लिए डिज़ाइन किया है, और मॉडल के आकार में वृद्धि के साथ अनुपातिक स्केलिंग लाभ प्राप्त होते हैं।
ट्रेनिंग पाइपलाइन को भी एक महत्वपूर्ण अपग्रेड मिला है। माइक्रोसॉफ्ट ने फाराजेन1.5 पेश किया, जो जटिल ब्राउज़र इंटरैक्शन के लिए बेहतर ट्रेनिंग उदाहरण उत्पन्न करने वाली एक बेहतर सिंथेटिक डेटा पाइपलाइन है।
इसका क्रिप्टो और डीफाई के लिए क्या अर्थ है
माइक्रोसॉफ्ट ने Fara1.5 को क्रिप्टो के विचार से नहीं बनाया है। किसी भी ब्लॉकचेन प्रोटोकॉल, DeFi एप्लिकेशन या Web3 प्रोजेक्ट के साथ कोई सीधा एकीकरण नहीं है।
DeFi इंटरफेस वेब एप्लिकेशन होते हैं। Uniswap पर टोकन्स का आदान-प्रदान करना, Aave पर वॉल्ट का प्रबंधन करना, या एसेट्स को चेन्स के बीच ब्रिज करना: ये सभी ब्राउज़र-आधारित कार्य हैं जिनमें फॉर्म, पुष्टिकरण और बहु-चरणीय प्रवाह शामिल होते हैं — ठीक वही प्रकार का कार्य जिसके लिए Fara1.5 को प्रशिक्षित किया गया था।
यहाँ ह्यूमन-इन-द-लूप डिज़ाइन विशेष रूप से प्रासंगिक है। डीफाई लेनदेन अपरिवर्तनीय होते हैं। एक ऐसा एजेंट जो लेनदेन पर हस्ताक्षर करने से पहले रुक जाए और पुष्टि के लिए पूछे, वह स्वतंत्र ऑन-चेन गतिविधि में सबसे बड़े जोखिमों में से एक को संबोधित करता है: गलती से एक हानिकारक कॉन्ट्रैक्ट को मंजूरी देना या धन को गलत पते पर भेजना।
