लेख | अक्षर AI
गूगल वास्तव में घबरा गया है।
अभी हाल ही में समाचार आया कि गूगल के सह-संस्थापक सर्गेई ब्रिन ने "फाउंडर मोड" पुनः शुरू किया है, जिसमें वे सीधे निगरानी कर रहे हैं और एक शीर्ष टीम का गठन किया है, ताकि Gemini को AI प्रोग्रामिंग और स्वायत्त एजेंट जैसी महत्वपूर्ण क्षमताओं में Anthropic जैसे प्रतिद्वंद्वियों के पीछे भागने में मदद मिल सके।
गूगल ने रात में एक बड़ा अपडेट घोषित किया, जिसमें Gemini 3.1 Pro मॉडल पर आधारित दो नई पीढ़ी के स्वायत्त शोध एजेंट: डीप रिसर्च और डीप रिसर्च मैक्स लॉन्च किए गए।
न केवल मॉडल के निचले स्तर पर निष्कर्ष निकालने की क्षमता को मजबूत किया जा रहा है, बल्कि स्वायत्त अनुसंधान एजेंट को उद्यम स्तरीय और डेवलपर प्लेटफॉर्म की ओर विकसित किया जा रहा है, जिसमें API के माध्यम से खुलापन, निजी डेटा का समर्थन, बैकग्राउंड असिंक्रोनस कार्य आदि के माध्यम से “AI अनुसंधान/विश्लेषण उपकरण” जैसे उच्च मूल्यवान स्थिति में OpenAI (Hermes), Perplexity आदि प्रतिद्वंद्वियों की प्रतिस्पर्धा का सामना करने का प्रयास किया जा रहा है।

ये दोनों एजेंट पहली बार डेवलपर्स को एकल API कॉल के माध्यम से ओपन नेटवर्क डेटा और एंटरप्राइज के स्वामित्व वाली जानकारी को एकीकृत करने की अनुमति देते हैं, और रिसर्च रिपोर्ट्स में नेटिव रूप से ग्राफ़ और इनफोग्राफ़िक्स बनाते हैं, साथ ही Model Context Protocol (MCP) के माध्यम से किसी भी तीसरे पक्ष के डेटा स्रोत से कनेक्ट करते हैं।
दोनों एजेंट्स अब से Gemini API के पेड प्लान के माध्यम से सार्वजनिक प्रीव्यू के रूप में उपलब्ध हैं, जिनका उपयोग 2025 दिसंबर में गूगल द्वारा शुरू किए गए Interactions API के माध्यम से किया जा सकता है।
हाँ, ये नए एजेंट अभी केवल API के माध्यम से ही उपलब्ध हैं, सामान्य उपयोगकर्ता Gemini के ऐप में इनका लाभ नहीं उठा सकते, भले ही वे पेड सब्सक्रिप्शन लें। अपडेट की सूचना देखकर जब उपयोगकर्ताओं को पता चलता है कि वे इनका उपयोग नहीं कर सकते, तो कुछ उपयोगकर्ता शिकायत करते हैं: “गूगल किसी कारण से हमें, Gemini App के Pro सब्सक्रिप्शन उपयोगकर्ताओं को, लगातार सजा दे रहा है…”

गूगल के सीईओ सुंदर पिचाई ने खुद X पर लिखा: "जब आपको गति और कुशलता की आवश्यकता हो, तो Deep Research का उपयोग करें; जब आप उच्चतम गुणवत्ता वाले संदर्भ संग्रह और समेकन की तलाश में हों, तो Max संस्करण का उपयोग करें—यह विस्तारित परीक्षण की गणना के माध्यम से DeepSearchQA 93.3% और HLE 54.6% का प्रदर्शन करता है।"

18 महीने पहले, गूगल डीप रिसर्च का लक्ष्य ग्रेजुएट स्टूडेंट्स को ब्राउज़र टैब्स के भारी मात्रा से बचाना था। आज, गूगल चाहता है कि यह निवेश बैंकों के जूनियर एनालिस्ट्स के बेसिक रिसर्च कार्यों को प्रतिस्थापित करे।
इन दो लक्ष्यों के बीच का अंतर—और यह तकनीक वास्तव में इस अंतर को पूरा कर सकती है या नहीं—यह तय करेगा कि स्वायत्त अनुसंधान एजेंट उद्यम सॉफ्टवेयर के क्षेत्र में एक क्रांतिकारी उत्पाद बनेगा या केवल एक और ऐसा कृत्रिम बुद्धिमत्ता प्रदर्शन बन जाएगा जो बेंचमार्क में चमकदार होगा लेकिन सम्मेलनों में निराशाजनक होगा।
दो संस्करण, विभिन्न कार्यभार के लिए अनुकूलित
Standard Deep Research offers lower latency and lower costs, ideal for speed-critical scenarios.
Deep Research Max गहराई को गति के बजाय प्राथमिकता देता है। यह एजेंट विस्तारित टेस्ट-टाइम कंप्यूट के माध्यम से गहन तर्क, खोज और आवर्तन करता है और अंततः रिपोर्ट उत्पन्न करता है।
गूगल ने बताया कि असिंक्रोनस बैकग्राउंड वर्कफ्लो इसका आदर्श उपयोग का मामला है, जैसे कि रात के समय टाइमर जॉब (cron job) के माध्यम से चलाकर अगली सुबह विश्लेषक टीम को एक पूर्ण ड्यू डिलिजेंस रिपोर्ट प्रदान करना।
गूगल के स्वयं के बेंचमार्क में, डीप रिसर्च मैक्स ने रिट्रीवल और रीजनिंग कार्यों में महत्वपूर्ण प्रगति हासिल की है। यह एजेंट पिछले संस्करणों की तुलना में अधिक स्रोतों से जानकारी प्राप्त कर सकता है और पुराने मॉडल द्वारा उपेक्षित सूक्ष्म अंतरों को पकड़ सकता है।

Google ने प्रतिद्वंद्वियों के साथ तुलना भी प्रदान की है।
हालांकि, OpenAI के GPT-5.4 और Anthropic के Opus 4.6 के साथ तुलना पूरी तरह से न्यायसंगत नहीं है। GPT-5.4 स्वतंत्र वेब खोज में अच्छा प्रदर्शन करता है, लेकिन गहन अनुसंधान के लिए विशेष रूप से अनुकूलित नहीं है। इसके लिए, OpenAI ने अपना DR एजेंट प्रदान किया है, जो फरवरी के अपडेट के बाद GPT-5.4 के बजाय GPT-5.2 पर स्विच हो गया। OpenAI का सबसे मजबूत खोज मॉडल वास्तव में GPT-5.4 Pro है, लेकिन Google स्पष्ट रूप से इसे तुलना में शामिल नहीं कर रहा है।

OpenAI के डेटा के अनुसार, GPT-5.4 Pro ने एजेंट सर्च बेंचमार्क BrowseComp पर 89.3% तक का स्कोर प्राप्त किया, जबकि GPT-5.4 का स्कोर 82.7% था।
एंथ्रोपिक की अपनी रिपोर्ट के आधार पर, ऑपस 4.6 ने ब्राउज़कॉम्प पर 84% का स्कोर प्राप्त किया, जो गूगल द्वारा प्रदर्शित मूल्य से अधिक है। यह स्कोर निष्कर्षण कार्य को बंद करके प्राप्त किया गया, और मॉडल का प्रदर्शन गूगल के API बेंचमार्क परीक्षण में उपयोग किए जाने वाले उच्च-तीव्रता निष्कर्षण सेटिंग से बेहतर रहा।
ये अंतर संभवतः परीक्षण विधियों में भिन्नता के कारण हैं—मॉडल का मूल्यांकन मूल API के माध्यम से किया गया है या इसे प्रत्येक प्रयोगशाला के अपने टूलचेन में लपेटा गया है। गूगल का डेटा आवश्यक रूप से गलत नहीं हो सकता, लेकिन इसे सावधानी से व्याख्या की जानी चाहिए। किसी भी स्थिति में, इसकी प्रस्तुति पर्याप्त पारदर्शिता की कमी का प्रदर्शन करती है।
MCP समर्थन
इस अपडेट में सबसे प्रभावशाली सुविधा, Model Context Protocol (MCP) के समर्थन को जोड़ना है। यह सुविधा Deep Research को एक शक्तिशाली वेब शोध उपकरण से अधिक सामान्य डेटा विश्लेषक के समान बना देती है।
MCP एक नवीन खुला मानक है जो AI मॉडल को बाहरी डेटा स्रोतों से जोड़ता है। यह Deep Research को सुरक्षित रूप से निजी डेटाबेस, आंतरिक दस्तावेज़ भंडार और पेशेवर तीसरे पक्ष के डेटा सेवाओं की जांच करने की अनुमति देता है—पूरी प्रक्रिया में, संवेदनशील जानकारी अपने मूल परिवेश को छोड़े बिना।
व्यावहारिक रूप से, इसका अर्थ है कि एक हेज फंड अपने आंतरिक ट्रेडिंग फ्लो डेटाबेस और वित्तीय डेटा टर्मिनल दोनों को Deep Research की ओर इशारा कर सकता है, और फिर स्मार्ट एजेंट से इन दोनों को वेब से प्राप्त जनसामान्य जानकारी के साथ मिलाकर समग्र अवलोकन उत्पन्न करने का अनुरोध कर सकता है।
गूगल ने खुलासा किया है कि वह वर्तमान में FactSet, S&P और PitchBook जैसी कंपनियों के साथ सक्रिय रूप से सहयोग कर रहा है, जिससे यह स्पष्ट होता है कि गूगल, वॉल स्ट्रीट और व्यापक वित्तीय सेवा उद्योग द्वारा दैनिक रूप से उपयोग किए जाने वाले डेटा प्रदाताओं के साथ गहरा एकीकरण प्राप्त करने की इच्छा रखता है।
गूगल डीपमाइंड के प्रोडक्ट मैनेजर लुकास हास और श्रीनिवास तडेपल्ली द्वारा लिखित ब्लॉग पोस्ट के अनुसार, इसका लक्ष्य "सामान्य ग्राहकों को डीप रिसर्च द्वारा संचालित कार्यप्रवाहों में वित्तीय डेटा उत्पादों को एकीकृत करने और अपने विशाल डेटा ब्रह्मांड का उपयोग करके त्वरित गति से संदर्भ एकत्र करने की क्षमता प्रदान करना है, जिससे उत्पादकता में भारी वृद्धि हो।"
यह सुविधा AI के उपयोग में उद्यमों के सबसे दृढ़ समस्याओं में से एक को सीधे हल करती है: ओपन इंटरनेट पर मॉडल द्वारा उपलब्ध जानकारी और संगठन के वास्तविक निर्णय लेने के लिए आवश्यक जानकारी के बीच विशाल अंतर। पहले, इस अंतर को पूरा करने के लिए बड़ी मात्रा में कस्टमाइज़ड इंजीनियरिंग कार्य की आवश्यकता होती थी।
MCP गहन शोध के स्वायत्त ब्राउज़िंग और निष्कर्ष निकालने की क्षमताओं को जोड़ता है और अधिकांश जटिलताओं को एक बार कॉन्फ़िगर करने से सरल बना देता है। डेवलपर अब गहन शोध को गूगल सर्च, रिमोट MCP सर्वर, URL कॉन्टेक्स्ट, कोड निष्पादन और फ़ाइल सर्च के साथ-साथ पूरी तरह से नेटवर्क एक्सेस बंद करके केवल कस्टम डेटा पर सर्च करने की अनुमति दे सकते हैं।
सिस्टम PDF, CSV, इमेज, ऑडियो और वीडियो सहित मल्टीमॉडल इनपुट को भी grounding (grounding कॉन्टेक्स्ट) के रूप में सपोर्ट करता है।
Native Charts
दूसरा प्रमुख फीचर नेटिव चार्ट और इनफोग्राफिक्स जनरेशन है।
पिछले Deep Research संस्करण केवल पाठ रिपोर्ट उत्पन्न कर सकते थे। यदि उपयोगकर्ता को दृश्यीकरण की आवश्यकता होती थी, तो उन्हें डेटा निकालकर स्वयं चार्ट बनाने पड़ते थे। यह कमी “एंड-टू-एंड स्वचालन” की स्थिति को काफी कमजोर कर देती थी।
अब, नवीन पीढ़ी के एजेंट्स रिपोर्ट में उच्च गुणवत्ता वाले चार्ट और इनफोग्राफिक्स को HTML या गूगल के नैनो बनाना प्रारूप में नेटिव रूप से एम्बेड कर सकते हैं, जिससे जटिल डेटासेट्स को वास्तविक समय में रेंडर किया जा सके और वे सीधे विश्लेषणात्मक कथा का हिस्सा बन जाएँ।
व्यवसायिक उपयोगकर्ताओं के लिए—विशेष रूप से वित्त और परामर्श के क्षेत्र में जहां सीधे हितधारकों को सौंपे जाने वाले परिणामों की आवश्यकता होती है—यह सुविधा Deep Research को एक “अनुसंधान चरण को तेज करने वाले” उपकरण से उस उपकरण में बदल देती है जो अंतिम विश्लेषणात्मक उत्पाद के करीब पहुंच सकता है।

इसके अलावा, नए सिस्टम द्वारा नवीन सहयोगात्मक योजना बनाने की सुविधा (जो उपयोगकर्ताओं को स्मार्ट एजेंट की शोध योजना की समीक्षा, दिशा देने और अनुकूलित करने की अनुमति देती है) और मध्यवर्ती तर्क कदमों का रियल-टाइम स्ट्रीमिंग जुड़ने से, डेवलपर्स को जांच के दायरे पर सूक्ष्म नियंत्रण प्राप्त होता है, जबकि नियामक उद्योग द्वारा मांगी गई उच्च स्तर की पारदर्शिता बनी रहती है।
Deep Research अब गूगल द्वारा उद्योगों के लिए प्रदान की जाने वाली "बुनियादी ढांचे" का हिस्सा बन रहा है
गूगल के आधिकारिक ब्लॉग पोस्ट में स्पष्ट रूप से बताया गया है कि जब डेवलपर्स Deep Research एजेंट का उपयोग करके बनाते हैं, तो वे “Gemini App, NotebookLM, Google Search और Google Finance जैसी गूगल की कई लोकप्रिय उत्पादों को शोध क्षमता प्रदान करने वाली एक ही स्वायत्त शोध बुनियादी ढांचे” को कॉल करते हैं। इससे यह स्पष्ट होता है कि API के माध्यम से प्रदान किए जाने वाले एजेंट गूगल के आंतरिक संस्करण का सरलीकृत संस्करण नहीं हैं, बल्कि एक ही प्रणाली हैं, जो प्लेटफॉर्म स्केल पर बाहरी उपयोगकर्ताओं के लिए सेवा प्रदान करती हैं।
यह विकास प्रक्रिया बहुत तेजी से आगे बढ़ रही है।
गूगल ने 2024 दिसंबर में Gemini ऐप में Deep Research को C-उपयोगकर्ता फीचर के रूप में लॉन्च किया, जो Gemini 1.5 Pro द्वारा संचालित था। गूगल ने इसे एक व्यक्तिगत AI शोध सहायक के रूप में वर्णित किया, जो वेब पर जानकारी को कुछ मिनटों में संकलित करके उपयोगकर्ताओं को कई घंटों का समय बचा सकता है।
2025 मार्च में, गूगल ने Gemini 2.0 Flash Thinking Experimental का उपयोग करके Deep Research को अपग्रेड किया और सभी के लिए ट्रायल उपलब्ध कराया। इसके बाद इसे Gemini 2.5 Pro Experimental पर अपग्रेड किया गया, और गूगल ने रिपोर्ट किया कि समीक्षकों ने इसकी रिपोर्ट को प्रतिद्वंद्वी की तुलना में 2:1 के अनुपात में प्राथमिकता दी।
दिसंबर 2025 महत्वपूर्ण मोड़ है, जिसमें गूगल ने Interactions API लॉन्च किया, जिसने पहली बार Gemini 3 Pro द्वारा संचालित Deep Research को प्रोग्रामेटिक रूप से प्रदान किया और इसके साथ ही ओपन सोर्स DeepSearchQA बेंचमार्क भी जारी किया।
इस सुधार के पीछे का नींव वाला मॉडल Gemini 3.1 Pro है, जिसे 19 फरवरी, 2026 को लॉन्च किया गया था। इसमें मूल तर्क क्षमता में बड़ी छलांग हुई है: ARC-AGI-2 बेंचमार्क में, जो मॉडल की नए तर्क पैटर्न को हल करने की क्षमता का मूल्यांकन करता है, 3.1 Pro ने 77.1% का स्कोर प्राप्त किया, जो Gemini 3 Pro से दोगुना से अधिक है।
