बिग टेक की एजेंट प्रतियोगिता चार मुख्य दिशाओं के साथ विकसित हो रही है

iconMetaEra
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
बड़े टेक कंपनियों की एजेंट प्रतियोगिता चार क्षेत्रों में तेजी से बढ़ रही है: उत्पादकता उपकरण, उत्पाद एकीकरण, परितंत्र विकास, और संदर्भ निर्माण। OpenAI, Microsoft और Tencent चैटबॉट्स को एजेंट सिस्टम के साथ एकीकृत कर रहे हैं और उद्योग और उपभोक्ता बाजारों में प्रवेश कर रहे हैं। ऑन-चेन समाचारों में क्षमताओं को विस्तारित करने के लिए डेवलपर्स और साझेदारों के साथ बढ़ती सहयोग की जानकारी है।
कोडिंग एजेंट को सामान्य परिदृश्यों में सामान्यीकृत करना एक सिस्टम-स्तरीय प्रतिस्पर्धा है।

लेखक, स्रोत: नारोबोक एआई

AI क्षेत्र के लिए, यह सप्ताह भारी समाचारों का सप्ताह रहा है। हुआंग रेन्शुन द्वारा AI PC को पुनः परिभाषित करने से लेकर माइक्रोसॉफ्ट Build 2026 में "Agent प्राथमिकता" की घोषणा, OpenAI द्वारा ChatGPT और Codex के एकीकरण की घोषणा, तक कि वेइचेन Agent की प्रगति का खुलासा, Qwen द्वारा तीसरे पक्ष के Skill को जोड़ना, DouBao द्वारा भुगतान की अफवाहों का जवाब, और Meituan की वार्षिक आय प्रेस कॉन्फ्रेंस में सेवा AI Agent के महत्व पर जोर।

पहले कुछ लोग पूछ रहे थे कि पहले बहुत लोकप्रिय हुए OpenClaw के बारे में अब कोई क्यों नहीं बोल रहा? इस हफ्ते आई इन खबरों ने इस सवाल का वास्तविक जवाब दिया है—लोग OpenClaw के बारे में नहीं बोल रहे हैं, क्योंकि Coding Agent एक सामान्य कार्य निष्पादन समाधान बन गया है और Chatbot के साथ एकीकृत हो रहा है, साथ ही इसके साथ मेल खाने वाला Skill और Agent पारिस्थितिकी भी विकसित हो रहा है, और नए भुगतान के साथ अन्वेषण भी चल रहे हैं।

बड़ी कंपनियाँ OpenClaw से प्राप्त प्रेरणा को वास्तविक व्यावसायिक प्रगति में बदल रही हैं। इस प्रक्रिया में, OpenClaw और हम जो उत्पाद अभी देख रहे हैं, वे AI उत्पादों का अंतिम रूप नहीं हो सकते। जैसा कि टेन्सेंट के मुख्य AI वैज्ञानिक याओ शुनयू ने 2026 टेन्सेंट क्लाउड AI उद्योग अनुप्रयोग सम्मेलन में कहा, एक लंबी अवधि का परिवर्तन अभी शुरू हुआ है, और वास्तविक उत्पाद रूप, व्यावसायिक अवसर और उपयोग के तरीके अभी तक पूरी तरह से आविष्कृत नहीं हुए हैं।

हम यह निश्चित रूप से कह सकते हैं कि एजेंट बड़ी कंपनियों के AI के केंद्रीय क्षेत्र बन रहा है, और इस प्रतिस्पर्धा का रूप चार मुख्य रेखाओं के साथ लगातार विकसित हो रहा है: कौन अधिक उत्पादकता के स्थितियों के उपयोगकर्ताओं को विस्तारित कर सकता है; कौन अपने आंतरिक उत्पादों को अधिक गहराई से जोड़ सकता है; कौन पर्याप्त रूप से समृद्ध Skill, Agent पारिस्थिति बना सकता है; और कौन पर्याप्त संदर्भ एकत्रित कर सकता है।

"सहकर्मी" एजेंट की प्रतिस्पर्धा का केंद्र बन गया है

"सहकर्मी" वर्तमान में एजेंट का वर्णन करने के लिए सबसे अधिक उल्लेखित शब्द है। माइक्रोसॉफ्ट का स्काउट इस तरह डिज़ाइन किया गया है कि वह "सहकर्मी की तरह" काम करे; कोत्सी 3.0 इंसान और एआई टीम के साथ सहयोग पर जोर देता है; और ओपनएआई द्वारा लॉन्च किए गए एजेंट प्लगइन को "पूरी तरह से भर्ती हो चुका और सभी प्रक्रियाओं को समझने वाला नया सहकर्मी" कहा जाता है।

ये वाक्य इस बात को दर्शाते हैं कि उत्पादकता के संदर्भ अब बड़ी कंपनियों के एजेंट्स की प्रतिस्पर्धा का केंद्र बन गए हैं।

माइक्रोसॉफ्ट द्वारा लॉन्च किया गया Scout, OpenClaw फ्रेमवर्क पर आधारित एक Agent है, जो Microsoft 365 में स्थायी रूप से मौजूद है, Teams में चल सकता है, और Outlook, OneDrive आदि कार्यालय एप्लिकेशन के साथ सहयोग कर सकता है, ईमेल, कैलेंडर, कार्य संदेशों को ब्राउज़ कर सकता है, मीटिंग टकराव को स्वचालित रूप से सुलझा सकता है, उत्तर तैयार कर सकता है और कार्यों को आगे बढ़ा सकता है। साथ ही, माइक्रोसॉफ्ट ने एजेंट 365 को भी लॉन्च किया है, जो एजेंट की पहचान, अधिकार, नीतियों और जोखिम का उद्यम स्तर पर एकीकृत प्रबंधन करता है।

OpenAI ने प्रेस कॉन्फ्रेंस का विषय सीधे "Intelligence at Work" रखा। इस प्रेस कॉन्फ्रेंस में, OpenAI ने Codex के लिए तीन मुख्य अपग्रेड किए: कस्टमाइज़ेबल क्षमता वाले Agent प्लगइन का लॉन्च; स्थानीय टिप्पणी संशोधन क्षमता को कोड और वेबसाइट से डॉक्यूमेंट, स्प्रेडशीट और PPT तक विस्तारित किया; और वेबसाइट बनाकर परिणाम प्रस्तुति की क्षमता।

इसी समय, डोबाओ ने भुगतान किए गए फ़ंक्शन के जवाब में उल्लेख किया कि पेशेवर लोगों की उत्पादकता की आवश्यकताओं के लिए, डोबाओ डोबाओ प्रो वर्जन लॉन्च करने की योजना बना रहा है, जिसमें सॉफ्टवेयर डेवलपमेंट, डेटा विश्लेषण, पेशेवर डिज़ाइन, प्रक्रिया स्वचालन, वित्तीय विश्लेषण और वैज्ञानिक अनुसंधान जैसी पेशेवर सेवाएँ शामिल होंगी।

ये उत्पाद कार्रवाइयाँ इस बात की पुष्टि करती हैं कि उत्पादकता के स्थितियों—और केवल पारंपरिक अर्थों में उद्यम स्थितियों के बजाय—का विशाल मूल्य वास्तविक धन से साबित हो चुका है।

OpenAI द्वारा जारी डेटा के अनुसार, फरवरी 2024 के बाद से Codex के साप्ताहिक सक्रिय उपयोगकर्ता 500 लाख तक बढ़कर 6 गुना हो गए, जिसमें ज्ञान-आधारित कार्यकर्ताओं की वृद्धि विकासकर्ताओं की तुलना में तीन गुना अधिक है। Anthropic की दूसरी तिमाही की आय 109 अरब डॉलर तक एक से अधिक गुना बढ़ने की उम्मीद है, और इसका संचालन लाभ 559 मिलियन डॉलर हो सकता है, जिसकी आय का अधिकांश हिस्सा उद्योगों और स्टार्टअप्स से आता है।

आंतरिक उत्पादों का एकीकरण और कनेक्टिविटी लगातार गहराई प्राप्त कर रही है

उत्पाद के अपडेट और अपग्रेड का अर्थ है गहरे स्तर पर उत्पाद आर्किटेक्चर का पुनर्गठन। एक ओर, वर्तमान में बड़ी कंपनियाँ लगभग सभी Chatbot और एक या अधिक Agent उत्पादों में निवेश कर चुकी हैं, और अब इन उत्पादों के एकीकरण की प्रक्रिया शुरू हो चुकी है। इसमें सबसे आगे कदम उठाने वाली कंपनी OpenAI है, जिसने ChatGPT और Codex के एकीकरण किया है।

OpenAI चाहता है कि ChatGPT केवल एक संवादात्मक प्रवेश बिंदु से बढ़कर सहयोगी Agent के कार्यों के लिए मुख्य इंटरफ़ेस बन जाए, जबकि Codex को ऑफिस, शोध, उद्यम प्रक्रियाओं, डेटा विश्लेषण और व्यावसायिक संचालन जैसे बहुत सारे स्थितियों की आवश्यकताओं को पूरा करने के लिए एक सामान्य Agent प्लेटफ़ॉर्म में अपग्रेड किया जाएगा, जिसका कोर Coding Agent के उपयोग के स्थितियों को सामान्यीकरण है। इस एकीकरण के माध्यम से, OpenAI Codex को ChatGPT के विशाल उपयोगकर्ता समूह की ओर बढ़ाना चाहता है और भुगतान करने वाले उपयोगकर्ताओं की संख्या बढ़ाना चाहता है।

संदेशों के अनुसार, OpenAI योजना बना रहा है कि AI ब्राउज़र Atlas को भी इस सुपर AI एप्लिकेशन के एकीकरण में शामिल किया जाए।

दूसरी ओर, बड़ी कंपनियों की मूल इंटरनेट उत्पाद क्षमताएँ और सेवाएँ, जल्दी से Skill या Agent के रूप में AI उत्पादों में एकीकृत हो रही हैं। अलीबाबा ने Qwen में खाना ऑर्डर करना, टैक्सी बुक करना और ताओबाओ पर खरीदारी करने की क्षमताएँ जोड़ने का बहुत शुरुआती प्रयास किया है। अब, हम देख सकते हैं कि जीवेट, मेन्गुआन और टेंसेंट भी समान कार्य कर रहे हैं।

बाइटडांस ने डोउयिन शॉप को डोउबाओ के साथ जोड़ने के बाद, खाने-पीने, फिल्म टिकट, मेहमाननवाजी आदि स्थानीय जीवन सेवाओं के स्टोर और ग्रुप ऑफर की सिफारिशें बढ़ा रहा है। मेन्गुआन ने अपनी वार्षिक रिपोर्ट की बैठक में कहा कि AI सहायक 'शियाओटुआन' को मेन्गुआन ऐप में एम्बेड किया गया है, और मई के दौरान इसने 10 करोड़ से अधिक उपयोगकर्ताओं की सेवा की, जिसमें खाना-पीना, मनोरंजन, यात्रा, चिकित्सा परामर्श आदि के स्थितियाँ शामिल हैं। टेंसेंट डॉक्स ने अपने पिछले संचयित दस्तावेज प्रसंस्करण क्षमताओं को Skill में बदल दिया है, जिसे WorkBuddy द्वारा कॉल किया जाता है।

2026 के टेंसेंट क्लाउड एआई उद्योग अनुप्रयोग सम्मेलन के दौरान, टेंसेंट ग्रुप के सीनियर एक्जीक्यूटिव वाइस प्रेसिडेंट टैंग डाओशेंग ने कहा कि पिछले कई पारंपरिक अनुप्रयोगों के कार्यों को स्मार्ट एजेंट द्वारा कॉल किए जा सकने वाली क्षमताओं में बदलना होगा, ताकि पिछले कई वर्षों में जमा किए गए मूल्य को आगे निकाला जा सके। इसलिए, इस साल कंपनी वेचैट फॉर बिजनेस ने अपनी पुरानी कुछ डेटा क्षमताओं को इंटरफेस और स्किल के माध्यम से खोल दिया है, ताकि अन्य स्मार्ट एजेंट इन्हें कॉल कर सकें। यह खुलापन का प्रवृत्ति लगातार स्पष्ट होती जा रही है।

तीसरे पक्ष के इकोसिस्टम निर्माण को अब एजेंडे पर रखा गया है

एजेंट और पिछले उत्पाद के बीच एक मुख्य अंतर यह है कि इसमें उपकरणों को कॉल करने की क्षमता है। इसका अर्थ है कि एजेंट के पीछे एक पर्याप्त रूप से समृद्ध उपकरण पारिस्थिति होनी चाहिए। भले ही बड़ी कंपनियाँ हों, लेकिन वे इस पारिस्थिति को अकेले बनाने में सक्षम नहीं हो सकतीं। इसके लिए तीसरे पक्ष के स्किल या एजेंट पारिस्थिति का निर्माण आवश्यक है।

अब इस पारिस्थितिकी तंत्र के निर्माण को कार्यक्रम पर रख दिया गया है।

अलीबाबा के आंतरिक प्रथम पक्ष उत्पादों और सेवाओं के एकीकरण के बाद, क्विनवेन ने तीसरे पक्ष के एजेंट और स्किल को पूर्ण रूप से खोलने की घोषणा की है, जिससे सभी व्यवसाय क्विनवेन पर अपने ब्रांड एजेंट को संचालित कर सकते हैं। इस सप्ताह, रुइक्सिंग, केएफसी, मिशुए बिंचेंग और ईस्टर्न एयरलाइंस ने क्विनवेन पर स्किल लॉन्च किए हैं। इसके बाद, व्यवसाय क्विनवेन में एजेंट की प्रोफाइल और विशिष्ट सेवाओं को कस्टमाइज़ कर सकते हैं।

टेंसेंट एक ओर मेन्गुआन के शियाओमी को युआनबाओ में एकीकृत कर रहा है, ताकि उपयोगकर्ताओं को फूड ऑर्डरिंग, डिलीवरी आदि सेवाएं प्रदान की जा सकें; दूसरी ओर, वेइक्सिन एजेंट पारिस्थिति के निर्माण को तेज कर रहा है।

मीडिया रिपोर्ट्स के अनुसार, वेक्सिन का एजेंट प्रोटोटाइप परीक्षण पूरा कर चुका है और इसे इस महीने के भीतर सार्वजनिक लॉन्च से पहले अनुपालन स्वीकृति प्रक्रिया शुरू की जा सकती है। यह एजेंट वेक्सिन माइक्रोप्रोग्राम को सक्षम बनाता है ताकि भोजन ऑर्डर करना, टैक्सी बुक करना, टिकट बुक करना, खरीदारी करना और स्थानीय जीवन जैसी जटिल सेवाएं प्रदान की जा सकें।

इसके अलावा, वेइक्सिन रोनग, शियोमी आदि स्मार्टफोन निर्माताओं के साथ एजेंट-टू-एजेंट कनेक्शन स्थापित करने का प्रयास कर रहा है, ताकि अपनी बुनियादी क्षमताओं को स्मार्टफोन निर्माताओं के एजेंट द्वारा कॉल किया जा सके। अर्थात, स्मार्टफोन निर्माता भी वेइक्सिन एजेंट पारिस्थिति के लिए एक नया प्रवेश बिंदु बन जाएंगे, जिससे कई प्रवेश बिंदु एक ही एजेंट पारिस्थिति का उपयोग करेंगे।

OpenAI के एजेंट प्लगइन के माध्यम से, एक साथ नौकरी के लिए आवश्यक उपकरण, ज्ञान और कौशल को पैक किया जा सकता है। उदाहरण के लिए, क्रिएटिव प्रोडक्शन प्लगइन brief के आधार पर campaign board, display ad variants, product lifestyle images और e-commerce image sets बना सकता है और Figma, Canva, Shutterstock, Picsart, Fal जैसे उपकरणों को कॉल कर सकता है। सरल शब्दों में, यह एजेंट के लिए तैयार एक पेशेवर विरासत प्रणाली है।

वर्तमान में Codex के एजेंट प्लगइन 62 लोकप्रिय ऐप्स और 110 कौशलों को कवर करते हैं। भविष्य में, OpenAI अपने साझेदारों के लिए प्लगइन इकोसिस्टम खोलना चाहता है, ताकि तीसरे पक्ष Codex और ChatGPT में अपने स्वयं के प्लगइन बना सकें और उन्हें स्थापित कर सकें।

संदर्भ अधिक महत्वपूर्ण हो गया है

याओ शुनयू ने कहा कि मॉडल जटिल इनपुट को आउटपुट में बदलने में लगातार बेहतर हो रहे हैं, लेकिन इसके लिए उन्हें पर्याप्त अच्छा इनपुट प्राप्त होना आवश्यक है। इसके लिए उपयोगकर्ता की ओर से मॉडल और एजेंट को पर्याप्त विस्तृत और उपयोगी जानकारी प्रदान करना आवश्यक है, ताकि मॉडल और एजेंट 'आप कौन हैं', 'आप क्या कर रहे हैं', 'आपके लिए कौन सा उत्तर मूल्यवान है' जैसे सही मार्ग को स्थिर करने वाले प्रश्नों को समझ सकें।

डेवलपमेंट ओरिएंटेड दृष्टिकोण से, AI उत्पाद विकास के लिए पर्याप्त संदर्भ संचार आवश्यक है। याओ शुनयू और तांग डाओशेंग ने उपरोक्त कार्यक्रम में चर्चा करते हुए कहा कि AI उत्पाद विकास में मॉडल को क्या पुरस्कृत करना चाहिए और क्या दंडित करना चाहिए, कौन से उत्तर अच्छे हैं और कौन से व्यवहार खराब हैं, इसे उत्पाद प्रतिक्रिया से निर्धारित किया जाना चाहिए। इसका अर्थ है कि मॉडल टीम और उत्पाद टीम को संदर्भ साझा करने की प्रक्रिया के माध्यम से Co-Design पूरा करना होगा, ताकि बेहतर अनुभव बनाया जा सके।

इसलिए, AI उत्पादों को उपयोगकर्ता ओर से बहु-स्रोतीय संदर्भ जानकारी को जोड़ना और इकट्ठा करना होगा, और फिर यह निर्धारित करना होगा कि कौन सी जानकारी दी जाए और कौन सी नहीं, ताकि Agent के साथ कार्य का इरादा समायोजित हो सके; विकास ओर पर, मॉडल टीम और उत्पाद टीम के विकास लक्ष्यों को समायोजित करने के लिए एक सुचारु प्रतिक्रिया तंत्र स्थापित किया जाना चाहिए, ताकि अनुभव में तेजी लाई जा सके।

उपयोगकर्ता कंटेक्स्ट के संचय के साथ-साथ डेवलपमेंट कंटेक्स्ट के साझाकरण के लिए, यह केवल एक डेवलपमेंट समस्या नहीं है, बल्कि एक संगठनात्मक समस्या है, जिसे सहयोग के माध्यम से कंटेक्स्ट के संचय और साझाकरण के लिए प्राप्त किया जाना चाहिए।

इसीलिए, इस साल जनवरी में, OpenAI ने ChatGPT और Codex को एकीकृत करने के लिए टीम को पुनर्गठित किया, ताकि उत्पाद टीम और संबंधित नींव के मॉडल पर काम करने वाले शोधकर्ता अधिक निकटता से सहयोग कर सकें; फिर ChatGPT, Codex और API टीम को एक विभाग में एकीकृत कर दिया गया, जिसकी अध्यक्षता Thibault Sottiaux कर रहे हैं।

इसी समय, संदर्भ के प्रति ध्यान देने से हार्डवेयर को एजेंट के रूप में विकसित करने को भी प्रोत्साहित किया जा सकता है, जिससे हार्डवेयर उपयोगकर्ता के संदर्भ को एकत्र करने का एक प्रभावी माध्यम बन जाए। माइक्रोसॉफ्ट का प्रोजेक्ट सोलारा इसी दिशा में शोध कर रहा है। स्थान और समय के निर्भर किए बिना संचार करना एजेंट डेस्कटॉप टर्मिनल और पोर्टेबल डिवाइस विकसित करने का एकमात्र उद्देश्य नहीं है; अधिक महत्वपूर्ण उद्देश्य डेस्कटॉप और मोबाइल परिदृश्यों में एजेंट को कार्यों को निष्पादित करने के लिए अधिक संदर्भ सूचना प्रदान करना है।

पिछले कुछ वर्षों में, AI उद्योग में एक अपेक्षाकृत स्पष्ट तकनीकी मार्ग दिखाई दिया: प्री-ट्रेनिंग → पोस्ट-ट्रेनिंग → एजेंट → कोडिंग एजेंट। यह मार्ग भविष्य का एकमात्र मुख्य मार्ग नहीं हो सकता, लेकिन बड़ी कंपनियों के लिए वर्तमान में सबसे प्रभावी मार्ग है।

हमने चार रुझानों को निकाला है, जो एक निश्चित पथ की ओर ले जाने वाले क्रमिक रूप से जुड़े आधारभूत निर्देशांक हैं, जिनका अंतिम उद्देश्य Coding Agent को सामान्य परिदृश्यों में सामान्यीकृत करना है। यह एक सिस्टम-स्तरीय प्रतिस्पर्धा है।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।