ByteDance की 2026 की AI रणनीति चार क्षेत्रों पर केंद्रित है: वर्ल्ड मॉडल, वीडियो मॉडल Seedance, कोडिंग और DouBao का व्यावसायिकीकरण।
लेखक: झोउ शिनयू
स्रोत: 36氪
《स्मार्ट एमर्जेंस》 ने कई स्रोतों से अनूठी जानकारी प्राप्त की है कि 2026 में, बाइटडांस AI के चार महत्वपूर्ण विषय होंगे:
विश्व मॉडल प्रशिक्षण में निवेश बढ़ाएं, और इस साल के अंत तक, मॉडल का प्रदर्शन वर्तमान विश्व स्तरीय SOTA (शीर्ष) Google Genie 3 के स्तर तक पहुंच जाए।
वीडियो मॉडल अभी भी नेतृत्व में हैं और "डायनामिक जनरेशन" जैसी नई दिशाओं का अन्वेषण कर रहे हैं।
कोडिंग की नींव मजबूत करें, कोडिंग के लिए डॉगफूडिंग (डेटा रिटर्न, मूल्यांकन, फ्लाइव्हील बनाएं) को अच्छी तरह से करें, और एजेंट क्षमता में सुधार करें।
DouBao ने अपनी व्यावसायिक क्षमताओं को मजबूत किया है, जिसका मुख्य उपयोग का क्षेत्र "ऑफिस" है।
बाइटडांस का अपूर्ण क्षेत्र: विश्व मॉडल अब, बाइटडांस के एआई मैट्रिक्स में, Seed 2.0 ने बाइटडांस को चीन के प्रमुख भाषा मॉडल टीम में प्रवेश करने में सक्षम बनाया है, Seedance 2.0 ने विश्व स्तर पर SOTA का स्तर हासिल किया है, और अनुप्रयोग स्तर पर, DouBao ने एक भारी अग्रणी स्थिति बना ली है—हमें विभिन्न स्रोतों से पता चला है कि 2026 के चीनी नए साल के बाद, DouBao के दैनिक सक्रिय उपयोगकर्ता (DAU) 200 मिलियन हो गए।
"कोई स्पष्ट कमजोरी नहीं है।" एक बड़ी कंपनी के AI रणनीतिकार ने बाइटडांस के AI बिजनेस मैट्रिक्स की इस तरह से तारीफ की।
लेकिन इन सभी मॉडल्स में, बड़े मॉडल अनुसंधान के अगले चरण की कुंजी: विश्व मॉडल की कमी है।
कुछ सीड टीम के निकट के लोगों ने हमें बताया कि बाइटडांस वर्ल्ड मॉडल स्पेस में एक देर से प्रवेशकर्ता है। 2024 में, अली से बाइटडांस में शामिल हुए झोउ चांग ने वर्ल्ड मॉडल अनुसंधान की नेतृत्व भूमिका निभाई।
लेकिन उस समय आंतरिक निर्णय यह था कि विश्व मॉडल की राह और व्यावसायिक अनुप्रयोग अभी स्पष्ट नहीं थे, और अधिक महत्वपूर्ण बात यह थी कि वीडियो मॉडल पर लड़ाई अच्छी तरह से लड़ी जाए।
2025 तक, बाइटडांस ने एक छोटे समूह में शोध टीम का गठन किया और विजुअल-लैंग्वेज-एक्शन (VLA) मॉडल के मार्ग का अन्वेषण शुरू किया। टीम के नेता दो हैं:
एक, बाइटडांस AI लैब के प्रमुख ली हांग — 2025 के अप्रैल में, AI लैब (रोबोटिक्स टीम सहित) को Seed में विलय कर दिया गया, जिसका उद्देश्य मॉडल और अनुप्रयोगों (एम्बॉडिड इंटेलिजेंस) के बीच संचार की दक्षता बढ़ाना है — मुख्य रूप से सिमुलेशन डेटा के आधार पर वर्ल्ड मॉडल प्रशिक्षण।
दूसरा है सीड मल्टीमॉडल रिसर्चर वांग वेनचियान, जो मुख्य रूप से प्राकृतिक डेटा पर प्रशिक्षण के आधार पर काम करते हैं।
2026 में, वु यिंहुई ने सीड सभा में वर्ल्ड मॉडल के लिए एक स्पष्ट लक्ष्य निर्धारित किया: 2026 के अंत तक कम से कम एक वर्ल्ड मॉडल जारी करना, जिसका प्रदर्शन वर्तमान में सबसे उन्नत वर्ल्ड SOTA—जिसे Google ने अगस्त 2025 में Genie 3 के रूप में जारी किया है—के साथ तुलना कर सके।
लेकिन वर्तमान प्रगति के अनुसार, पीछे रहने की गति पर्याप्त नहीं है। एक सीड के करीबी व्यक्ति ने हमें बताया कि वु यिंगहुई ने सीड की कई आंतरिक बैठकों में सीधे कहा है कि बाइटडांस वर्ल्ड मॉडल और एम्बॉडीड इंटेलिजेंस का प्रदर्शन अपेक्षाओं से कम है।
एक अन्य सीड सदस्य ने बताया कि आंतरिक मूल्यांकन के अनुसार, 2026 की शुरुआत तक, बाइटवर्ल्ड मॉडल की समग्र प्रदर्शन क्षमता वैश्विक SOTA से 10% पीछे है।
लेकिन यह लड़ाई भविष्य का प्रतीक है।
एक ओर, विश्व मॉडल के नीचे कम से कम 100 अरब डॉलर के आकार का एम्बॉडिड इंटेलिजेंस बाजार है, और गेमिंग और मनोरंजन के दृश्यों में असीमित कल्पना की क्षमता है।
एक पूर्व Seed शोधकर्ता ने हमें बताया कि बाइटडांस रोबोट के पिछले अप्लीकेशन मुख्य रूप से वस्तुओं के परिवहन और औद्योगिक हस्तांतरण में थे, लेकिन आंतरिक रूप से यह निर्णय लिया गया कि उनकी सीमा कम है, "बाइटडांस निश्चित रूप से मानवरूपी रोबोट में प्रवेश करेगा, क्योंकि इसका बाजार क्षमता अधिक व्यापक है।"
दूसरी ओर, वर्ल्ड मॉडल के रास्ते में अभी भी कई असहमतियाँ मौजूद हैं, जिनमें वीडियो जनरेशन स्कूल, VLA (विजुअल-लैंग्वेज-एक्शन मॉडल) स्कूल, JEPA (पिक्सेल प्रेडिक्शन) स्कूल आदि शामिल हैं।
एक AI निवेशक ने हमें विश्लेषण दिया: “बाइट्स की टैलेंट डेंसिटी और फंडिंग के आधार पर, आप जीतने की अत्यधिक संभावना है। अगर आप नहीं खेलते, तो आपको निश्चित रूप से हार मिलेगी।”
पहले स्थान की श्रेणी में शामिल होने के लक्ष्य के चलते, 2026 से, बाइटडांस ने विश्व मॉडल प्रशिक्षण के लिए कई समायोजन किए हैं।
《स्मार्ट एमर्जेंस》 के अनुसार, 2026 के चीनी नए वर्ष के बाद, सीड ने एक विश्व मॉडल अनुसंधान समूह की स्थापना की है, जिसके प्रमुख पूर्व मेटा FAIR लैब शोधकर्ता फान हाओकी हैं, और वे सीड के मल्टीमॉडल और विश्व मॉडल प्रमुख झोउ चांग को रिपोर्ट करते हैं;
इसी बीच, सामने के दो VLA अनुसंधान टीमें, जिनका नेतृत्व ली हांग और वांग वेनचियान कर रहे थे, एकत्रित हो गईं और अब वे सीधे झोउ चांग को रिपोर्ट करती हैं।
कई जानकार लोगों ने स्मार्ट एमर्जेंस को बताया कि ली हांग और वांग वेनचियान के अनुसंधान समूह द्वारा अन्वेषित रास्ता मुख्य रूप से VLA था, जिसमें "अचानक" और "वास्तविक" की ओर ध्यान केंद्रित किया गया था, और लक्ष्य एप्लीकेशन क्षेत्र एम्बॉडिड इंटेलिजेंस था; जबकि फैन हाओकी के नेतृत्व में नई टीम 3D सिमुलेशन रास्ते पर चली, जो मनोरंजन और गेमिंग जैसे एप्लीकेशन क्षेत्रों पर केंद्रित है।
मानव संसाधन और अन्वेषण रूट के विस्तार के अलावा, वर्ल्ड मॉडल टेक्स्ट, कोडिंग, वीडियो जैसे कई मॉडल दिशाओं में सबसे अधिक निवेश के साथ है।
डेटा बजट बहुत महत्वपूर्ण है। एक बाइटडांस डेटा प्लेटफॉर्म के कर्मचारी ने हमें बताया कि LLM (बड़े भाषा मॉडल) और Seedance 2.0 पर पहले सफलतापूर्वक अपनाई गई “डेटा की मात्रा पर जोर” की रणनीति, टीम इसी “डेटा समुद्र रणनीति” को विश्व मॉडल के प्रशिक्षण पर लागू करने की योजना बना रही है।
यह अधिक महंगे डेटा निवेश के बराबर है—हमें विभिन्न स्रोतों से पता चला है कि 2026 में, बाइटडांस द्वारा वर्ल्ड मॉडल के प्रशिक्षण के लिए आवंटित डेटा बजट (VLA, लंबे वीडियो, 3D आदि मोडल्स सहित) सभी मोडल्स में सबसे अधिक है, जिसकी राशि कई करोड़ रुपये है।
एक डेटा सप्लायर ने उल्लेख किया कि बाइटडांस की विश्व मॉडल पर डेटा निवेश, अन्य निर्माताओं की तुलना में 3-4 गुना है।
कोडिंग: अधिक उच्चतम डेटा इंजीनियरिंग कोडिंग क्षमता प्राप्त करना आधार है, जो एजेंट की प्रभावशीलता की सीमा निर्धारित करती है—यह उद्योग की सहमति बन चुकी है।
कई जानकारों ने हमें बाइटडांस के लिए कोडिंग के प्रति ध्यान देने की बात बताई है। "बाइटडांस की कोडिंग में निवेश हमेशा से बहुत अधिक रहा है, इसका केवल इस साल के वर्ल्ड मॉडल के बाद ही दूसरा स्थान है," सीड के एक समीप के व्यक्ति ने स्मार्ट एमर्जेंस को बताया।
उदाहरण के लिए, आंतरिक रूप से डेटा की निर्देशित खरीद की जाती है, या विदेशी शीर्ष कोडिंग मॉडल्स जैसे Claude Code, CodeX के ट्रेनिंग डेटा डेमो का अध्ययन किया जाता है।
2025 के वोल्कैन इंजीनियरिंग फोर्स कॉन्फ्रेंस में, बाइटडांस के तकनीकी उपाध्यक्ष होंग डिंगकुन ने भी कहा कि कोडिंग, जो एक अत्यधिक संरचित और तार्किक रूप से कठोर कार्य है, मॉडल को जटिल अर्थात्मक संरचनाओं, तार्किक निष्कर्षण, एल्गोरिदम डिजाइन और सटीक अभिव्यक्ति को समझने के लिए उच्च आवश्यकताएँ रखती है, जो मॉडल की बुद्धिमत्ता की सीमा की खोज में मदद करती है।
लेकिन बाहरी दुनिया में, बाइटडांस की कोडिंग बिजनेस की उपस्थिति हमेशा कमजोर रही है। चाहे 2025 नवंबर में जारी किया गया मॉडल Doubao-Seed-Code हो या 2025 की शुरुआत में जारी किया गया AI प्रोग्रामिंग टूल Trae, इनका प्रभाव और आवाज़ Zhipu के GLM 5 और Moonshot के K2 की तुलना में कम है।
एक जानकार के अनुसार, "डेटा फीडबैक की कमी के कारण बाइटडांस कोडिंग प्रभाव में कोई भी क्रांतिकारी प्रगति नहीं हो पा रही है।" मॉडल क्षमता सीमित होने के कारण, बाइटडांस के संबंधित बिजनेस लागू नहीं कर रहे हैं Seed-Code।
AI कोडिंग एप्लिकेशन Trae ने सबसे पहले DeepSeek और Claude Code, और अपने उत्पाद के अंदर खुद ट्रेन किया गया कोडिंग मॉडल एकीकृत किया।
इससे बाइट्स कोडिंग मॉडल को वास्तविक अनुप्रयोगों से प्रतिक्रिया की कमी होती है।
2026 के बाद से, कई बाइटडांस कर्मचारियों ने महसूस किया है कि विभिन्न बिजनेस यूनिट्स Seed मॉडल के समर्थन में अधिक निवेश कर रही हैं। एक Seed कर्मचारी ने स्मार्ट एमर्जेंस को बताया कि पहले बाइटडांस बिजनेस टीमों को तीसरे पक्ष के Coding मॉडल का उपयोग करने से प्रतिबंधित नहीं करता था, लेकिन 2026 के बाद से, कई एप्लिकेशन डिपार्टमेंट्स को Seed मॉडल का उपयोग करने के लिए अनिवार्य कर दिया गया है।
हालांकि, अधिक अत्यधिक डेटा निवेश के साथ, सीड की टैलेंट हायरिंग की गति थोड़ी धीमी हो गई है।
एक एआई वृत्त के रिक्रूटर ने स्मार्ट इमर्जेंस को बताया कि बाइटडांस के एचआर अब बाहरी संकेत दे रहे हैं कि अत्यधिक उच्च वेतन के साथ बड़े पैमाने पर भर्ती का युग समाप्त हो चुका है, और अगला लक्ष्य आंतरिक रूप से युवा प्रतिभाओं को प्रशिक्षित करना, उन्हें पदोन्नत करना और एल्गोरिदम के लिए भत्ते बढ़ाना है।
अब, सीड के कुछ ही रिक्तियाँ मुख्य रूप से DeepSeek, OpenAI, DeepMind, Meta आदि विदेशी बड़ी कंपनियों से आए AI पेशेवरों के लिए खुली हैं, जैसे कि पूर्व DeepSeek के मुख्य सदस्य गुओ दाया और पूर्व NVIDIA शोधकर्ता डोंग शिन।
Seedance कैसे 2026 तक SOTA स्थिति बनाए रखेगा, बाइटडांस का AI मॉडल पर दूसरा ध्यान केंद्रित करने का विषय है।
“Seedance 2.0 की सफलता डेटा की सफलता है।” एक वीडियो जनरेशन स्टार्टअप के संस्थापक ने इंटेलिजेंट एमर्जेंस को इस तरह Seedance 2.0 का मूल्यांकन किया। हमें पता चला है कि विशाल ट्रेनिंग डेटा और 2000 से अधिक लोगों की मूल्यांकन टीम ने Seedance 2.0 के उत्कृष्ट परिणामों को संभव बनाया।
लेकिन केवल "मात्रा पर आधारित" प्रशिक्षण विधि में छिपी चिंताएँ भी हैं। कुछ अध्ययनों के अनुसार, वीडियो जनरेशन क्षेत्र में "एंटी-स्केलिंग लॉ" की घटना होती है, जिसका सरल अर्थ है कि जितना अधिक प्रशिक्षण डेटा होगा, उतना ही मॉडल "आलसी" होने की प्रवृत्ति रखता है, केवल कुछ महत्वपूर्ण फ्रेम सीखता है और पूर्ण कथानक को नज़रअंदाज़ कर देता है—इसलिए, प्रशिक्षण के बाद के चरणों में, डेटा की "मात्रा" से प्राप्त लाभ अक्सर कम हो जाता है।
हमें डेटा साइड के दो जानकारों ने बताया कि Seedance ने प्री-ट्रेनिंग पर अधिकतम सीमा तक पहुँच ली है, अब प्रदर्शन में सुधार के लिए, उसे प्रशिक्षण डेटा को साफ करना होगा और अधिक सूक्ष्म पोस्ट-ट्रेनिंग करनी होगी।
इसी बीच, "डायनामिक जनरेशन" क्षमता 2026 में Seedance टीम का एक नया ध्यान केंद्र है।
जिसे "डायनामिक जनरेशन" कहा जाता है, यानी इंटरएक्टिव वीडियो, उसमें उपयोगकर्ता निर्देश दे सकते हैं और वीडियो जनरेशन की सामग्री और कहानी को तत्काल समायोजित कर सकते हैं। इस क्षेत्र में, Vivix AI (जिसकी स्थापना पूर्व सेंसेटाइम के सीनियर रिसर्च डायरेक्टर लिउ यू ने की) ने 13.2 अरब डॉलर का मूल्यांकन प्राप्त किया है।
कई जानकारों ने स्मार्ट एमर्जेंस को बताया कि झोउ चांग ने हमेशा डायनामिक जनरेशन के लागू होने के क्षमता पर बहुत विश्वास रखा है।
एक सीड के करीबी व्यक्ति ने कहा, "इंटरैक्टिव वीडियो को गेम के रूप में बनाया जा सकता है, इंटरैक्टिव सीरीज के रूप में भी, और विश्व मॉडल के अन्वेषण से भी जुड़ा जा सकता है (वीडियो जनरेशन भी विश्व मॉडल के अन्वेषण का एक पथ है)।"
डोबाओ के व्यावसायिकीकरण और विदेशी बाजार में विस्तार को तेज करें। 36Kr ने अनूठे रूप से रिपोर्ट किया कि डोबाओ की अपेक्षा है कि जून के अंत में भुगतान योग्य सामग्री लॉन्च होगी; इसके साथ ही, डोबाओ डायनामिक ई-कॉमर्स के साथ एकीकरण की योजना बना रहा है, ताकि भुगतान के संदर्भ को पूरा किया जा सके।
मई 2026 की शुरुआत में, डोबाओ ने ऐप स्टोर पर भुगतान वाली सदस्यता योजनाओं को अपडेट किया था, जिसमें मासिक सदस्यता मूल्य 0 से 500 युआन तक था।
3 जून को, डोबाओ ने आधिकारिक रूप से घोषणा की कि वे विशेषज्ञों की उत्पादकता की आवश्यकताओं के लिए "डोबाओ प्रो वर्जन" लॉन्च करने जा रहे हैं, जिसमें सॉफ्टवेयर डेवलपमेंट, डेटा विश्लेषण, प्रोफेशनल डिज़ाइन, प्रक्रिया स्वचालन, वित्तीय विश्लेषण और वैज्ञानिक अनुसंधान जैसी पेशेवर सेवाएँ शामिल हैं।
कई जानकारों के अनुसार, चीनी नए साल के बाद, डोबाओ का दैनिक सक्रिय उपयोगकर्ता (DAU) 20 करोड़ से अधिक हो गया है। "इस वर्ष डोबाओ के लिए विज्ञापन बजट बहुत कम है।" एक जानकार के अनुसार, उच्च DAU के कारण निष्कर्षण लागत और संचालन का दबाव बढ़ गया है, और इस समय डोबाओ का व्यावसायिकीकरण बढ़त की गति को कम करने और स्वयं को संचालित करने के दोहरे उद्देश्य से किया जा रहा है।
PPT जनरेशन, डोबाओ द्वारा उपयोगकर्ता के भुगतान मनोवृत्ति को बनाने का केंद्रीय बिंदु है। "डोबाओ PPT जनरेशन क्षमता को मजबूत करना चाहता है, ताकि वित्त, कानून जैसे उच्च-आय वाले क्षेत्रों के कार्यालय कर्मचारियों से शुल्क लिया जा सके।" डोबाओ के एक निकट के व्यक्ति ने स्मार्ट एमर्जेंस को बताया, अगले चरण में, डोबाओ एक एंटरप्राइज़ संस्करण लॉन्च करने की योजना बना रहा है, जो कंपनी के आंतरिक प्रणालियों के साथ एकीकृत होगा, लेकिन आंतरिक रूप से सटीक समाकलन तरीके पर चर्चा जारी है।
उन्होंने कहा कि यह विचार विदेशी मॉडल के व्यावसायिक मॉडल से प्रेरित है। विदेशों में, कार्यालय स्थिति के लिए शुल्क लेने का यह व्यावसायिक मार्ग पहले ही सत्यापित हो चुका है। Anthropic द्वारा प्रकाशित डेटा के अनुसार, Claude Code के लॉन्च होने के केवल 6 महीने बाद, ARR 10 अरब डॉलर हो गया; एक साल बाद, फरवरी 2026 में ARR 25 अरब डॉलर हो गया।
क्लॉड कोड द्वारा उद्योग विकास परिदृश्यों से उत्पन्न दृढ़ नकदी प्रवाह के कारण, OpenAI से 6 साल बाद स्थापित Anthropic ने इस साल की शुरुआत में OpenAI के ARR को पीछे छोड़ दिया।
अब, डोउबाओ को अपने उपयोगकर्ता मन में एक ऐसा "सामान्य प्रवेश द्वार" बनाना है जहाँ आप सब कुछ मुफ्त में पूछ सकते हैं, जिसे एक "ऑफिस असिस्टेंट" में बदलना है जो आपकी दक्षता बढ़ाने में मदद करता है, हालाँकि इसके लिए आपको पैसे देने होंगे।
हालांकि, डोउबाओ जिस बाजार में प्रवेश करना चाहता है, वह पहले से ही भर चुका है। डोउबाओ के लोगों ने स्मार्ट एमर्जेंस को बताया कि उद्यमी ग्राहकों की अनुसंधान के दौरान, बाइटडांस ने पाया कि उद्योग AI समाधान आपूर्तिकर्ताओं द्वारा उद्यम AI उपकरण बाजार पहले से ही कब्जा किया जा चुका है, और देर से प्रवेश करने वाला डोउबाओ अवश्य ही अधिक ग्राहक प्राप्ति लागत का सामना करेगा।
"स्मार्ट एमर्जेंस" के अनुसार, विदेश में जाना भी डोबाओ के लिए इस वर्ष का एक महत्वपूर्ण मुद्दा है।
पहले, 2025 के अंत तक, डोला, डोबाई का विदेशी संस्करण, दैनिक सक्रिय उपयोगकर्ताओं (DAU) की संख्या में करोड़ के आंकड़े को पार कर चुका था। इंटेलिजेंट एमर्जेंस के अनुसार, डोला का 2026 का वृद्धि लक्ष्य है: वर्ष के अंत तक 30 मिलियन DAU प्राप्त करना।
एक जानकार के अनुसार, छोटी भाषाओं वाले देश Dola के मुख्य बाजार हैं। वर्तमान में, विदेशी AI चैटबॉट बाजार लगभग ChatGPT, Claude, Gemini द्वारा कब्जा कर लिया गया है। यूरोप और अमेरिका के बाजार में "AI के तीनों बड़े" के साथ सीधी प्रतिस्पर्धा किए बिना, छोटी भाषाओं वाले बाजार में अंतरिक्ष बनाना Dola की वृद्धि की रणनीति है।
तीसरे पक्ष के डेटा के अनुसार, 2025 की दूसरी छमाही से, डोला इंडोनेशिया, मलेशिया, मैक्सिको आदि देशों के ऐप स्टोर डाउनलोड रैंकिंग में बार-बार शामिल हो रहा है।
——
बाइटडांस में एक साल शामिल होने के बाद, उ योंगहुई का लक्ष्य सीड को बग ठीक करते हुए SOTA मॉडल बनाना था। और 2026 में, AI के हर क्षेत्र में, बाइटडांस का लक्ष्य विजेता बनना है।
अब, Seed 2.0 और Seedance 2.0 के परिणाम सामने आ रहे हैं, और Seed द्वारा इकट्ठा की गई इंजीनियरिंग, डेटा के अनुभव और क्षमताएँ, अगले युद्ध में अधिक कुशलता से पुनः उपयोग की जाएँगी।
(डेंग योंगयी, लेखक ऑफ़ स्मार्ट एमर्जेंस, ने इस लेख में योगदान दिया है।)
