लेखक: ज़हेंग मिन्फांग
स्रोत: वॉल स्ट्रीट जर्नल
जब प्रशांत के पार के OpenAI ने लगता है कि AI जनरेटिव मॉडल Sora के लिए "पाउज़ बटन" दबा दिया, तो चीन के तकनीकी दिग्गज इस क्षेत्र में एक प्रतिक्रियात्मक हमला शुरू कर दिया।
पिछले दिनों, बाइटडांस के नवीनतम एआई वीडियो जेनरेशन मॉडल सीडेंस 2.0 लॉन्च हुआ, जिसने मल्टीमोडल इनपुट, स्व-ऑपरेशन और संगतता जैसे लाभों के कारण तेजी से इंटरनेट को बुरा कर दिया।
खेल विज्ञान के संस्थापक फेंग जी गहराई से अनुभव करने के बाद बहुत महत्वपूर्ण निर्णय देते हैं: "सामग्री के क्षेत्र में अवश्य ही अद्वितीय मुद्रास्फीति का सामना करना पड़ेगा।"
फेंग जी के भविष्यदृश्य अवास्तविक चिंता नहीं है।
इस तरह की आघात तेजी से ई-कॉमर्स, गेमिंग, वीडियो प्लेटफॉर्म, फिल्म निर्माण और अन्य उद्योगों में फैल रहा है: ई-कॉमर्स क्षेत्र में, निम्न-स्तरीय अपवाह और शूटिंग आधार के तकनीकी बाधाएं पूरी तरह से नष्ट हो गई हैं; गेम उद्योग में, संकल्प सत्यापन और खरीदारी सामग्री के उत्पादन चक्र को अत्यधिक संकुचित कर दिया गया है, प्रतिस्पर्धा अधिक कठोर हो गई है; वीडियो प्लेटफॉर्म को आपूर्ति के तेजी से विस्फोट का सामना करने के लिए अपने वितरण तर्क को आगे अनुकूलित करना पड़ेगा; जबकि फिल्म निर्माण के पारंपरिक "शूटिंग + संपादन" के रैखिक प्रक्रिया को "प्रम्प्ट + उत्पादन"
लाभ और प्रतिस्थापन के बारे में एक उद्योग धोधना पहले से ही शुरू हो चुका है।
वीडियो उत्पादन की बमब
पिछले एक वर्ष में, एआई वीडियो की सबसे बड़ी समस्या डिलीवरी में रही।
क्या यह सोरा, रनवे, घरेलू के लिंग है, या यहां तक कि बाइटडांस के स्वदेशी विकसित जिमेंग के लिए भी ऐसा समस्या है। निर्माता अक्सर "कार्ड ड्रा" खेल में फंसे रहते हैं, एक नष्ट न होने वाला, एकरूपता वाला कुछ सेकंड के वीडियो प्राप्त करने के लिए दसियों बार पुनर्प्राप्ति करने की आवश्यकता होती है।
सीडेंस 2.0 की मुख्य तकनीकी उपलब्धि "टेक्नो-फ्लैशी" को "वितरित करने योग्य कहानी" में बदलने की कोशिश करना है।
मुख्य क्षमता के तीव्र विकास में तीन पहलू हैं:
एक है बहु-संवेदी इनपुट। पूरे दिन के तकनीकी परीक्षण के अनुसार, सदस्य उपयोगकर्ता जो अपने सपने में पहली बार लॉग इन करते हैं, वे केवल 1 युआन के लिए ऑटो-रिन्यूअल को सक्रिय करके सीधे Seedance 2.0 का उपयोग कर सकते हैं, जो पाठ, चित्र, वीडियो और ऑडियो को संदर्भ सामग्री के रूप में इनपुट के रूप में समर्थन करता है, जिसे कहा जा सकता है कि लगभग सभी प्रारूप जिन्हें आप सोच
दूसरा, कहानी को समझना और स्वयं कैमरा संचालित करना सीखना। Seedance 2.0 में 'निर्देशक स्तरीय' विचार दिखाई दे रहा है, जो केवल जटिल कहानी तर्क को समझ सकता है, लेकिन कैमरा भाषा को स्वचाछ रूप से नियोजित कर सकता है, झूलने, खींचने, घुमाने और बदलने के कैमरा संचालन को पूरा कर सकता है। वीडियो अब स्थैतिक चित्र के सादे विस्थापन से अधिक नहीं है, बल्कि फिल्मी भावना के साथ कहानी �
तीसरा, दृश्य की एकरूपता है। पूरे दिन के तकनीकी वास्तविक परीक्षण के अनुसार, बाजार में उपलब्ध कई एआई वीडियो उत्पादन एप्लिकेशनों के दृश्य में मुख्य वस्तु के गति के प्रक्रिया में चेहरे के भाव बर्बाद हो जाते हैं, पृष्ठभ
लेकिन डेमो वीडियो के आधार पर, सीडेंस 2.0 ने मुख्य वस्तु के गति प्रक्रिया के चेहरे, दृश्य आदि की संगतता को बरकरार रखा, जिससे लगातार कहानी के अभिव्यक्ति को संभव बनाया।
इसका मतलब यह है कि, एआई वीडियो जनरेशन खिलौने से उपकरण में बदल रहा है। वीडियो जनरेशन को मानकीकृत औद्योगिक पाइपलाइन में बदलने की इस क्षमता ने "प्रत्येक व्यक्ति एक निर्देशक है" एक खाली बात नहीं बना दिया है, जो वीडियो निर्माण की लागत को
फेंग जी ने इस परिवर्तन के लिए "मुद्रास्फीति" शब्द का उपयोग किया।
"सामान्य वीडियो उत्पादन लागत परंपरागत फिल्म उद्योग के तर्क के अनुसार नहीं चलेगी, बल्कि धीरे-धीरे कम्प्यूटिंग की सीमांत लागत के करीब पहुंच जाएगी। सामग्री के क्षेत्र में अवश्य ही अद्वितीय मुद्रास्फीति का अनुभव होगा, परंपरागत संगठन संरचना और निर्माण प्रक्रिया पूरी तरह से पुनर्निर्मित हो जाएगी। विश्वास करें कि जो लोग इसका उपयोग कर चुके हैं, वे जल्दी से इस भविष्यवाणी को समझ लेंगे कि यह बिल्कुल भी अतिरं
पहला झटका
जब वीडियो उत्पादन की सीमांत लागत शून्य के करीब हो जाती है, तो पुराने लागत संरचना पर आधारित व्यवसाय मॉडल पहले प्रभावित होंगे।
ई-कॉमर्स, गेमिंग, वीडियो प्लेटफॉर्म और फिल्म निर्माण चारों उद्योगों को पहली लहर के रूप में प्र
ई-कॉमर्स क्षेत्र में सबसे पहले सीधा झटका महसूस हुआ।
वस्तुओं के प्रदर्शन, परिदृश्य निर्देशन और फ़ंक्शन वर्णन वीडियो आर्टिफिशियल नारेटिव के जटिलता पर निर्भर नहीं करते, ब
सीडेंस 2.0 के लोकप्रिय होने के साथ, वीडियो अभिव्यक्ति क्षमता तक पहुंचने के लिए व्यापारियों के लिए बाधाएं पूरी तरह से खत्म हो गई हैं। पिछले दिनों "जानकारी के अंतर" और "तकनीकी बाधाओं" पर निर्भर रहने वाले निम्न-गुणवत्ता वाले वीडियो अनुबंध वाली कंपनियां, टाओबाओ शूटिंग बेस शीतकाल का सामना करने वाले हैं, वीडियो निर्माण व्यापारिय
ई-कॉमर्स की तुलना में, एआई वीडियो जनरेशन मॉडल का गेमिंग पर प्रभाव अभी तक अपेक्षाकृत सीमित हो सकता है, लेकिन क्रांति पहले से ही शुरू
दुनिया के दृष्टिकोण के निरूपण, अवधारणा के प्रमाण और खरीदारी के सामग्री वीडियो की लागत सूचकांक के अनुसार घट रही है। अधिक परियोजनाएं अधिक शुरुआती चरण में सत्यापित की जाएंगी, �
एक बीजिंग गेमिंग कंपनी के अंतर्दृष्टि ने एलियन टेक को बताया कि कंपनी ने Seedance 2.0 के लिए छोटे पैमाने पर परीक्षण शुरू कर दिया है।
AI वीडियो जनरेशन मॉडल अभी भी वीडियो प्लेटफॉर्म के वितरण तर्क को बदल रहे हैं।
टिकटॉक, कुईकुई जैसे प्लेटफॉर्म के लिए, सीड डांस 2.0 जैसे मॉडल द्वारा उत्पन्न वीडियो के कारण सामग्री की आपूर्ति में बहुत अधिक वृद्धि हो रही है, जो प्लेटफॉर्म की मुख्य प्रतिस्पर्धा क्षमता को पूरी तरह से "नियंत्रण और वितरण" तंत्र पर धकेल देता है, उदाहरण के लिए, किसके एल्गोरिथ्म की अत्यधिक एआई द्वारा उत्पन्न सामग्री में से सोना निकालने की क्षमता अधिक सटीक है, किसकी व्यावसायिक रूपांतरण दक्षता अधिक है, वही जीत
फिल्म और टेलीविजन के क्षेत्र में, सीडांस 2.0 की बहु-कैमरा कहानी बताने की क्षमता उत्पादन प्रक्रिया को पुनर्नि�
पिछले एक फिल्म या टेलीविजन शो के जन्म के लिए अक्सर कड़ी रैखिक औद्योगिक प्रक्रिया का पालन किया जाता था: पहले बड़ी मात्रा में सामग्री की शूटिंग की जाती थी, फिर संपादक बाद में एक पोस्ट प्रोडक्शन स्टूडियो में चयन और जोड़ताल करके कहानी की तर
लेकिन सीडेंस 2.0 के तर्क में, यह सीमा धुंधली हो रही है।
शूटिंग के चरण में, भविष्य के सेट डिज़ाइन को एआई मॉडल द्वारा कम लागत पर उत्पन्न किए जाने की संभावना है; मॉडल के पास कैमरा चलाने और कहानी के ताल के बारे में समझ है, वीडियो उत्पन्न करने के तुरंत बाद वास्तव में "कटिंग" का काम समाप्त हो चुका हो
एआई अब अलग-अलग सामग्री के शॉट्स को निकालने में नहीं, बल्कि सीधे ही एक संगत समय और स्थान के संबंध वाली "पूर्ण फिल्म" को डिलीवर करने में सक्षम है।
इसका मतलब यह है कि पारंपरिक फिल्म और टेलीविजन निर्माण में समय ले ले वाला पोस्ट-प्रोडक्शन एडिटिंग चरण, एल्गोरिदम द्वारा "आयाम कम करने का �
भविष्य के निर्माण प्रवाह के अब "फिल्मांकन + संपादन" के बजाय "संकेत शब्द + उत्पादन" होने की संभावना है, संपादकों के कार्यों के "ऑपरेटर" से "निर्देश इंजीनियर" या "सौंदर्य निरीक्षक" में परिवर्तित होने की संभावना है।
हालांकि वर्तमान Seedance 2.0 द्वारा उत्पन्न वीडियो प्रतिशत रूप से बिल्कुल अच्छा नहीं है, तार्किक विवरण, छवि आदि में सुधार की आवश्यकता है, लेकिन तकनीकी नवीनीकरण की गति बाजार के अपेक्षाओं की तुलना में बहुत तेज है, इन समस्याओं के निकट भविष्य में बाधा नहीं रहने की
आईपी की "चाबी"
सीडेंस 2.0 की अद्भुत "रीमेक" क्षमता, सामान्य लोगों को निर्माण की खुशी देने के साथ-साथ, निर्माताओं को अनुभव नहीं हुआ है।
हाल ही में, चौ स्टार की शानदार फिल्मों के बहुत सारे "द्वितीयक निर्माण" और यहां तक कि "मजाक" वीडियो शॉर्ट वीडियो प्लेटफॉर्म पर तेजी से फैल
एआई वीडियो जनरेशन मॉडल की कंप्यूटेशनल पावर के साथ, चोउ झिंग्वेई के चेहरे के अभिव्यक्ति, पहचान बन गए हंसी के तरीके और घटिया शैली के लाइन, बड़ी संख्या में उपयोगकर्ता द्वारा कम लागत के साथ दोहराए गए, और यहां तक कि कई ऐसी अजीबो-गरीब कहानियां भी उत्पन
इसने जल्दी से चाओ जिंग्ज़ि की टीम के ध्यान को आक
चाउ कॉन-फू के प्रबंधक चेन ज़ेन-यू ने सार्वजनिक रूप से टिप्पणी की, "मैं पूछना चाहता हूं कि क्या ये नकल करने के अधिकार का उल्लंघन है (विशेष रूप से अब दो दिनों में बड़ी मात्रा में फैलाव), मुझे विश्वास है कि निर्माता पहले से ही लाभ उठा चुका है, और क्य
यह प्रश्न, बराबर पर एआई युग की कॉपीराइट चिंता को खोलता हुआ दिखाई देता है, लेकिन व्यावसायिक तर्क के गहराई में देखने पर यह शीर्ष संपत्ति के एआई युग में अत्यधिक दुर्लभ होने का ठीक प्रम
भविष्य में, अत्यधिक एआई जनित सामग्रि के बाढ़ में, तकनीक स्वयं अब बाधा नहीं होगी, क्योंकि प्रत्येक व्यक्ति के पास एक ही सीडेंस 2.0 उपकरण होगा।
असली बाधाएं अभी भी आईपी स्वामियों के हाथ में हैं।
बाजार में बहुत सारे "उच्च नकली" जू जिंग्वेई के कारण, "सच्चा · जू जिंग्वेई" आईपी की अद्वितीयता अधिक स्पष्ट हो जाती है।
जब सामग्री की आपूर्ति केवल अत्यधिक न होकर बल्कि "मुद्रास्फीति" भी हो रही हो, तो उपयोगकर्ता का समय और ध्यान अद्वितीय रूप से महंगा हो जाएगा। उपयोगकर्ता के ध्यान को तुरंत पकड़ने में सक्षम वे अभी भी वे क्लासिक IP होंगे जिनका समय द्वारा प्रमाणन किया गया है और
दूसरे शब्दों में, एआई ने निर्माण की दीवार को कम कर दिया है, लेकिन "पहचान क्षमता" के मूल्य को असीम रूप से बढ़ा दिया है।
आईपी मालिकों के लिए भविष्य अभी भी उज्ज्वल है। लंबे समय तक जमा आईपी संपत्ति अब केवल उल्लंघन के लिए लक्ष्य नहीं रहेगी, बल्कि यह वैध अधिकार द्वारा एआई के लाभ के तहत असंख्य निर्माताओं के हाथों व्यावसायिक मूल्य के सूचकांक के रूप में बढ़ा दी जाएगी।
2024 के फरवरी में OpenAI द्वारा लॉन्च किए गए Sora 1.0 जो 60 सेकंड तक के एआई वीडियो जनरेशन मॉडल का समर्थन करने वाला विश्व का पहला था, लेकिन अब डब्बल डॉट के Seedance 2.0 ने 60 सेकंड के प्राकृतिक ऑडियो नारेटिव फिल्मों के बहु-मोडल इनपुट जनरेशन को प्राप्त करने में केवल 2 साल का समय लिया।
इस तकनीकी विकास के तेज गति के युग में, विभिन्न उद्योगों और क्षेत्रों के लिए एक विभाजित मार्ग है: निष्पादन स्तर पर लागत असीमित रूप से संकुचित हो रही है, और उन दोहराव वाले, श्रम और समय के आधार पर कार्यों को निर्दयता से बदल दिया जाएगा; इसके बराबर, आईपी, रचनात्मकता के मूल्य असीमित रूप से बढ़
जब उपकरण आसानी से उपलब्ध हो जाएंगे, तो सामग्री के स्तर का निर्णय अब किसी सॉफ्टवेयर के उपयोग करने या न करने के आधार पर नहीं, बल्कि आपके मस्तिष्क में दुनिया के बारे में �
