AI-द्वारा उत्पादित चेहरे शॉर्ट वीडियोज़ में बाढ़ के रूप में आ गए, जिससे जनता में विरोध उठा

AI वीडियो मॉडल द्वारा जनरेट की गई "स्टैंडर्ड फेस" उपयोगकर्ता फीड में घुस रही है। यह सुंदर चेहरे वाली, सफेद त्वचा वाली AI चेहरा स्कूल ड्रामा, पुराने काल के नाटकों और यहां तक कि लिंग परिवर्तित किरदारों में दिखाई दे रही है, जिससे नेटिज़न्स में व्यापक असंतोष पैदा हुआ है। परीक्षणों से पता चला है कि कई प्रमुख वीडियो मॉडल समान प्रॉम्प्ट शब्दों का उपयोग करने पर समान चेहरा जनरेट करते हैं, जिसका कारण प्लेटफॉर्म द्वारा प्रॉम्प्ट एन्हांसमेंट को डिफ़ॉल्ट सेट किए जाना है, साथ ही मॉडल के प्रशिक्षण डेटा में सौंदर्य की पूर्वधारणाएं होना है। चेहरे की समानता को बनाए रखने के लिए, मॉडल स्वाभाविक रूप से सममित अंगों और मानक कंटूर वाले चेहरे को पसंद करते हैं। प्लेटफॉर्म, उपयोगकर्ता और मॉडल की आवश्यकताओं का संयोजन, AI-जनरेटेड कंटेंट को सौंदर्य समानता की समस्या में फंसा रहा है। शोधकर्ताओं ने चेतावनी दी है कि ऐसी घटना सामाजिक सौंदर्य की स्टीरियोटाइपिंग को मजबूत कर सकती है।

लेखक, स्रोत: चापिंग X.PIN

असली सुंदरी की तस्वीरें चाहिए जिनसे आँखें धो लें।

शॉर्ट ड्रामा और शॉर्ट वीडियो देखने वाले दोस्तों, आपको यह चेहरा परिचित लगेगा।

जिन्होंने इसे नहीं देखा है, वे सोच सकते हैं कि यह कोई नया सोशल मीडिया सेलिब्रिटी है, लेकिन वास्तव में, यह हाल ही में विभिन्न वीडियोज़ में बार-बार दिखाई देने वाला एक AI-जनित चेहरा है।

सुंदर चेहरे के अंग, आँखें पर्याप्त बड़ी, नाक पर्याप्त छोटी, त्वचा हमेशा सफेद, हमेशा नरम प्रकाश फिल्टर, मुस्कान का आकार बिल्कुल सही।

अगर वास्तविक व्यक्ति सामने खड़ा होता, तो शिशाओ शायद एक शब्द तक नहीं कहता। लेकिन इतनी बेगुनाह दिखने वाली चेहरे को भी कड़े से कड़ा ऑनलाइन अभियान का निशाना बनाया गया।

यह इसलिए नहीं कि वह बहुत बुरी लगती है, बल्कि इसलिए कि वह AI दुनिया की एक ऐसी रिश्तेदारी है जो हर चीज में शामिल होती है।

कैंपस में उसी का सफेद चाँदनी था, और पारंपरिक ड्रामा में भी वही महारानी थी।

वही लड़की है, जो पांच या छह साल की थी, और वही बुजुर्ग महिला है, जो सत्तर या अस्सी की है।

फिर से ध्यान से देखने पर, वॉव, कैसे पास में टरबैंड बांधे हुए बुजुर्ग व्यक्ति वही है???

हर दिन अपने फोन को खोलते ही एक ही चेहरा दिखता है, शॉर्ट वीडियो स्क्रॉल करते हुए झूठे लोगों से घिरे होने का डर महसूस होता है।

और जैसे-जैसे और अधिक लोगों ने इसे खोजा, सोशल मीडिया पर उपयोगकर्ताओं की भीड़ भरी शिकायतें आने लगीं:

इस चेहरे को मैं अब तक देखकर उल्टी करने वाला हूँ।

अब इस चेहरे को देखकर शारीरिक असहजता महसूस होती है।

कितने लोगों को उसे देखकर नापसंद होता है?

कुछ लोग सोच रहे हैं कि यह एआई कौन सा चेहरा चुरा लिया है कि सभी जनरेट किए गए चेहरे एक जैसे दिखते हैं?

कमेंट सेक्शन में कुछ लोग एक बैन किए गए ब्लॉकस्ट्रीमर का अनुमान लगा रहे हैं, कुछ कह रहे हैं कि यह अभिनेता ली चुआन के जैसा लगता है, और कुछ कह रहे हैं कि यह पार्क चानल की बहन के जैसा लगता है... असल में, आपको बताना पड़ेगा कि घरेलू और विदेशी, पुरुषों और महिलाओं दोनों को कुछ न कुछ समानता दिखती है।

लेकिन समस्या यह है कि अनुमान लगाने से कोई निश्चित जवाब नहीं मिलता। क्योंकि यह बस इस बात से ज्यादा संभावना है कि एक वास्तविक रूप से मौजूद नहीं होने वाली “औसत मानक चेहरा” को AI की सौंदर्य उत्पादन लाइन से बार-बार बनाया गया है।

तो यह चेहरा वास्तव में कैसे आया?

शिशाओ, जो अंधविश्वास में विश्वास नहीं करता, ने बस सीडैंस, केलिंग, शेल, और हैप्पीहॉर्स जैसे प्रमुख वीडियो मॉडल्स क्रमशः आजमाए, और प्रयोग के दौरान, उन्हें वास्तव में कुछ नियम पता चले।

हमने सभी मॉडल को दो बार मौका दिया, एक ही "लड़की साइकिल चला रही है" प्रॉम्प्ट के साथ, जिसके अनुसार, हर बार उनके द्वारा जनरेट किए गए चेहरे अलग-अलग होने चाहिए, कभी-कभी एशियाई, कभी-कभी विदेशी, यही बड़े मॉडल की प्रकृति है।

चूंकि हमने केवल लिंग को सीमित किया है, कोई अन्य संकेत नहीं है, यह केवल चेहरे ही नहीं, बल्कि किसी भी राष्ट्रीयता, किसी भी त्वचा के रंग, किसी भी बालों के शैली और पहनावे आदि को यादृच्छिक रूप से जनरेट करना चाहिए, पूरी तरह से अलग-अलग लोग।

वास्तव में, एक ही प्रॉम्प्ट के साथ, लगभग सभी मॉडल दो बार एक ही चेहरा, वेशभूषा, पृष्ठभूमि, और शूटिंग कोण उत्पन्न करते हैं।

Seedance 2.0 Fast पर, शियाओ ने शुरुआती एआई चेहरे को वहीं पाया, जैसा कि शुरुआत में था, लगता है यही बुराई का मूल है।

अगर केवल एक मॉडल गलत हो रहा है, तो शायद यह उसकी समस्या है। लेकिन अगर सभी मॉडल एक साथ विविधता खो रहे हैं... शियाओ ने इसकी जांच की और पाया कि इसमें शायद दो स्तर के कारण हैं।

पहले स्तर पर, आम वीडियो मॉडल के उपयोगकर्ताओं को पता होना चाहिए कि वीडियो मॉडल प्रॉम्प्ट शब्दों के प्रति बहुत संवेदनशील होते हैं। कभी-कभी एक शब्द, कुछ अक्षरों का क्रम भी अंतिम उत्पादन पर प्रभाव डाल सकता है।

और बड़े पैमाने पर हर कार्ड खींचने पर निकासी को स्थिर रखने के लिए, हमारे प्रॉम्प्ट्स को अक्सर बैकएंड में दोबारा अनुकूलित किया जाता है।

पहले "प्रॉम्प्ट एन्हांसमेंट" को एक अलग बटन के रूप में एक ओर रखा जाता था, जहाँ उपयोगकर्ता चाहें तो हैक कर सकते थे या मूल प्रॉम्प्ट का सीधे उपयोग कर सकते थे। लेकिन शिशाओ ने कई प्लेटफॉर्म्स की जाँच की, ऐसा लगता है कि अब यह बहुत कम देखा जाता है, और प्रॉम्प्ट रिफाइनिंग डिफ़ॉल्ट हो गया है।

उदाहरण के लिए, अगर मैंने "लड़की साइकिल चला रही है, और साथ ही हंस रही है" दर्ज किया है, तो अनुकूलित के बाद मॉडल को वास्तविक रूप से दिया गया प्रॉम्प्ट हो सकता है:

एक युवा, सुंदर एशियाई लड़की, धूप भरी छायादार सड़क पर साइकिल चला रही है। उसकी त्वचा उज्ज्वल है, चेहरे के रेखाएँ सुंदर हैं, बड़ी आँखें, छोटी नाक, लंबे बाल प्राकृतिक रूप से लहरा रहे हैं, वह सफेद ड्रेस पहने हुए है और चेहरे पर मीठी मुस्कान है। कैमरा मीडियम क्लोज-अप का दृश्य है, मृदुल प्राकृतिक प्रकाश, सतही गहराई, सिनेमैटिक दृश्य, ताजगी और सुंदरता का शैली, चरित्र का चेहरा प्राकृतिक है, गति बहुत प्रवाहमय है, और छवि हाई-डेफिनिशन और वास्तविक है।

एक या दो बार देखना तो प्रॉम्प्ट ऑप्टिमाइजेशन कहलाता है, लेकिन लाखों बार ऐसा ही करना तो बस लाइन प्रोडक्शन बन जाएगा।

इसलिए, शीचाओ ने प्रॉम्प्ट को संशोधित करके चेहरे के कुछ विशेषताओं का वर्णन किया, तो दाहिने नीचे का चेहरा स्पष्ट रूप से अलग हो गया। लेकिन अतिरिक्त परिवेश के संकेत के बिना, लड़की अभी भी छायादार सड़क पर सवार है।

हालांकि, सुंदर चेहरे कई प्रकार के होते हैं, दुनिया में इतनी सुंदरियाँ हैं, तो AI केवल इसी को क्यों पहचानता है?

यह दूसरे कारण पर आता है, जिसमें चित्र और वीडियो मॉडल में स्वाभाविक रूप से सौंदर्य पर आधारित पूर्वाग्रह होते हैं।

पिछले वर्ष प्रकाशित एक पेपर, जिसे Nature में प्रकाशित किया गया था, ने इस समस्या को स्पष्ट रूप से चर्चा किया था। उनके अध्ययन में पाया गया कि यदि आप एक निर्दिष्ट नस्ल का उल्लेख करते हैं, तो मॉडल द्वारा उत्पन्न चेहरे सभी भाई जैसे दिखते हैं।

ऐसा सौंदर्य विकृति सबसे पहले डेटा से आती है, जैसे कि अधिकांश लोग इंफ्लुएंसर फेस को पसंद करते हैं, जिन्हें स्वाभाविक रूप से सुंदर का लेबल दे दिया जाता है। मॉडल कुछ भी नहीं जानता, बस आगे के लिए जब भी "सुंदर" का उल्लेख हो, तो इसी दिशा में जाना है।

प्रशिक्षण के दौरान, मॉडल इस विषमता को और बढ़ाता है, जिससे समान विशेषता संकेत शब्दों के साथ उत्पन्न चेहरे एक जैसे होते जाते हैं।

इसके अलावा, वीडियो मॉडल अगले और पिछले कंटेंट की सुसंगठितता पर ध्यान केंद्रित करने के कारण सौंदर्यात्मक समानीकरण को और बढ़ा सकते हैं।

अंततः, वीडियो मॉडल द्वारा उत्पन्न चेहरे केवल सुंदर ही नहीं होने चाहिए, बल्कि स्थिर भी होने चाहिए, इस बात का ध्यान रखना चाहिए कि दर्जनों या सैकड़ों फ्रेमों में, सभी दिशाओं में एक ही व्यक्ति जैसा दिखे।

इसलिए मॉडल स्वाभाविक रूप से उन चेहरों को पसंद करेगा जिन्हें लगातार बनाए रखना आसान होता है—सममित अंग, मानक आकृति, अति चरम विशेषताओं से मुक्त, भाव आसानी से नियंत्रित किए जा सकते हैं, और सिर घुमाने पर खराब नहीं होते।

इसलिए, प्लेटफॉर्म सुरक्षित और सुंदर को पसंद करता है, उपयोगकर्ता शॉर्ट फिल्म इंफ्लुएंसर्स को पसंद करते हैं, मॉडल स्थिर और मानकीकृत को पसंद करते हैं, तीनों के मिलने से लोगों को बोर कर देने वाला चेहरा बन गया।

सच बताऊं तो, नवीनतम रूप से वायरल हुई तस्वीर सिर्फ नहीं, बल्कि लगभग सभी AI द्वारा बनाई गई बिल्कुल दोषरहित सुंदरीयों को शिव अच्छा नहीं लगता।

स्रोत: Xiaohongshu @Alexander

AI चेहरे को हमारी फीड में शामिल करना एक अनजाने में हुई बड़ी साइबर विदेशीकरण प्रयोग के जैसा है।

असली तुलना के बिना, अनगिनत सोशल मीडिया इन्फ्लुएंसर डेटा के धोए और आसान बनाए जाने से उत्पन्न।

जब वे हमारे फोन चेक करने के समय को निगल जाते हैं और पहले की विविध वास्तविक सुंदरियों को विस्थापित कर देते हैं, तो शियाओ को बहुत असहज महसूस होता है। क्योंकि हमारी दुनिया की अनुभूति और सौंदर्य की परिभाषा AI द्वारा दबाई जा रही है।

तो, लोग AI चेहरों से नाराज हैं, एक तरफ शायद असत्य के कारण अजीब अनुभव, दूसरी ओर समानता के प्रति प्राकृतिक विरोध।

कुछ लोग कहते हैं कि AI वीडियो आगे चलकर और अधिक स्पष्ट, और अधिक विस्तार से भरपूर, और अधिक वास्तविक व्यक्ति की तरह दिखने लगेंगे, और जब लोग सच्चाई और झूठ में अंतर नहीं कर पाएंगे, तो वे पसंद करने लगेंगे।

लेकिन शी चाओ को लगता है कि भले ही तकनीक झूठ और सच को अलग करने में सक्षम हो जाए, हम एक बिल्कुल परफेक्ट झूठे चेहरे से प्यार नहीं कर सकते, जिसमें आत्मा न हो।

चित्र, स्रोत:

एआई-जनित चेहरे लिंग स्टीरियोटाइप्स और नस्लीय समानीकरण को प्रभावित करते हैं 》एन अलदाहौल

Xiaohongshu, Douyin