এআই-তৈরি চেহারা সংক্ষিপ্ত ভিডিওতে প্রবাহিত হচ্ছে, যা জনসাধারণের প্রতিক্রিয়া জাগিয়েছে

এআই ভিডিও মডেল দ্বারা তৈরি করা “স্ট্যান্ডার্ড ফেস” ব্যবহারকারীদের ফিডে প্রবেশ করছে। এই পরিষ্কার চেহারা, ফ্যাকাশে ত্বকের এআই চেহারাটি ক্যাম্পাস ড্রামা, পুরনো পোশাকের ড্রামা এবং এমনকি লিঙ্গ পরিবর্তিত চরিত্রগুলিতেও দেখা যাচ্ছে, যা ইন্টারনেট ব্যবহারকারীদের মধ্যে বড় পরিসরে বিরোধিতা সৃষ্টি করেছে। পরীক্ষা দেখিয়েছে, যখন বিভিন্ন প্রধান ভিডিও মডেলগুলি একই প্রম্পট ব্যবহার করে, তখন সবগুলি একই চেহারা তৈরি করে; এর মূল কারণ হলো, প্ল্যাটফর্মগুলি প্রম্পট বৃদ্ধির ডিফল্ট সেটিংসকে সক্রিয় করেছে, এবং মডেলের প্রশিক্ষণের ডেটা নিজেই সৌন্দর্যের পক্ষপাতধর্মী। চেহারার সামঞ্জস্যতা বজায় রাখতে, মডেলগুলি স্বাভাবিকভাবেই সমমিত, স্ট্যান্ডার্ড轮廓-যুক্ত চেহারা পছন্দ করে। প্ল্যাটফর্ম, ব্যবহারকারী, এবং মডেল—এই তিনটির চাহিদা একত্রিত হয়ে AI-জেনারেটড কনটেন্টকে সৌন্দর্যগত সমপ্রকৃতির (homogenization) সমস্যায় ফেলেছে। গবেষকদের সতর্কবাণী, এই ঘটনা সমাজের সৌন্দর্যগত স্টিগমা (stereotype)কেশকেওশকতিরপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুনঃপুন�

লেখক, উৎস: চাপিং X.PIN

চোখ ধুয়ে ফেলার জন্য সত্যিকারের সুন্দরীদের ছবি দরকার।

অনেক শর্ট ড্রামা এবং শর্ট ভিডিও দেখে থাকা সবাইকে এই মুখটা পরিচিত লাগবে।

যারা এটি দেখেননি, তারা হয়তো ভাববে এটি কোনো নতুন ইনফ্লুয়েন্সার, কিন্তু বাস্তবে, এটি সাম্প্রতিক বিভিন্ন ভিডিওতে পুনরাবৃত্তি হচ্ছে একটি AI-তৈরি চেহারা।

চোখ পর্যাপ্ত বড়, নাক পর্যাপ্ত ছোট, ত্বক সবসময় ফ্যাকাশে, সবসময় মৃদু ফিল্টার, মুখের কোণ ঠিক ঠিক।

যদি বাস্তব মানুষটি সামনে দাঁড়িয়ে থাকত, তাহলে শিচাও একটি কথাও বলতে পারতেন না। কিন্তু এই এতটাই নিরীহ মুখটির উপর কঠোরভাবে "ওয়েব হানা" চালানো হয়েছে।

এটা তার অপ্রতিষ্ঠিত চেহারার জন্য নয়, বরং সে এমন একজন যেন AI জগতের একটি সম্পদযুক্ত সদস্য, যে যেকোনো জিনিসেই উপস্থিত থাকে।

ক্যাম্পাসের সাদা চাঁদের আলো সেই মেয়েটি, পুরানো পোশাকের ড্রামা-এর মহারানীও সেই মেয়েটি।

ছয় বা সাত বছরের একটি ছোট মেয়ে তিনি, আটাশো বা নব্বইয়ের একজন বুড়িও তিনি।

আবার ভালো করে দেখলে, ওয়োসি, কিভাবে পাশে মাথায় পাগড়ি বাঁধা বুড়ো মানুষটি তাই?!?!

প্রতিদিন মোবাইল খুলে একই মুখটি দেখতে পান, শর্ট ভিডিও স্ক্রোল করতে করতে মনে হয় আপনি প্রতিকৃতি মানুষদের দ্বারা ঘিরে ফেলা হয়েছে।

এবং যত বেশি মানুষ এটি আবিষ্কার করছে, তত বেশি ইন্টারনেট ব্যবহারকারীরা অসংখ্য অভিযোগ করছে:

এই মুখটা, আমি এখন এটাকে দেখে বমি করতে চাই।

এখন এই মুখটি দেখলে শারীরিকভাবে অসহিষ্ণুতা হয়।

কতজন তাকে দেখে অসহিষ্ণুতা অনুভব করে?

কেউ কেউ বুঝতে পারছেন না যে এই এআই কিভাবে সবাইকে একই মুখ দিয়ে তৈরি করছে, এটা কার চেহারা চুরি করছে?

কমেন্ট সেকশনে কেউ কেউ বলছেন যে এটি একজন ব্যান হওয়া স্ট্রিমার, কেউ কেউ বলছেন এটি অভিনেতা লি চুয়ানের মতো, আবার কেউ কেউ বলছেন এটি পার্ক চান-রিয়ের বোনের মতো... আসলেই, দেশীয় বা বিদেশী, পুরুষ বা মহিলা, সবাইকেই কিছুটা মিলে যাচ্ছে।

কিন্তু সমস্যা হলো, অনুমান করে করে কোনো নির্দিষ্ট উত্তর পাওয়া যায় না। কারণ, কোন নির্দিষ্ট চেহারা চুরি হয়েছে তার চেয়ে এটি বেশি সম্ভবত একটি AI সৌন্দর্যের লাইনে বারবার গড়ে তোলা, যা বাস্তবে অস্তিত্বহীন একটি “গড় মানক চেহারা”।

এই চেহারাটা কিভাবে এলো?

সেশাও, যিনি অবিশ্বাস করেন, সে সিড্যান্স, কেলিন, শেল, হ্যাপি হর্স এই মুখ্য ভিডিও মডেলগুলি একে একে পরীক্ষা করেছিলেন, এবং পরীক্ষার সময় তিনি সত্যিই কিছু নিয়ম খুঁজে পেয়েছিলেন।

আমরা সমস্ত মডেলকে দুইবার সুযোগ দিয়েছি, একই “মেয়েটি সাইকেল চালাচ্ছে” প্রম্পট দিয়ে, যার অর্থ হল প্রতিবার তারা ভিন্ন চেহারা তৈরি করবে, কখনও এশিয়ান, কখনও বিদেশি—এটিই বড় মডেলের স্বভাব।

কারণ আমরা শুধু লিঙ্গ নির্ধারণ করেছি, অন্য কোনো ইঙ্গিত নেই, শুধু মুখ নয়, এটি যেকোনো জাতিগত পটভূমি, যেকোনো ত্বকের রং, যেকোনো চুলের স্টাইল বা পোশাক ইত্যাদি সহ সম্পূর্ণভাবে ভিন্ন মানুষকে র‍্যান্ডমভাবে তৈরি করা উচিত।

বাস্তবে, একই প্রম্পট ব্যবহার করে, প্রায় সমস্ত মডেল দুইবার একই চেহারা, পোশাক, পটভূমি এবং ক্যামেরা কোণ তৈরি করে।

Seedance 2.0 Fast-এ, শিয়াও শুরুর মতোই একটি এআই চেহারা খুঁজে পেয়েছেন, যার মানে এটিই সমস্ত দুর্নীতির উৎস।

যদি শুধু একটি মডেল ভুল করে, তাহলে সম্ভবত এটির সমস্যা। কিন্তু যদি সব মডেল একসাথে বৈচিত্র্য হারিয়ে ফেলে... শি চাও পর্যালোচনা করে দেখেন যে এর মধ্যে দুটি স্তরের কারণ থাকতে পারে।

প্রথম স্তরে, সাধারণ ভিডিও মডেল ব্যবহারকারীরা জানেন যে ভিডিও মডেলগুলি প্রম্পট শব্দের প্রতি অত্যন্ত সংবেদনশীল। কখনও কখনও একটি শব্দ, কয়েকটি অক্ষরের ক্রমও উত্পাদিত চূড়ান্ত ফলাফলকে প্রভাবিত করতে পারে।

এবং বড় দলের জন্য প্রতিবার কার্ড টানার সময় স্থিতিশীলভাবে পুরস্কার পাওয়ার জন্য, আমাদের প্রম্পটগুলি প্রায়শই ব্যাকএন্ডে পুনরায় অপ্টিমাইজ করা হয়।

আগে "প্রম্পট বাড়ানো" একটি আলাদা বোতাম হিসেবে পাশে রাখা হত, যেখানে ব্যবহারকারীরা গেম চালাতে পারত বা মূল প্রম্পট দিয়েই চলে যেত। কিন্তু শিওয়া বিভিন্ন প্ল্যাটফর্ম পরীক্ষা করে দেখেছেন যে এখন এটি খুবই কম দেখা যায়, এবং প্রম্পট উন্নয়নটি ডিফল্ট হয়ে গেছে।

যেমন আমি প্রবেশ করিয়েছি “একজন মহিলা সাইকেল চালাচ্ছেন, চালানোর সময় হাসছেন”, এবং অপ্টিমাইজড সংস্করণটি মডেলের কাছে প্রদান করা হয়েছিল:

একজন যুবতী সুন্দরী এশিয়ান মহিলা সূর্যালোকে ভরপুর একটি গাছের ছায়াযুক্ত রাস্তায় সাইকেল চালাচ্ছেন। তার ত্বক ফ্যাকাশে, চেহারা সুন্দর, বড় চোখ, ছোট নাক, দীর্ঘ চুল প্রাকৃতিকভাবে ঝুলছে, সাদা পোশাক পরেছেন, মুখে মিষ্টি হাসি। ক্যামেরা মধ্যবর্তী-ক্লোজ-আপ, নরম প্রাকৃতিক আলো, পৃষ্ঠপটের গভীরতা কম, সিনেমাটিক ছবি, প্রাণবন্ত ও সৌন্দর্যময় শৈলী, চরিত্রের অভিব্যক্তি প্রাকৃতিক, গতিপথ স্বাভাবিক, ছবিটি হাই-ডিফিনিশন ও বাস্তবসম্মত।

একবার বা দুবার দেখলে এটাকে প্রম্পট অপ্টিমাইজেশন বলা যায়, কিন্তু হাজার হাজার বার এভাবেই পূরণ করলে তো এটা একটা লাইন প্রসেসিং হয়ে যায়।

সুতরাং, শি চাও প্রম্পট সংশোধন করে চেহারার কিছু বৈশিষ্ট্য যোগ করার পর, ডান নিচের চেহারা স্পষ্টভাবে ভিন্ন হয়ে গেল। কিন্তু অতিরিক্ত পরিবেশের প্রম্পট ছাড়া, মেয়েটি এখনও ছায়াযুক্ত পথের উপর চড়ে আছে।

কিন্তু সুন্দর মুখের অনেক ধরন আছে, বিশ্বে এত সুন্দরী আছে, তবে AI শুধু এই একজনকেই চিনে?

এটি দ্বিতীয় কারণে পৌঁছেছে, চিত্র এবং ভিডিও মডেলগুলির মূলতই সৌন্দর্য্যের পক্ষপাত রয়েছে।

গত বছর প্রকাশিত একটি নেচার জার্নালের পেপারে এই প্রশ্নটি স্পষ্টভাবে আলোচনা করা হয়েছিল। তাদের গবেষণায় দেখা গিয়েছিল যে, যদি আপনি একটি বর্ণগত গোষ্ঠী নির্দিষ্ট করেন, তবে মডেলটি তৈরি করা চেহারাগুলি সবই যেন ভাইয়ের মতো।

এই সৌন্দর্যের বিষয়ে বিকৃতি প্রথমে ডেটা থেকে আসে, যেমন বেশিরভাগ মানুষ ইনফ্লুয়েন্সার ফেস পছন্দ করে, তাই এগুলো স্বাভাবিকভাবেই 'সুন্দরী' লেবেল পায়। মডেলটি কিছুই বুঝে না, শুধু পরবর্তীতে 'সুন্দরী' বললে এই দিকে যাওয়াই হলো।

প্রশিক্ষণের সময়, মডেলটি এই পক্ষপাতকে আরও বাড়িয়ে তোলে, যার ফলে একই বৈশিষ্ট্য প্রম্পট দিয়ে তৈরি চেহারা একের পর এক একই মতো হয়ে যায়।

এছাড়াও, ভিডিও মডেলগুলি প্রাক্কলন সামঞ্জস্যতা নিশ্চিত করার জন্য আরও বেশি সৌন্দর্য্য সমানীকরণকে তীব্র করতে পারে।

বিশেষ করে ভিডিও মডেল দ্বারা তৈরি চেহারা শুধু সুন্দর হওয়া উচিত নয়, বরং স্থিতিশীলও হতে হবে, যাতে প্রায় পঞ্চাশ থেকে শতাধিক ফ্রেমে সবদিকে একই ব্যক্তির মতো দেখায়।

সুতরাং মডেলটি স্বাভাবিকভাবেই যে চেহারাগুলি সহজে স্থিতিশীল রাখা যায়, তাদের প্রতি ঝুঁকবে—যেমন সমমুখ, স্ট্যান্ডার্ড আকৃতি, চরম বৈশিষ্ট্যহীন, অভিব্যক্তি নিয়ন্ত্রণযোগ্য, এবং মাথা ঘুরানোর সময় ভাঙে না।

সর্বোপরি, প্ল্যাটফর্ম নিরাপদ এবং সুন্দর পছন্দ করে, ব্যবহারকারীরা শর্ট ড্রামা ইনফ্লুয়েন্সারদের পছন্দ করে, মডেলগুলি স্থিতিশীল এবং মানকযুক্ত পছন্দ করে, তিনটি পক্ষের সমন্বয়েই এই চেহারা জন্ম নেয়।

সত্যি বলতে কি, শুধু সাম্প্রতিক কালে ব্যাপকভাবে ছড়িয়ে পড়া ছবিটিই নয়, প্রায় সব এআই-জেনারেটেড দোষমুক্ত সুন্দরীর প্রতি শিয়াও বেশি পছন্দ করেন না।

সোর্স: শিয়াওহংশু @Alexander

এআই চেহারাকে আমাদের ফিডে প্রবেশ করানো হল একটি অজান্তেই সম্পন্ন বৃহৎ সাইবার বিকৃতির পরীক্ষা।

অসংখ্য ইনফ্লুয়েন্সার ডেটার ধুয়ে পরিষ্কার ও প্রক্রিয়াকরণের মাধ্যমে জন্ম নেওয়া বাস্তবের সাথে তুলনা করার কোনো চেহারা।

যখন এগুলো আমাদের মোবাইল ফোন স্ক্রোল করার সময় দখল করে নেয় এবং আগের বিভিন্ন বাস্তব মহিলাদের প্রতিস্থাপন করে, তখন শিয়াও অনুভব করে খুব কষ্ট। কারণ আমাদের বিশ্বের প্রতি অনুভূতি এবং সৌন্দর্যের সংজ্ঞা এখন AI দ্বারা চাপা পড়ছে।

সুতরাং, মানুষ এআই চেহারার প্রতি বিরোধিতা করছে, একদিকে হয়তো অবাস্তবতার কারণে অজ্ঞাত অঞ্চলের প্রভাব, আবার একদিকে সমানীকরণের প্রতি স্বাভাবিক প্রতিরোধও রয়েছে।

কেউ বলেছেন, এআই ভিডিও আস্তে আস্তে আরও পরিষ্কার, আরও বিস্তারিত এবং আরও মানুষের মতো হয়ে উঠবে, যখন সবাই সত্য ও মিথ্যা চেনার ক্ষমতা হারাবে, তখন এগুলোকে পছন্দ করবে।

কিন্তু শি চাও মনে করেন, যদিও প্রযুক্তি সত্য ও মিথ্যাকে চিনতে অক্ষম করে তুলতে পারে, আমরা একটি পারফেক্ট মিথ্যা মুখের প্রতি ভালোবাসা দেখাতে পারব না, কারণ এর মধ্যে আত্মা নেই।

ছবি, উৎস:

এআই-তৈরি চেহারা লিঙ্গ স্টেরিওটাইপ এবং বর্ণগত সমানীকরণকে প্রভাবিত করে। এন আলদাহৌল

Xiaohongshu, Douyin