Wajah "standar" yang dihasilkan oleh model video AI sedang menginvasi aliran informasi pengguna. Wajah AI yang memiliki fitur halus dan kulit putih ini muncul di drama kampus, drama sejarah, bahkan berbagai karakter yang telah mengalami transformasi gender, memicu penolakan besar-besaran dari netizen. Pengujian menunjukkan bahwa berbagai model video utama menghasilkan wajah yang sama ketika menggunakan prompt yang sama, karena platform secara default mengaktifkan penguatan prompt, ditambah dengan bias estetika dalam data pelatihan model. Untuk mempertahankan konsistensi wajah, model secara alami lebih menyukai wajah dengan simetri fitur dan kontur yang standar. Gabungan kebutuhan platform, pengguna, dan model menyebabkan konten yang dihasilkan AI terjebak dalam masalah homogenisasi estetika. Para peneliti memperingatkan bahwa fenomena ini berpotensi memperkuat stereotip estetika sosial.Penulis artikel, sumber: Chaping X.PIN
Butuh foto wanita cantik asli untuk menyegarkan mata.
Teman-teman yang sering menonton drama pendek dan video pendek, pasti tidak asing dengan wajah ini.
Orang yang belum melihatnya mungkin mengira ini adalah selebritas media sosial baru, padahal ini adalah wajah yang dihasilkan AI yang terus-menerus muncul di berbagai video baru-baru ini.
Fitur wajah halus, mata cukup besar, hidung cukup kecil, kulit selalu putih, selalu filter cahaya lembut, sudut mulut tepat.

Jika orang asli ini berdiri di depannya, mungkin Shichao bahkan tidak akan berkata sepatah kata pun. Namun, wajah yang tampak tak berbahaya ini justru mengalami serangan siber yang keras.
Bukan karena dia terlalu jelek, tetapi dia seperti kerabat dengan dana yang masuk ke dunia AI, selalu muncul di mana-mana.
Cahaya bulan putih di kampus adalah dia, nyonya muda dalam drama sejarah masih dia.
Anak perempuan berusia lima atau enam tahun adalah dia, wanita tua berusia tujuh puluh atau delapan puluh tahun juga dia.
Dilihat lebih teliti lagi, woc, kenapa orang tua yang mengenakan sorban di sampingnya tetap saja dia???

Setiap hari membuka ponsel, yang terlihat hanyalah wajah yang sama, menonton video pendek justru menimbulkan rasa takut dikelilingi oleh manusia palsu.
Sementara itu, semakin banyak orang yang menemukannya, netizen membanjiri berbagai platform dengan keluhan:
Wajah ini, saya hampir muak melihatnya.
Melihat wajah ini sekarang menimbulkan rasa jijik secara fisiologis.
Berapa banyak orang yang merasa jengkel melihatnya?
Ada juga yang bertanya-tanya, mengapa semua wajah yang dihasilkan AI terlihat sama, siapa wajah yang dicurinya?
Di kolom komentar ada yang menebak bahwa akun penyiar perempuan yang telah diblokir itu, ada yang mengatakan mirip aktor Li Chuan, ada juga yang bilang mirip kakak Park Chan Yeol... Memang benar, baik di dalam maupun luar negeri, pria maupun wanita, sepertinya semua bisa terkait sedikit.

Tapi masalahnya, menebak-nebak tidak akan memberikan kepastian. Karena lebih mungkin bukan wajah tertentu yang dicuri, melainkan "wajah standar rata-rata" yang tidak pernah ada, dibentuk berulang kali dari jalur produksi estetika AI.
Lalu wajah ini sebenarnya berasal dari mana?
Shi Chao, yang tidak percaya pada takdir, langsung mencoba satu per satu model video populer seperti Seedance, Ke Ling, Hai Luo, dan HappyHorse, dan selama eksperimen, ia benar-benar menemukan sedikit pola.
Kami memberikan semua model dua kesempatan, dengan prompt yang sama “gadis mengendarai sepeda”, seharusnya wajah yang dihasilkan setiap kali berbeda, bahkan terkadang muncul orang Asia, terkadang orang asing, itulah sifat alami model besar.
Karena kami hanya membatasi jenis kelamin, tanpa petunjuk lainnya, bukan hanya wajah, sistem seharusnya secara acak menghasilkan orang dengan kewarganegaraan apa pun, warna kulit apa pun, gaya rambut dan pakaian apa pun, serta benar-benar berbeda.
Namun sebenarnya, dengan prompt yang sama, hampir semua model menghasilkan wajah, pakaian, latar belakang, dan sudut pengambilan gambar yang hampir identik pada dua generasi.

Di Seedance 2.0 Fast, Shi Chao bahkan menemukan wajah AI yang persis sama seperti di awal, tampaknya ini adalah sumber segala kejahatan.
Jika hanya satu model yang salah, mungkin itu masalahnya. Tetapi jika semua model secara bersamaan kehilangan keragaman... Shi Chao melakukan penelitian dan menemukan bahwa mungkin ada dua alasan di balik ini.
Pada tingkat pertama, pengguna model video biasa seharusnya sudah tahu bahwa model video sangat sensitif terhadap prompt. Terkadang, satu kata atau urutan beberapa huruf saja bisa memengaruhi hasil akhir yang dihasilkan.
Agar semua orang dapat menarik hadiah secara stabil setiap kali menarik kartu, prompt kami sering dioptimalkan kembali di latar belakang saat dihasilkan.

Sebelumnya, "penguatan prompt" ditempatkan sebagai tombol terpisah di samping, memungkinkan pengguna untuk menggunakan fitur bantuan atau langsung menggunakan prompt asli. Namun, setelah世超 menelusuri banyak platform, tampaknya fitur ini sekarang jarang ditemui, dan penyempurnaan prompt telah menjadi opsi default.
Misalnya, input saya adalah “seorang perempuan sedang mengendarai sepeda sambil tertawa,” namun prompt yang sebenarnya diberikan ke model setelah dioptimasi mungkin menjadi:
Seorang gadis Asia muda yang cantik, mengendarai sepeda di jalan bervegasi yang cerah terkena sinar matahari. Kulitnya putih, fitur wajahnya halus, mata besar, hidung kecil, rambut panjangnya bergerak alami, mengenakan gaun putih, dengan senyum manis di wajahnya. Kamera menangkap medium close-up, cahaya lembut dan alami, depth of field dangkal, gaya visual sinematik, nuansa segar dan indah, ekspresi wajah alami, gerakan lancar, gambar高清 realistis.
Melihat sekali atau dua kali, itu disebut optimasi prompt. Jika dilakukan ribuan kali dengan cara yang sama, bukankah itu menjadi jalur produksi?
Jadi, setelah Shi Chao memodifikasi prompt, menambahkan deskripsi fitur fisik, wajah di kanan bawah jelas berbeda. Namun, tanpa petunjuk lingkungan tambahan, perempuan itu tetap berada di atas jalan bervegasi.

Namun, keindahan fitur wajah ada banyak jenisnya, mengapa AI hanya mengenali yang satu ini, padahal ada begitu banyak wanita cantik di dunia?
Ini membawa kita ke alasan kedua, model gambar dan video secara alami memiliki bias estetika.
Sebuah makalah yang diterbitkan di jurnal Nature tahun lalu secara jelas membahas masalah ini. Dalam penelitian mereka, ditemukan bahwa jika Anda menentukan ras tertentu, wajah-wajah yang dihasilkan model semuanya terlihat seperti saudara kandung.
Bias estetika semacam ini awalnya berasal dari data, misalnya sebagian besar orang menyukai wajah selebritas media sosial, sehingga secara alami mereka akan diberi label cantik. Model tidak mengerti apa-apa, yang penting nanti saat diminta menampilkan wanita cantik, cukup arahkan ke arah tersebut.
Selama proses pelatihan, model juga akan memperbesar bias ini, sehingga wajah yang dihasilkan dari petunjuk fitur yang sama menjadi semakin mirip.

Selain itu, model video untuk memperhatikan konsistensi antar frame juga dapat memperparah homogenisasi estetika.
Setelah semua, wajah yang dihasilkan oleh model video tidak hanya harus terlihat bagus, tetapi juga stabil, memastikan bahwa puluhan hingga ratusan frame, dari depan, belakang, kiri, dan kanan, semuanya tampak seperti orang yang sama.
Jadi, model juga secara alami akan lebih menyukai wajah yang lebih mudah mempertahankan konsistensi, fitur wajah simetris, kontur standar, ciri-ciri tidak ekstrem, ekspresi mudah dikendalikan, dan tidak mudah rusak saat memutar kepala.
Secara keseluruhan, platform menyukai yang aman dan menarik, pengguna menyukai seleb pendek, dan model menyukai yang stabil dan standar—ketiganya digabungkan, maka wajah yang membuat semua orang jenuh pun tercipta.
Sejujurnya, bukan hanya gambar terbaru yang banyak beredar, hampir semua wanita cantik sempurna yang dihasilkan AI tidak terlalu disukai oleh Shichao.

Sumber: Xiaohongshu @Alexander
Memasukkan wajah AI ke aliran informasi kita ibarat eksperimen alienasi siber besar yang terjadi tanpa disengaja.
Wajah tanpa patokan nyata, lahir dari pencucian dan penyulingan data influencer yang tak terhitung jumlahnya.
Saat mereka mengambil alih waktu kita menggulirkan ponsel, menggantikan berbagai wanita cantik asli yang dulu ada, Shi Chao merasa sangat tidak nyaman. Karena persepsi kita terhadap dunia dan definisi kecantikan sedang ditekan oleh AI.
Jadi, orang-orang merasa tidak suka terhadap wajah AI, sebagian mungkin karena efek lembah mengerikan yang ditimbulkan oleh ketidaknyataan itu, namun juga karena penolakan insting terhadap homogenitas.
Beberapa orang mengatakan bahwa video AI di masa depan seharusnya semakin jelas, semakin detail, dan semakin mirip manusia nyata, sehingga ketika orang-orang tidak bisa membedakan keasliannya, mereka akan menyukainya.
Tetapi Shi Chao merasa, meskipun teknologi mampu menciptakan wajah palsu yang tak bisa dibedakan dari yang asli, kita tetap tidak bisa jatuh cinta pada wajah palsu yang sempurna tanpa jiwa.
Gambar, sumber:
Wajah yang dihasilkan AI memengaruhi stereotip gender dan homogenisasi ras N AlDahoul
Xiaohongshu, Douyin
