AI生成の顔がショート動画にあふれ、大衆の反発を招く

AIビデオモデルが生成する「標準的な顔」がユーザーのフィードに浸透している。この精緻な顔立ちで肌が白いAI顔は、学園ドラマや時代劇、さらには性転換されたさまざまなキャラクターに登場し、ネットユーザーから広範な反感を呼んでいる。テストによると、複数の主要なビデオモデルが同じプロンプトを使用すると、すべて同じ顔を生成する。その根本原因は、プラットフォームがプロンプト強化をデフォルト設定としており、モデルの訓練データ自体に審美の偏見が存在することにある。顔の一貫性を維持するために、モデルは対称的で標準的な輪郭の顔を自然に好む。プラットフォーム、ユーザー、モデルの三者の要望が重なり合い、AI生成コンテンツは審美の同質化というジレンマに陥っている。研究者は、この現象が社会の審美のステレオタイプを強化する可能性があると警告している。

文章作者、出典：差評X.PIN

本物の美女の写真が見たいです。

短劇や短视频をよく見る皆さんなら、この顔に馴染みがあるはずです。

見たことがない人は、これが新しいインフルエンサーだと思ってしまうかもしれないが、実際には、最近のさまざまな動画で繰り返し登場するAI生成の顔である。

顔のバランスが整っており、目は十分に大きく、鼻は小さく、肌は常に白く、常に柔らかい光のフィルターがかけられ、口元の曲線がちょうどよい。

もし実際の人が目の前にいたら、世超はきっと一言も言わないだろう。しかし、このように無害に見える顔が、激しいネット暴行を受けた。

彼女が特に醜いわけではなく、AI界の資金持ちで入ってきた関係者のように、何を見ても彼女が出演しているからだ。

キャンパスの白月光は彼女であり、古装劇の令嬢も彼女だ。

五六歳の女の子は彼女であり、七八十歳の老太太も彼女である。

改めてよく見ると、わお、隣で頭巾を巻いているおじいさんは彼女なの？？？

毎日携帯電話を開くと、同じ顔ばかりが目に飛び込み、短い動画をスクロールしているだけで、偽人のに囲まれているという恐怖感を覚える。

しかし、発見した人が増えるにつれ、ネットユーザーたちから次々と不満の声が上がっている：

この顔、もう見飽きた。

この顔を見ると、生理的に嫌悪感を覚える。

彼女を見て嫌悪感を抱く人は何人いる？

また、AIが生成する人物がすべて同じに見えるのはなぜなのか、誰の顔をコピーしたのかと疑問に思う人もいます。

コメント欄には、すでにアカウントが停止された女性配信者を推測する人もいれば、俳優の李川に似ているという人もいれば、パク・チャンヨルの姉に似ているという人もいます…。実際、国内外を問わず、男性でも女性でも、どこか似ている点があるように見えます。

しかし問題は、いくら推測しても確実な答えが得られないということだ。具体的にどの顔が盗まれたかよりも、これはAIの審美ラインから繰り返し捏造された、実在しない「平均的な標準顔」である可能性が高い。

では、この顔はどのようにして生まれたのでしょうか？

不信邪の世超は、Seedance、Keling、Hailuo、HappyHorse といった主要な動画モデルを一つずつ試してみたが、実験の過程でいくつかのパターンを発見した。

私たちはすべてのモデルに2回の機会を与え、同じ「女性が自転車に乗る」というプロンプトを使用します。本来、各回で生成される顔は異なるべきであり、時にはアジア系、時には外国人の顔が生成されるのが大規模モデルの本質です。

性別のみを制限しており、その他のヒントは一切ないため、顔だけでなく、あらゆる国籍、あらゆる肌の色、あらゆるヘアスタイルや服装など、まったく異なる人物をランダムに生成する必要があります。

しかし実際には、同じプロンプトを使用しても、ほぼすべてのモデルで2回生成された顔、服装、背景環境、撮影角度がほぼ同じです。

Seedance 2.0 Fast で、世超は最初と同じAIの顔を見つけた。これが悪の根源であるようだ。

一つのモデルだけが誤った場合、それはそのモデルの問題かもしれない。しかし、すべてのモデルが同時に多様性を失った場合…世超は調査し、その背後には二つの要因がある可能性があることを発見した。

第一層、一般的ビデオモデルのユーザーはご存知だと思いますが、ビデオモデルはプロンプトに非常に敏感です。たった一つの単語や文字の並び順でも、生成される最終的な結果に影響を与えることがあります。

また、皆様が毎回のガチャで安定して金銭を獲得できるように、私たちのプロンプトはバックエンドで再最適化されます。

以前は「プロンプト強化」が別ボタンとして側面に配置され、ユーザーは強化版を使用することも、元のプロンプトをそのまま使用することもできました。しかし、世超がさまざまなプラットフォームを調査したところ、現在ではそのような機能はほとんど見られず、プロンプトの改善がデフォルトになっています。

例えば、私が入力したのが「女性が自転車を乗りながら笑っている」である場合、最適化された後、モデルに実際に渡されるプロンプトは次のようになる可能性がある：

明るい日差しの並木道を、若い美しいアジアの女性が自転車で走っている。肌は白く、顔立ちが繊細で、大きな目、小さな鼻、長い髪が自然に揺れている。白いワンピースを着て、甘い笑みを浮かべている。ショットはミディアムクローズアップで、柔らかく自然な光、浅い被写界深度、映画的な画質、清々しく美しさを重視したスタイル。人物の表情は自然で、動きは滑らか、画質は高解像度でリアル。

一回や二回見るのはプロンプト最適化だが、何千回、何万回とこれと同じように補完し続ければ、それはもはや生産ラインだ。

したがって、世超がプロンプトを修正し、外見にいくつかの特徴を追加した後、右下の顔が明らかに異なった。しかし、追加の環境の手がかりがないため、女性は依然として林荫道の上にまたがっている。

しかし、整った顔立ちにも多くの種類があり、世界には美女がたくさんいるのに、なぜAIが認めるのはこの1人だけなのですか？

これが第二の理由です。画像や動画モデルは本来、審美の偏見を持っています。

昨年、『Nature』に掲載された論文は、この問題を明確に議論した。研究では、特定の人種を指定すると、モデルが生成する顔がすべて兄弟のように似ていることが明らかになった。

このような審美の偏りは、最初はデータから生じます。例えば、大半の人がインフルエンサーのような顔を好むため、それらは自然と「美女」とラベル付けされます。モデルは何も理解しておらず、今後「美女」というプロンプトが与えられれば、この方向に近づければよいだけです。

モデルの訓練プロセスでは、この偏見がさらに拡大され、同じ特徴のプロンプトで生成される顔が次第に似ていくようになります。

また、ビデオモデルは前后の一貫性を重視するため、審美の同質化をさらに悪化させる可能性があります。

結局、ビデオモデルが生成する顔は、美しくだけでなく、安定していなければならず、数十フレーム、数百フレームにわたり、前後左右すべて同じ人物のように見せなければなりません。

したがって、モデルは一貫性を保ちやすい顔、つまり顔の構造が対称的で、輪郭が標準的で、特徴が極端ではなく、表情が制御しやすく、首を動かしても崩れにくい顔を自然と好む傾向があります。

結局、プラットフォームは安全で美しいものを好み、ユーザーは短編ドラマのインフルエンサーを好み、モデルは安定した標準的なものを好む。この三者が合致した結果、誰もが見飽きた顔が生まれた。

正直に言うと、最近広く拡散されているそれだけではなく、ほぼすべてのAI生成の完璧な美女は、世超はあまり好きではない。

出典：小紅書 @Alexander

AIの顔を私たちのフィードに導入することは、意図せず大規模なサイバー異化実験を促した。

無数のインフルエンサーデータの洗浄と蒸留によって生み出された、現実に対応する顔を持たない存在。

そして、それらが私たちがスマホを操作する時間を奪い、かつての多様なリアルな美女たちを置き換えるとき、世超は非常に苦痛を感じる。なぜなら、私たちが世界を認識し、審美を定義する方法がAIによって圧迫されているからだ。

そのため、人々がAIの顔を嫌うのは、一方では不自然さによる不気味な谷効果ですが、他には均質化への本能的な抵抗もあるのです。

誰かが、AI動画は今後、より鮮明になり、より詳細になり、より本物のように見えるようになり、誰も真偽を見分けられなくなったとき、人々は好きになるだろうと言っている。

しかし世超は、技術が真偽を区別できなくなっても、魂のない完璧な偽の顔には恋することはないと思う。

画像、出典：

《AI生成の顔が性別ステレオタイプと人種的均質化に影響を与える》N AlDahoul

小紅書、抖音