Rostros generados por IA inundan videos cortos, generando rechazo público

La "cara estándar" generada por modelos de video de IA está invadiendo los flujos de usuarios. Este rostro de rasgos finos y piel clara aparece en dramas escolares, dramas históricos e incluso en personajes con cambio de género, generando una fuerte reacción negativa de los internautas. Las pruebas revelaron que múltiples modelos de video principales generan exactamente la misma cara al usar las mismas palabras clave, debido a que la plataforma tiene activado por defecto el refuerzo de las palabras clave, sumado a sesgos estéticos inherentes en los datos de entrenamiento del modelo. Para mantener la consistencia facial a lo largo del tiempo, los modelos favorecen naturalmente rostros simétricos y con contornos convencionales. La combinación de las necesidades de la plataforma, los usuarios y el modelo ha llevado a una crisis de homogeneización estética en el contenido generado por IA. Los investigadores advierten que este fenómeno podría reforzar los estereotipos sociales sobre la belleza.

Autor y fuente del artículo:差评X.PIN

Necesitas fotos de verdaderas mujeres para limpiar los ojos.

Amigos que suelen ver dramas cortos y videos cortos, probablemente reconozcan este rostro.

Quienes no lo hayan visto podrían pensar que se trata de una nueva influencer, pero en realidad, se trata de un rostro generado por IA que ha aparecido una y otra vez en diversos videos recientes.

Rostro con rasgos delicados, ojos lo suficientemente grandes, nariz lo suficientemente pequeña, piel siempre blanca, siempre con filtro de luz suave, y una sonrisa con el arco perfecto.

Si la persona real estuviera frente a él, Seguro que Shi Chao ni siquiera se atrevería a decirle una palabra. Pero precisamente esta cara que parece inofensiva fue brutalmente “acosa” en línea.

No es que sea fea, sino que, como una pariente con influencia en la industria de la IA, aparece en todo.

La luna blanca del campus era ella, y la señorita en las series históricas también era ella.

La niña de cinco o seis años es ella, la anciana de setenta o ochenta años también es ella.

Al mirar con más atención, ¿qué? ¿Cómo es que el hombre con el pañuelo en la cabeza sigue siendo ella???

Ver todos los días la misma cara en el teléfono y sentir miedo al estar rodeado de personas falsas mientras se navegan videos cortos.

Y a medida que más personas lo descubren, los internautas están llenando todas partes con quejas:

Esta cara, ya me da náuseas.

Ver esta cara genera aversión fisiológica.

¿Cuántas personas se sienten molestas al verla?

Algunos también se preguntan: ¿por qué la IA genera personas que todas se ven iguales? ¿De quién ha robado el rostro?

En los comentarios hay quienes adivinan que la streamer bloqueada es alguien, quienes dicen que se parece al actor Li Chuan, y otros que dicen que se parece a la hermana de Park Chan-yeol... ¡la verdad es que, tanto en China como en el extranjero, parece que todos los hombres y mujeres pueden tener algo de parecido!

Pero el problema es que adivinar no da una respuesta segura, porque más que una cara específica robada, es probablemente una "cara promedio" que nunca existió, moldeada repetidamente en la línea de producción estética de la IA.

¿De dónde proviene entonces esta cara?

Shi Chao, escéptico, probó uno por uno los modelos de video principales como Seedance, KeLing, Hai Luo y HappyHorse, y durante el proceso de experimentación, realmente descubrió ciertos patrones.

Dimos a todos los modelos dos oportunidades con el mismo prompt de “mujer montando en bicicleta”; teóricamente, cada rostro generado debería ser diferente, e incluso a veces cambiar entre personas asiáticas y extranjeras, y eso es precisamente la naturaleza de los grandes modelos.

Como solo limitamos el género y no proporcionamos ninguna otra indicación, debería generar aleatoriamente personas de cualquier nacionalidad, cualquier tono de piel, cualquier estilo de cabello y vestimenta, etc., completamente distintas.

De hecho, con el mismo prompt, casi todos los modelos generan la misma cara, vestimenta, entorno de fondo y ángulo de fotografía en ambas ocasiones.

Aquí, en Seedance 2.0 Fast, Shi Chao encontró exactamente la misma cara de IA que al principio; parece que esta es la fuente de todos los males.

Si solo un modelo se equivoca, tal vez sea un problema suyo. Pero si todos los modelos pierden la diversidad al mismo tiempo... Shi Chao investigó y descubrió que podrían haber dos razones detrás de esto.

En el primer nivel, los usuarios comunes de modelos de video deberían saber que los modelos de video son muy sensibles a los prompts. A veces, una sola palabra o el orden de unos pocos caracteres puede afectar el resultado final generado.

Para que todos puedan extraer oro de manera lo más estable posible en cada giro, nuestras indicaciones suelen ser optimizadas nuevamente en el backend tras su generación.

Anteriormente, "refinamiento de prompts" se presentaba como un botón independiente al lado, permitiendo a los usuarios activarlo o usar directamente el prompt original. Sin embargo, tras revisar varias plataformas, parece que esto ya es poco común; el refinamiento de prompts se ha convertido en la opción predeterminada.

Por ejemplo, si ingreso "Una chica está montando en bicicleta y riendo mientras lo hace", la prompt optimizada que se entrega al modelo podría convertirse en:

Una joven y hermosa chica asiática monta en bicicleta por un paseo arbolado soleado. Tiene la piel clara, rasgos delicados, ojos grandes, una nariz pequeña y el cabello largo ondeando naturalmente; lleva un vestido blanco y sonríe con dulzura. El encuadre es plano medio-cercano, con luz suave y natural, profundidad de campo reducida, estilo cinematográfico, estilo fresco y hermoso, expresión facial natural y movimientos fluidos, imagen nítida y realista.

Verlo una o dos veces se llama optimización de prompts; hacerlo así miles de veces no es más que convertirlo en una línea de producción.

Entonces, después de que Shi Chao modificó el prompt y añadió algunas descripciones de características físicas, la cara en la esquina inferior derecha se veía claramente diferente. Pero sin indicaciones ambientales adicionales, la chica seguía montando en el paseo arbolado.

Sin embargo, la belleza facial viene en muchas formas; con tantas mujeres hermosas en el mundo, ¿por qué AI solo reconoce a esta?

Esto lleva a la segunda razón: los modelos de imágenes y videos tienen inherentemente sesgos estéticos.

Un artículo publicado el año pasado en Nature discutió claramente este problema. En su estudio, descubrieron que si especificas una raza, los rostros generados por el modelo parecen todos hermanos.

Este sesgo estético surgió inicialmente de los datos; por ejemplo, la mayoría de las personas prefieren caras de influencers, por lo que naturalmente se les etiqueta como hermosas. El modelo no entiende nada; simplemente, cada vez que se solicite "hermosa", se ajustará en esa dirección.

Durante el entrenamiento, el modelo amplifica aún más este sesgo, haciendo que las caras generadas con las mismas palabras clave de características se vuelvan cada vez más parecidas.

Además, los modelos de video, para garantizar la coherencia entre cuadros, podrían intensificar aún más la homogeneización estética.

Después de todo, los rostros generados por modelos de video no solo deben verse bien, sino que también deben ser estables, asegurando que durante decenas o cientos de fotogramas, se vean como la misma persona desde todos los ángulos.

Por lo tanto, el modelo también tenderá naturalmente a preferir rostros que sean más fáciles de mantener coherentes: rasgos simétricos, contornos estándar, características no extremas, expresiones fáciles de controlar y giros de cabeza que no se descompongan fácilmente.

En resumen, la plataforma prefiere lo seguro y atractivo, los usuarios disfrutan de los influencers de series cortas, y el modelo valora la estabilidad y la estandarización; al combinar los tres, nació el rostro que todos terminan cansados de ver.

Honestamente, no solo la imagen recientemente viral, sino casi todas las mujeres perfectas generadas por IA, no le gustan mucho a Shichao.

Fuente: Xiaohongshu @Alexander

Incorporar rostros de IA en nuestro flujo de información ha sido una experiencia no intencionada de una gran experimentación cibernética de alienación.

Un rostro sin referencia real, nacido tras la lavada y destilación de innumerables datos de influencers.

Cuando reemplazan el tiempo que dedicamos a revisar nuestros teléfonos y sustituyen a las diversas mujeres reales, Shi Chao se siente profundamente incómodo, porque nuestra percepción del mundo y nuestra definición de la estética están siendo oprimidas por la IA.

Entonces, la aversión de la gente hacia los rostros de IA, por un lado, quizás se deba al efecto de la valle inquietante causado por su falta de realismo, pero también hay un rechazo instintivo hacia la homogeneización.

Algunos dicen que los videos de IA deberían volverse cada vez más nítidos, más detallados y más parecidos a personas reales, y que cuando nadie pueda distinguir la diferencia entre lo real y lo falso, la gente los disfrutará.

Pero Shi Chao cree que, aunque la tecnología pueda lograr que lo falso sea indistinguible de lo verdadero, no podemos enamorarnos de una cara perfecta y falsa sin alma.

Imágenes, fuentes:

《Los rostros generados por IA influyen en los estereotipos de género y la homogeneización racial》 N AlDahoul

Xiaohongshu, Douyin