Rostos gerados por IA inundam vídeos curtos, provocando reação negativa do público

O "rosto padrão" gerado por modelos de vídeo de IA está invadindo os feeds dos usuários. Esse rosto de traços refinados e pele clara aparece em dramas universitários, dramas históricos e até em personagens com troca de gênero, provocando forte reação negativa dos internautas. Testes revelaram que diversos modelos de vídeo principais geram o mesmo rosto ao usar as mesmas palavras-chave, devido ao fato de as plataformas terem ativado por padrão o reforço de prompts, somado a vieses estéticos presentes nos próprios dados de treinamento dos modelos. Para manter a consistência facial ao longo do tempo, os modelos naturalmente preferem rostos simétricos e com contornos convencionais. A combinação das necessidades das plataformas, dos usuários e dos modelos levou os conteúdos gerados por IA a cair em uma crise de homogeneização estética. Pesquisadores alertam que esse fenômeno pode reforçar estereótipos sociais sobre beleza.

Autor e fonte do artigo: Chaping X.PIN

Precisa de verdadeiras belas para tirar fotos e limpar os olhos.

Amigos que assistem frequentemente a dramas curtos e vídeos curtos, provavelmente reconhecem este rosto.

Quem não viu pode achar que é alguma nova influenciadora, mas na verdade, é um rosto gerado por IA que tem aparecido repetidamente em vários vídeos recentemente.

Rosto com traços delicados, olhos grandes o suficiente, nariz pequeno o suficiente, pele sempre branca, sempre com filtro de luz suave, e um sorriso com o arco perfeito.

Se alguém real estivesse diante dele, Shi Chao provavelmente nem ousaria dizer uma palavra. Mas justamente esse rosto que parece inofensivo foi violentamente “assediado online”.

Não é porque ela seja feia, mas porque ela aparece em tudo, como se fosse uma favorita da indústria de IA com patrocínio.

A luz branca do campus era ela, e a filha do lar nas novelas históricas ainda era ela.

A menina de cinco ou seis anos é ela, a idosa de setenta ou oitenta anos ainda é ela.

Olhando melhor, uau, como o homem com o lenço na cabeça ainda é ela???

Ver todos os dias a mesma cara ao abrir o celular, assistir vídeos curtos e acabar sentindo medo de estar cercado por falsos humanos.

E à medida que mais pessoas descobrem, há uma enxurrada de reclamações de internautas por toda parte:

Esse rosto, eu já fiquei cansado de ver.

Ver esse rosto agora causa aversão fisiológica.

Quantas pessoas se sentem desconfortáveis ao vê-la?

Alguns também se perguntam: por que todos os rostos gerados pela IA são iguais? De quem ela copiou o rosto?

Na seção de comentários, há quem adivinhe que é uma streamer já banida, quem diga que lembra o ator Li Chuan, e quem ache que parece a irmã de Park Chan-yeol... Não se pode negar, tanto no interior quanto no exterior, homens e mulheres parecem ter alguma semelhança.

Mas o problema é que ficar adivinhando não traz nenhuma certeza. Porque, em vez de um rosto específico ter sido roubado, é mais provável que se trate de uma “face padrão média” criada repetidamente pela linha de produção de IA, uma face que não existe realmente.

Como essa cara foi criada, afinal?

Shichao, desafiando a superstição, testou um por um os principais modelos de vídeo, como Seedance, KeLing, HaiLuo e HappyHorse, e durante os experimentos, realmente descobriu um padrão.

Damos a todos os modelos duas oportunidades, com o mesmo prompt “menina andando de bicicleta”; teoricamente, os rostos gerados a cada vez devem ser diferentes, às vezes mostrando pessoas asiáticas, outras vezes pessoas estrangeiras — esse é o comportamento natural dos grandes modelos.

Como apenas definimos o gênero, sem nenhuma outra indicação, ele deve gerar aleatoriamente pessoas de qualquer nacionalidade, qualquer cor de pele, qualquer estilo de cabelo e vestuário, etc., completamente diferentes.

Na verdade, com o mesmo prompt, quase todos os modelos geram exatamente o mesmo rosto, vestuário, ambiente de fundo e ângulo da foto.

Aqui no Seedance 2.0 Fast, Shi Chao encontrou exatamente o mesmo rosto de IA do início, parecendo que esta é a fonte de todo o mal.

Se apenas um modelo errar, talvez seja um problema dele. Mas se todos os modelos perderem a diversidade ao mesmo tempo... Shi Chao pesquisou e descobriu que pode haver duas camadas de razões para isso.

Na primeira camada, os usuários comuns de modelos de vídeo devem saber que os modelos de vídeo são muito sensíveis aos prompts. Às vezes, uma única palavra ou a ordem de algumas palavras pode afetar o resultado final gerado.

Para que todos possam obter recompensas de forma tão estável quanto possível em cada giro, nossas instruções são frequentemente otimizadas novamente no backend após a geração.

Antes, o “refinamento de prompts” era apresentado como um botão separado ao lado, permitindo que os usuários escolhessem entre ativar o recurso ou usar o prompt original diretamente. No entanto, após pesquisar várias plataformas, parece que isso agora é raro — o aprimoramento de prompts tornou-se o padrão.

Por exemplo, se eu digitar “Uma garota está andando de bicicleta e rindo enquanto pedala”, o prompt otimizado e realmente fornecido ao modelo pode se tornar:

Uma jovem e bonita garota asiática pedalando em uma avenida arborizada sob o sol. Sua pele é clara, com traços finos, olhos grandes, nariz pequeno e cabelos longos movendo-se naturalmente, vestindo um vestido branco e sorrindo com doçura. Enquadramento médio-close, luz suave e natural, profundidade de campo rasa, estilo cinematográfico, estética limpa e bela, expressão facial natural, movimentos fluidos, imagem em alta definição e realista.

Ver uma ou duas vezes é chamado de otimização de prompts; fazer isso milhares de vezes não vira uma linha de produção?

Então, após Shi Chao modificar o prompt e adicionar algumas descrições de características físicas, o rosto no canto inferior direito ficou claramente diferente. Mas, sem pistas ambientais adicionais, a garota continua montada na avenida arborizada.

No entanto, há muitos tipos de traços faciais delicados; com tantas mulheres bonitas no mundo, por que a IA reconhece apenas esta?

Essa é a segunda razão: modelos de imagem e vídeo têm viés estético por natureza.

Um artigo publicado no ano passado na revista Nature discutiu claramente essa questão. Eles descobriram em seu estudo que, se você especificar uma raça, os rostos gerados pelo modelo parecem todos irmãos.

Esse viés estético originalmente vem dos dados; por exemplo, a maioria das pessoas gosta de rostos de influenciadoras, que naturalmente são rotulados como bonitas. O modelo não entende nada — basta, a partir de agora, ao solicitar "mulher bonita", direcionar para essa direção.

Durante o treinamento, o modelo amplifica ainda mais esse viés, fazendo com que os rostos gerados por prompts de características idênticas se tornem cada vez mais parecidos.

Além disso, os modelos de vídeo, para garantir consistência entre cenas, podem acentuar ainda mais a homogeneização estética.

Após tudo, os rostos gerados por modelos de vídeo não só precisam ser bonitos, mas também estáveis, garantindo que, em dezenas ou centenas de quadros, sejam consistentes em todos os ângulos.

Então, o modelo também tenderá naturalmente a preferir rostos que são mais fáceis de manter consistentes: com traços simétricos, contornos padrão, características não extremas, expressões fáceis de controlar e que não se distorcem facilmente ao girar a cabeça.

Em resumo, a plataforma gosta de algo seguro e agradável, os usuários gostam de influenciadores de séries curtas, e o modelo prefere estabilidade e padronização; juntando os três lados, surgiu o rosto que todos já viram demais.

Na verdade, não é apenas a imagem recentemente muito compartilhada; a maioria das mulheres perfeitas geradas por IA não agrada muito ao Shichao.

Fonte: Xiaohongshu @Alexander

Inserir rostos de IA em nosso feed foi uma experiência acidental de grande escala de cibernetização.

Um rosto sem referência real, nascido sob a lavagem e destilação de inúmeros dados de influenciadores.

Quando elas substituem o tempo que gastamos rolando os celulares e substituem as diversas mulheres reais que antes tínhamos, Shi Chao sente-se muito mal, pois nossa percepção do mundo e nossa definição de beleza estão sendo oprimidas pela IA.

Então, as pessoas rejeitam rostos de IA, em parte talvez por causa do efeito de vale sombrio causado por essa falta de realismo, mas também por uma reação instintiva à homogeneização.

Alguns dizem que os vídeos de IA ficarão cada vez mais nítidos, detalhados e parecidos com seres humanos, e que, quando as pessoas não conseguirem mais distinguir entre o verdadeiro e o falso, passarão a gostar.

Mas Shi Chao acha que, mesmo que a tecnologia consiga tornar verdadeiro e falso indistinguíveis, não conseguiremos nos apaixonar por um rosto perfeitamente falso, sem alma.

Imagem, fonte:

Rostos gerados por IA influenciam estereótipos de gênero e homogeneização racial N AlDahoul

Xiaohongshu, Douyin