Miles de personas en todo el mundo venden sus datos personales para el entrenamiento de IA a pesar de los riesgos para la privacidad

iconTechFlow
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Las noticias globales sobre IA y cripto muestran a miles vendiendo sus datos personales—voces, rostros y chats privados—por un pago mínimo. Estos contribuyentes, desde Sudáfrica hasta la India y EE.UU., alimentan plataformas como Kled AI y Neon Mobile. Los plazos a menudo permiten a las empresas usar los datos para siempre, lo que plantea preocupaciones sobre la privacidad. Los datos de inflación y la demanda del mercado impulsan esta tendencia, ya que los modelos de IA requieren grandes conjuntos de datos. Los riesgos incluyen deepfakes y robo de identidad, con poco control para los usuarios.

Autor: The Guardian

Compilado por Deep潮 TechFlow

Guía de Shenchao: Este informe de investigación revela una industria gris en rápido crecimiento: miles de personas en todo el mundo ganan dinero por la capacitación de IA vendiendo sus voces, rostros, registros de llamadas y videos diarios.

Esto no es una discusión general sobre privacidad, sino una investigación con personas reales, cantidades reales y consecuencias reales: un actor que vendió su rostro y luego lo vio en Instagram promocionando un producto médico desconocido, con comentarios en la sección de comentarios evaluando su "apariencia".

Cuando la sed de datos de las empresas de IA se combina con la brecha económica global, se está generando una transacción desigual.

El texto completo es:

Un mañana del año pasado, Jacobus Louw, que vive en Ciudad del Cabo, Sudáfrica, salió a caminar como de costumbre y alimentó a las gaviotas. Pero esta vez grabó varios videos: capturó sus pasos y su visión mientras caminaba por la acera. Este video le generó 14 dólares, aproximadamente 10 veces el salario mínimo del país y equivalente a la mitad de los gastos alimenticios semanales de este joven de 27 años.

Este es un tarea de "navegación urbana" completada por Louw en Kled AI. Kled AI es una aplicación que paga a los usuarios por subir datos como fotos y videos para entrenar modelos de IA. En solo unas semanas, Louw ganó 50 dólares al subir fotos y videos de su vida diaria.

A miles de distancia, en Ranchi, India, el estudiante de 22 años Sahil Tigga gana dinero regularmente con Silencio, una aplicación que recopila datos de audio mediante inteligencia colectiva para entrenar IA, la cual accede al micrófono de su teléfono para capturar ruidos ambientales, como los de un restaurante o una intersección concurrida. También sube grabaciones de su propia voz. Sahil viaja deliberadamente a escenarios únicos, como el vestíbulo de un hotel que aún no está registrado en el mapa de Silencio. Con esto, gana más de 100 dólares al mes, suficiente para cubrir todos sus gastos alimenticios.

En Chicago, Ramelio Hill, un aprendiz de soldadura de 18 años, ganó cientos de dólares vendiendo sus registros privados de chat de teléfonos móviles con amigos y familiares a Neon Mobile, una plataforma de entrenamiento de IA conversacional que paga 0.50 dólares por minuto. Para Hill, el cálculo era sencillo: creía que las empresas tecnológicas ya tenían una gran cantidad de sus datos personales, así que prefería obtener su parte.

Estos "trabajos de entrenamiento de IA"—cargar escenas circundantes, fotos propias, videos y audio—se encuentran en la vanguardia de una nueva fiebre global de datos. A medida que la codicia de Silicon Valley por datos humanos de alta calidad supera lo que se puede extraer de internet abierto, ha surgido una industria de mercado de datos en auge para llenar este vacío. Desde Ciudad del Cabo hasta Chicago, miles de personas están otorgando microautorizaciones de su identidad biométrica y datos privados a la próxima generación de IA.

Pero esta nueva economía de trabajos temporales tiene un costo. Detrás de unos pocos dólares, estos entrenadores están alimentando una industria que podría terminar haciendo obsoletas sus propias habilidades, al mismo tiempo que se exponen a riesgos futuros como deepfakes, robo de identidad y explotación digital, de los cuales apenas están comenzando a tomar conciencia.

Mantén los engranajes de IA en movimiento

Los modelos de lenguaje de IA como ChatGPT y Gemini requieren enormes cantidades de materiales de aprendizaje para mejorar continuamente, pero ahora enfrentan una escasez de datos. Las fuentes de datos de entrenamiento más utilizadas —C4, RefinedWeb y Dolma— representan una cuarta parte de los conjuntos de datos de mayor calidad en la web, y actualmente están restringiendo el uso de sus datos por parte de empresas de IA generativa para entrenar modelos. Los investigadores estiman que las empresas de IA agotarán los textos frescos y de alta calidad disponibles más rápido en 2026. Aunque algunos laboratorios ya han comenzado a entrenar modelos con datos sintéticos generados por la propia IA, este proceso recursivo lleva a que los modelos produzcan "basura" llena de errores, lo que puede provocar colapsos.

imagen

Aplicaciones como Kled AI y Silencio son exactamente las que aparecen aquí. En estos mercados de datos, millones de personas están alimentando y entrenando IA vendiendo sus propios datos de identidad. Además de Kled AI, Silencio y Neon Mobile, los entrenadores de IA tienen muchas otras opciones: Luel AI, respaldada por el famoso acelerador Y-Combinator, que obtiene contenido de conversaciones multilingües a una tarifa base de aproximadamente 0.15 dólares por minuto; ElevenLabs te permite crear una clonación digital de tu voz y ofrecerla a otros a una tarifa base de 0.02 dólares por minuto.

El profesor de economía de la Universidad de Londres, Bouke Klein Teeselink, afirmó que los trabajos por encargo para el entrenamiento de IA son una nueva categoría laboral que crecerá significativamente.

Según Teeselink, las empresas de IA saben que pagar a las personas por la autorización de sus datos ayuda a evitar disputas de derechos de autor que podrían surgir al depender completamente del raspado de contenido web. El investigador de IA Veniamin Veselovsky señaló que estas empresas también necesitan datos de alta calidad para modelar nuevos comportamientos mejorados en sus sistemas. "Por ahora, los datos humanos son la norma dorada para muestrear fuera de la distribución del modelo", añadió Veselovsky.

Las personas que impulsan estas máquinas, especialmente en países en desarrollo, a menudo necesitan este dinero y casi no tienen alternativas. Para muchos trabajadores ocasionales de entrenamiento de IA, realizar este trabajo es una respuesta práctica a la brecha económica. En países con altas tasas de desempleo y monedas locales en depreciación, ganar dólares suele ser más estable y rentable que trabajar localmente. Algunas personas no pueden encontrar trabajos de entrada y, por necesidad de supervivencia, se dedican al entrenamiento de IA. Incluso en países más ricos, el aumento del costo de vida hace que vender uno mismo sea una elección financiera lógica.

El entrenador de IA de Ciudad del Cabo, Louw, conoce bien el costo de privacidad involucrado. A pesar de que sus ingresos son inestables y no cubren todos sus gastos mensuales, está dispuesto a aceptar estas condiciones para ganar dinero. Durante años ha sufrido una enfermedad neurológica que le impidió encontrar trabajo, pero el dinero que ha ganado en el mercado de datos de IA (incluyendo Kled AI) le ha permitido ahorrar 500 dólares para inscribirse en un curso de formación en spa y convertirse en masajista.

“Como sudafricano, recibir dólares vale más de lo que la gente imagina,” dijo Louw.

Mark Graham, profesor de geografía digital de la Universidad de Oxford y autor del libro "Feeding the Machine", reconoce que, para individuos en países en desarrollo, este dinero puede tener un significado práctico a corto plazo, pero advierte que "estructuralmente, este trabajo es inestable, carece de oportunidades de crecimiento y es, de hecho, un callejón sin salida".

Graham agregó que el mercado de datos de IA depende de "la competencia por la reducción de salarios" y "de la demanda temporal de datos humanos". Una vez que esta demanda se desplace, "los trabajadores no tendrán ninguna protección, ninguna habilidad transferible ni red de seguridad".

Graham indicó que los únicos ganadores son "las plataformas del hemisferio norte, que se apoderaron de todo el valor duradero".

imagen

Autorización total

Hill, un entrenador de IA de Chicago, se siente ambivalente sobre vender sus llamadas telefónicas privadas a Neon Mobile. Las 11 horas de conversaciones le generaron 200 dólares, pero dice que la aplicación frecuentemente se cae y retrasa los pagos. "Neon siempre me ha parecido sospechoso, pero seguí usándola solo para ganar algo de dinero extra y pagar mis facturas", dijo Hill.

Ahora comienza a cuestionarse si ese dinero realmente fue tan fácil de obtener. En septiembre del año pasado, Neon Mobile se desconectó apenas unas semanas después de su lanzamiento, tras que TechCrunch descubriera una vulnerabilidad de seguridad que permitía a cualquiera acceder a los números de teléfono, grabaciones de llamadas y transcripciones de los usuarios. Hill dice que Neon Mobile nunca lo informó sobre este incidente, y ahora teme que su voz sea mal utilizada en línea.

Jennifer King, investigadora de privacidad de datos en el Instituto de Inteligencia Artificial Centrada en el Ser Humano de la Universidad de Stanford, está preocupada porque el mercado de datos de IA no es claro sobre cómo y dónde se utilizarán los datos de los usuarios. Ella agregó que, sin comprender sus derechos ni poder negociar al respecto, "los consumidores corren el riesgo de que sus datos sean reutilizados de maneras que no les gustan, no entienden o no esperaban, y en ese momento tendrán casi ninguna vía de recurso".

Cuando los entrenadores de IA comparten datos en Neon Mobile y Kled AI, otorgan una autorización completa (global, exclusiva, irrevocable, transferible y libre de regalías) que permite a la plataforma vender, utilizar, exhibir públicamente y almacenar su imagen, e incluso crear obras derivadas a partir de ella.

El fundador de Kled AI, Avi Patel, dijo que el protocolo de datos de su empresa se limitará a fines de entrenamiento e investigación de IA. "Todo el modelo de negocio depende de la confianza del usuario. Si los contribuyentes creen que sus datos podrían ser mal utilizados, la plataforma no podría funcionar." Indicó que la empresa revisará a los compradores antes de vender conjuntos de datos, evitando colaborar con instituciones de "intención sospechosa", como la industria del contenido pornográfico, y con "agencias gubernamentales" que puedan utilizar los datos de manera que violen dicha confianza.

Neon Mobile no respondió a la solicitud de comentario.

El profesor de derecho de la Universidad de St George de Londres, Enrico Bonadio, señaló que estos términos del acuerdo permiten a la plataforma y sus clientes "hacer casi cualquier cosa con este material, de forma permanente, sin pagos adicionales, y los contribuyentes no tienen forma real de retirar su consentimiento o renegociar".

Los riesgos aún más preocupantes incluyen que los datos de los entrenadores se utilicen para crear deepfakes y suplantaciones de identidad. Aunque los mercados de datos afirman eliminar la información de identificación personal (como nombres y ubicaciones) antes de la venta, Bonadio añade que los patrones biométricos son inherentemente difíciles de anonimizar de manera significativa.

Arrepentimiento del vendedor

Incluso si los entrenadores de IA pueden negociar cláusulas de protección más detalladas sobre el uso de los datos, aún podrían arrepentirse. En 2024, el actor de Nueva York Adam Coy vendió su imagen por 1.000 dólares a Captions, un software de edición de video con IA que ahora se llama Mirage. Su acuerdo establecía que su identidad no se usaría para fines políticos, ni para promocionar alcohol, tabaco o contenido pornográfico, y que la autorización tenía una duración de un año.

No respondió a la solicitud de comentario.

Poco después, los amigos de Adam comenzaron a compartir videos que encontraron en línea, en los que se utilizaba su rostro y voz, acumulando millones de reproducciones. En uno de los videos de Instagram, la copia de IA de Adam se presentaba como "médico vaginal" y promocionaba suplementos médicos no verificados para mujeres embarazadas y posparto.

“Explicarle esto a alguien me hace sentir vergüenza,” dijo Coy.

“El comentario es extraño, porque están evaluando mi apariencia, pero eso no es en absoluto yo,” añadió Coy. “Cuando tomé la decisión (de vender mi imagen), pensé que la mayoría de los modelos de todos modos recopilarían datos e imágenes en línea, así que mejor que me paguen.”

Coy dijo que no ha aceptado ningún otro trabajo temporal de datos de IA desde entonces. Dijo que solo consideraría hacerlo nuevamente si alguna empresa le ofreciera una compensación significativa.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.