Dünya çapında binlerce kişi, gizlilik riskleri karşısında kişisel verilerini AI eğitimi için satıyor

Yazar: The Guardian

Derin Akış TechFlow

Shenchao Öne Çıkarma: Bu araştırmacı rapor, binlerce kişinin seslerini, yüzlerini,通话 kayıtlarını ve günlük videolarını satarak AI eğitimi için gelir elde ettiğini ortaya koyuyor.

Bu, gizlilik tartışmasının genel bir tartışması değil; gerçek bir aktörün yüzünü sattığı, daha sonra Instagram'da kendi yüzünün bilinmeyen bir tıbbi ürün için reklam yaptığını gördüğünü ve yorumlarda kendi "dış görünümü" hakkında değerlendirme yapıldığını gösteren bir araştırmadır.

Yapay zeka şirketlerinin veri açlığı ile küresel ekonomik farklar bir araya geldiğinde, eşitsiz bir alışveriş oluşturuluyor.

Tam metin şu şekildedir:

Geçen yıl, Güney Afrika'nın Kap Town'unda yaşayan Jacobus Louw, sıradan bir sabah yürüyüşe çıkıp martıları beslemeye başladı. Ancak bu sefer birkaç video kaydetti—yürüdüğü kaldırımın ve görüş alanının görüntülerini. Bu video, ona 14 dolar kazandırdı; bu miktar, ülkenin en düşük maaşının yaklaşık 10 katıydı ve 27 yaşındaki genç adamın bir haftanın yarısına denk gelen gıda giderleriydi.

Bu, Louw'un Kled AI üzerinde tamamladığı bir "şehir navigasyonu" görevidir. Kled AI, kullanıcıların fotoğraflar, videolar vb. verileri AI modeli eğitimi için yüklemesi için ödeme yapan bir uygulamadır. Kısa bir sürede, Louw günlük yaşamından fotoğraflar ve videolar yükleyerek 50 dolar kazandı.

Binlerce mil uzakta, Hindistan'ın Ranchi şehrinde, 22 yaşındaki öğrenci Sahil Tigga, ses verilerini yapay zeka eğitimi için toplayan ve telefonunun mikrofonuna erişerek restoran içi veya kalabalık bir kavşaktaki çevre gürültüsünü toplayan Silencio uygulaması aracılığıyla düzenli gelir elde ediyor. Ayrıca kendi ses kayıtlarını da yüklüyor. Sahil, Silencio haritasında henüz kaydedilmemiş otlar gibi benzersiz sahneler için özel olarak seyahat ediyor. Bu şekilde aylık 100 doların üzerinde gelir elde ediyor ve bu tutar tüm yiyecek giderlerini karşılamaya yeterli.

Şikago'da 18 yaşındaki kaynakçı adayı Ramelio Hill, kendi özel telefon sohbet geçmişlerini, her dakika 0,50 dolar ödenen bir diyaloglu AI eğitimi platformu olan Neon Mobile'a satarak birkaç yüz dolar kazandı. Hill için bu hesap basitti: Teknoloji şirketlerinin zaten büyük miktarda özel verilerini elinde bulundurduğunu düşünüyordu ve kendisi de bundan bir pay almalıydı.

Bu "AI eğitimi için serbest çalışma" — çevresel sahneleri, kendi fotoğraflarını, videolarını ve ses kayıtlarını yüklemek — küresel bir yeni veri altın çığının öncüleri arasında yer alıyor. Silicon Valley'nin açık internetten elde edilebilecek sınırların ötesinde kaliteli insan verilerine olan ihtiyacı, bu boşluğu dolduran canlı bir veri pazarı endüstrisini doğurdu. Kap Town'dan Chicago'ya binlerce kişi, biyometrik kimliklerini ve özel verilerini sonraki nesil AI'lara mikro izin veriyor.

Ancak bu yeni sıfır maliyetli ekonomi bir maliyetle gelmektedir. Birkaç dolarla kazanılan bu para arkasında, bu eğitimciler kendi becerilerini eski hale getirebilecek bir endüstriye güç veriyor ve derin sahtekârlık, kimlik hırsızlığı ve dijital istismarın gelecekteki risklerine maruz kalıyor—ki bunlar hakkında henüz yeni yeni farkındalığa sahip olmaya başlıyorlar.

AI dişlileri dönmeye devam ediyor

ChatGPT ve Gemini gibi AI dil modelleri, sürekli geliştirilmek için büyük miktarda eğitim materyaline ihtiyaç duyar, ancak veri yetersizliğiyle karşı karşıya kalmaktadırlar. En sık kullanılan eğitim veri kaynakları olan C4, RefinedWeb ve Dolma, ağın en kaliteli veri kümelerinin dörtte birini oluşturmakta olup, şimdi üretken AI şirketlerinin bu verileri model eğitimi için kullanmasını kısıtlamaktadır. Araştırmacılar, AI şirketlerinin en erken 2026 yılında mevcut yeni ve kaliteli metinleri tüketeceğini tahmin etmektedir. Bazı laboratuvarlar, AI'nın kendi ürettiği sentetik verilerle geri besleme yaparak eğitimi başlatmış olsa da, bu rekürsif süreç modellerin hatalarla dolu "çöp" çıktılar üretmesine ve bu da çöküşlere neden olmaktadır.

resim

Kled AI ve Silencio gibi uygulamalar tam olarak burada ortaya çıkıyor. Bu veri pazarlarında milyonlarca kişi, kimlik verilerini satarak AI'ları besliyor ve eğitiyor. Kled AI, Silencio ve Neon Mobile'nın yanı sıra AI eğiticileri için birçok başka seçenek var: ünlü inkübatör Y-Combinator tarafından desteklenen Luel AI, dakikada yaklaşık 0,15 dolarla çok dilli diyalog malzemeleri sağlıyor; ElevenLabs, sesinizin dijital bir klonunu oluşturmanıza ve başkalarının dakikada 0,02 dolarlık temel ücretle kullanmasına izin veriyor.

Londra Kraliyet Koleji Ekonomi Profesörü Bouke Klein Teeselink, AI eğitimi için geçici işlerin ortaya çıkan bir iş kategorisi olduğunu ve büyük ölçüde artacağını belirtti.

Teeselink, AI şirketlerinin, tamamen ağ tarama yoluyla içerik elde etmenin yol açabileceği telif hakkı anlaşmazlıklarından kaçınmak için insanlara veri izni ücreti ödemeyi bilerek yaptığını söylüyor. AI araştırmacısı Veniamin Veselovsky, bu şirketlerin sistemlere yeni, geliştirilmiş davranışlar modellemek için yüksek kaliteli verilere ihtiyaç duyduğunu belirtiyor. “Şu anda, insan verileri model dağılımının dışından örneklenen altın standarttır,” diye ekliyor Veselovsky.

Bu makineleri çalıştıran insanlar—özellikle gelişmekte olan ülkelerdeki insanlar—genellikle bu paraya ihtiyaç duyar ve neredeyse başka seçeneği yoktur. birçok AI eğitimi için geçici iş yapan kişi için, bu iş ekonomik farkların pratik bir yanıtıdır. Yüksek işsizlik oranına ve yerel para biriminin değer kaybına sahip ülkelerde, dolar kazanmak yerel işlerden daha kararlı ve daha karlıdır. Bazıları giriş seviyesinde iş bulamaz ve geçimini sağlamak için AI eğitimi yapmak zorunda kalır. Daha zengin ülkelerde bile, yaşam maliyetlerindeki artış, kendinizi satmanın mantıklı bir finansal seçim haline gelmesine neden olmaktadır.

Kapstadt'lı AI eğitmeni Louw, bu durumun gizlilik maliyetini iyi biliyor. Geliri istikrarsız olup tüm aylık giderlerini karşılamıyor olsa da, para kazanmak için bu koşulları kabul etmeye razı. Yıllarca nörolojik bir hastalıktan muzdarip olup iş bulamayan Louw, AI veri pazarlarında (Kled AI dahil) kazandığı para ile 500 dolar biriktirerek bir spa eğitimi alıp masörycü oldu.

"Güney Afrikalı olarak, dolar almak başkalarının düşündüğünden daha değerli," diye konuştu Louw.

Oxford Üniversitesi İnternet Coğrafyası Profesörü ve "Makineleri Beslemek" kitabının yazarı Mark Graham, gelişmekte olan ülkelerdeki bireyler için bu paranın kısa vadeli olarak pratik bir anlamı olabileceğini kabul ediyor, ancak "yapısal olarak bu işin istikrarsız, ilerleme imkanı olmayan ve aslında bir çıkmaz" olduğunu uyarıyor.

Graham, AI veri pazarlarının "ücretlerin rekabetçi düşüşüne" ve "insan verilerine geçici bir talebe" bağımlı olduğunu ekledi. Bu talep değiştiğinde, "işçilerin hiçbir güvencesi, aktarılabilir becerisi veya güvenlik ağı olmayacaktır".

Graham, tek kazananın "tüm kalıcı değeri ele geçiren kuzey yarım kürenin platformları" olduğunu söyledi.

resim

Tam yetki

Şikago'dan gelen AI eğitmeni Hill, özel telefon görüşmelerini Neon Mobile'e satmak konusunda karmaşık duygular yaşıyor. Yaklaşık 11 saatlik konuşma içeriğiyle 200 dolar kazandı, ancak uygulamanın sıklıkla çevrimdışı olduğunu ve ödemelerde gecikme yaptığını söylüyor. "Neon, benim için her zaman şüpheli kaldı, ancak faturaları ödemek için biraz ek gelir elde etmek amacıyla kullanmaya devam ettim," diye konuştu Hill.

Şimdi para gerçekten o kadar kolay mı diye yeniden düşünmeye başlıyor. Geçen yıl Eylül'de, Neon Mobile birkaç hafta hizmete girdikten sonra kapatıldı; TechCrunch, herkesin kullanıcıların telefon numaralarını, konuşma kayıtlarını ve metin geçmişlerine erişebileceğini keşfetmişti. Hill, Neon Mobile'nin bu durumu ona hiçbir zaman bildirmediğini söylüyor ve şimdi sesinin internet üzerinde kötüye kullanılmasından korkuyor.

Stanford Üniversitesi İnsan Odaklı Yapay Zeka Enstitüsü veri gizliliği araştırmacısı Jennifer King, AI veri pazarlarının kullanıcı verilerinin nasıl ve nerede kullanılacağını açıkça belirtmediğinden endişeli. Ayrıca, tüketicilerin kendi haklarını bilmeden ve bunlar üzerinde müzakere edemeden, verilerinin "beğenmedikleri, anlayamadıkları veya beklemedikleri şekillerde yeniden kullanılma riskiyle karşı karşıya kaldıklarını ve bu durumda neredeyse hiçbir telafi yolu bulunmadığını" ekliyor.

AI eğiticileri, Neon Mobile ve Kled AI üzerinde veri paylaşırken, kendi görünümlerini satma, kullanma, kamuoyuna gösterme ve saklama hakkını, hatta bunlara dayalı türev eserler oluşturma hakkını veren, küresel, eksiksiz, geri alınamaz, devredilebilir ve royalty ödenmeyen bir tam yetki verir.

Kled AI kurucusu Avi Patel, şirketinin veri protokolünün yalnızca AI eğitimi ve araştırma amaçları için sınırlı olacağını belirtti. "Tüm ticari model, kullanıcı güvenine dayanır. Katkı verenlerin verilerinin kötüye kullanılma olasılığı olduğunu düşünürse, platform işlevini kaybeder." Dediği gibi, şirket, satın alıcıları inceleyerek "şüpheli niyetli" kurumlarla, örneğin pornografi endüstrisiyle ve verileri bu güveni ihlal edecek şekilde kullanabilecekleri düşünülen "hükümet kurumlarıyla" işbirliği yapmamayı önleyecektir.

Neon Mobile, yorum isteği için yanıt vermedi.

Londra Şehir Üniversitesi St. George Hukuk Profesörü Enrico Bonadio, bu anlaşma maddelerinin platformun ve müşterilerinin bu materyal için neredeyse her şeyi yapma, ek ücret ödemeden kalıcı olarak kullanma ve katkıda bulunanların onayı geri çekme veya yeniden müzakere etme gerçek bir yolu olmamasına izin verdiğini belirtti.

Daha endişe verici riskler arasında, eğitmenlerin verilerinin derin sahte ve kimlik hırsızlığı oluşturmak için kullanılması yer alıyor. Bonadio, veri pazarlarının, ad ve konum gibi kimlik belirleyici bilgileri satıştan önce kaldırma iddiasına rağmen, biyometrik kalıpların temel olarak gerçekçi bir anonimleştirme açısından zor olduğunu ekliyor.

Satıcının pişmanlığı

AI eğiticileri, veri kullanımını daha ayrıntılı şekilde koruyan sözleşmeler imzalasa bile, hâlâ pişman olabilirler. 2024 yılında New York'tan aktör Adam Coy, kendi benzerliğini Captions adlı bir AI video düzenleme yazılımına 1000 dolarla sattı; bu yazılım şimdi Mirage olarak adlandırılıyor. Sözleşmesine göre, kimliği siyasi amaçlar için kullanılmayacak, alkollü içkiler, sigara veya pornografik içeriklerin tanıtımı için kullanılmayacak ve yetki süresi bir yıl olarak belirlenmişti.

Başvuruyla ilgili yorum yapmadı.

Yakın bir zamanda, Adam'ın arkadaşları, online'da buldukları ve milyonlarca kez izlenen videoları paylaşmaya başladı; bu videolarda Adam'ın yüzü ve sesi kullanılıyordu. Instagram'daki videolardan birinde, Adam'ın AI kopyası kendisini "vajina doktoru" olarak tanıtıp, hamilelik ve doğum sonrası kadınlar için kanıtlanmamış tıbbi takviyeleri tanıttı.

"Bu konuyu başkalarına açıklamak beni utandırdı," dedi Coy.

“Yorumlar garip, çünkü dış görünümlerimi değerlendiriyorlar ama o ben değil,” diye ekledi Coy. “Resimleri satma kararını verirken, çoğu modelin zaten çevrimiçi olarak veri ve resimleri topladığı için, bunun için para almak daha iyi olur düşündüm.”

Coy, bundan sonra hiçbir AI veri serbest çalışma işini kabul etmedi. Sadece bir şirket önemli bir ücret sunarsa, tekrar yapmayı düşüneceğini söyledi.