Ribuan global menjual data peribadi untuk latihan AI di tengah risiko privasi

iconTechFlow
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita AI + kripto global menunjukkan ribuan orang menjual data peribadi—suara, wajah, dan perbualan peribadi—dengan bayaran yang minimum. Penyumbang-penyumbang ini, dari Afrika Selatan hingga India dan AS, memacu platform seperti Kled AI dan Neon Mobile. Tempoh sering membenarkan syarikat menggunakan data selama-lamanya, menimbulkan kebimbangan privasi. Data inflasi dan permintaan pasaran mendorong tren ini, kerana model AI memerlukan set data yang besar. Risikonya termasuk deepfake dan pencurian identiti, dengan sedikit kawalan untuk pengguna.

Penulis: The Guardian

Diterjemahkan oleh Deep潮 TechFlow

Pengenalan Shenchao: Laporan penyelidikan ini mengungkap satu industri gelap yang sedang tumbuh pesat: ribuan orang di seluruh dunia memperoleh bayaran untuk latihan AI dengan menjual suara, wajah, rekod panggilan, dan video harian mereka.

Ini bukan perbincangan umum mengenai isu privasi, tetapi satu penyiasatan yang melibatkan individu sebenar, jumlah wang sebenar, dan kesan sebenar—seorang pelakon yang menjual wajahnya, kemudian melihat "dirinya" sendiri di Instagram mengiklankan produk perubatan yang tidak dikenali, dengan komen dari orang-orang yang menilai "penampilannya".

Apabila kehausan data oleh syarikat AI digabungkan dengan jurang ekonomi global, ia sedang mencipta satu transaksi yang tidak seimbang.

Seluruh teks adalah seperti berikut:

Pada suatu pagi tahun lalu, Jacobus Louw yang tinggal di Cape Town, Afrika Selatan, keluar berjalan-jalan seperti biasa dan memberi makan burung camar di sepanjang jalan. Tetapi kali ini, dia merekam beberapa video—memperlihatkan langkah-langkahnya di trotoar dan pemandangan di sekitarnya. Video ini membawanya mendapat 14 dolar AS, sekitar 10 kali gaji minimum negara itu, atau setara dengan separuh perbelanjaan makanan seorang pemuda berusia 27 tahun tersebut.

Ini adalah tugas "Navigasi Bandar" yang diselesaikan oleh Louw di Kled AI. Kled AI ialah aplikasi yang membayar pengguna untuk menghantar data seperti gambar dan video untuk melatih model AI. Dalam beberapa minggu sahaja, Louw memperoleh 50 dolar AS dengan menghantar gambar dan video kehidupan harian.

Ribuan batu jauhnya, di Ranchi, India, pelajar berusia 22 tahun, Sahil Tigga, secara berkala menghasilkan pendapatan daripada Silencio—aplikasi yang menghimpunkan data audio secara beramai-ramai untuk latihan AI, yang mengakses mikrofon telefonnya untuk merekam bunyi persekitaran seperti di dalam restoran atau persimpangan sibuk. Dia juga menghantar rakaman suaranya sendiri. Sahil sengaja pergi ke lokasi unik, seperti lobi hotel yang belum direkodkan di peta Silencio. Dengan ini, dia menghasilkan lebih daripada $100 sebulan, cukup untuk menutup semua perbelanjaan makanannya.

Di Chicago, seorang pelajar las berusia 18 tahun, Ramelio Hill, memperoleh beberapa ratus dolar dengan menjual catatan perbualan telefon peribadinya dengan rakan dan keluarga kepada Neon Mobile—sebuah platform latihan AI perbualan yang membayar 0.50 dolar setiap minit. Bagi Hill, perkara ini mudah: beliau percaya syarikat teknologi sudah pun menguasai sejumlah besar data peribadinya, jadi lebih baik beliau turut mendapat keuntungan daripadanya.

"Kerja sambilan latihan AI" ini—menghantar gambar, video, dan audio adegan sekeliling serta diri sendiri—berada di garis depan gelombang penambangan data baru secara global. Seiring keperluan Silicon Valley terhadap data manusia berkualiti tinggi melebihi apa yang boleh dikumpulkan daripada internet terbuka, sebuah industri pasaran data yang berkembang pesat muncul untuk mengisi jurang ini. Dari Cape Town hingga Chicago, ribuan orang sedang memberikan kuasa mikro terhadap identiti biometrik dan data peribadi mereka kepada AI generasi seterusnya.

Namun, ekonomi pekerjaan sementara yang baru ini datang dengan harga. Di belakang pertukaran beberapa dolar, para pelatih ini sedang memberi bahan bakar kepada industri yang mungkin akhirnya membuat kemahiran mereka menjadi usang, sambil memaparkan diri mereka kepada risiko masa depan seperti deepfake, pencurian identiti, dan eksploitasi digital—yang baru saja mereka mulai sedari.

Biarkan gear AI terus berputar

Model bahasa AI seperti ChatGPT dan Gemini memerlukan bahan pembelajaran yang sangat besar untuk terus diperbaiki, tetapi mereka sedang menghadapi kekurangan data. Sumber data latihan yang paling sering digunakan—C4, RefinedWeb, dan Dolma—menyumbang seperempat daripada set data berkualiti tertinggi di web, dan kini sedang menghadkan penggunaan data mereka oleh syarikat AI generatif untuk melatih model. Para penyelidik menganggarkan bahawa syarikat AI akan habis menggunakan teks berkualiti tinggi yang baru paling awal pada tahun 2026. Walaupun sebahagian makmal telah mula menggunakan data sintetik yang dihasilkan oleh AI sendiri untuk umpan balik latihan, proses berulang ini menyebabkan output model dipenuhi dengan "sampah" yang penuh kesilapan, yang akhirnya menyebabkan kegagalan.

gambar

Aplikasi seperti Kled AI dan Silencio muncul di sini. Di pasaran data ini, jutaan orang sedang memperjualbelikan data identiti mereka untuk membesarkan dan melatih AI. Selain Kled AI, Silencio, dan Neon Mobile, terdapat banyak pilihan lain untuk pelatih AI: Luel AI yang disokong oleh inkubator terkenal Y-Combinator, yang memperoleh bahan dialog multibahasa pada kadar sekitar 0.15 dolar AS per minit; ElevenLabs membenarkan anda membuat klon digital suara anda sendiri dan menyewakannya kepada orang lain pada kadar asas 0.02 dolar AS per minit.

Profesor ekonomi dari King's College London, Bouke Klein Teeselink, menyatakan bahawa pekerjaan sementara untuk melatih AI adalah kelas pekerjaan baru yang akan meningkat secara besar-besaran.

Teeselink mengatakan, syarikat AI tahu bahawa membayar bayaran kuasa data kepada orang ramai membantu mengelakkan pertikaian hak cipta yang mungkin timbul daripada ketergantungan sepenuhnya pada penggalian kandungan web. Penyelidik AI Veniamin Veselovsky menyatakan bahawa syarikat-syarikat ini juga memerlukan data berkualiti tinggi untuk memodelkan tingkah laku baru dan yang telah diperbaiki dalam sistem. "Sekarang ini, data manusia adalah piawaian emas untuk pengambilan sampel dari luar taburan model," tambah Veselovsky.

Orang-orang yang menggerakkan mesin-mesin ini—terutama di negara berkembang—seringkali memerlukan uang ini dan hampir tidak memiliki pilihan lain. Bagi banyak pekerja lepas pelatihan AI, melakukan pekerjaan ini adalah respons praktis terhadap kesenjangan ekonomi. Di negara-negara dengan tingkat pengangguran tinggi dan mata uang lokal yang melemah, menghasilkan dolar AS seringkali lebih stabil dan lebih menguntungkan daripada pekerjaan lokal. Sebagian orang kesulitan mendapatkan pekerjaan tingkat pemula dan terpaksa melakukan pelatihan AI demi bertahan hidup. Bahkan di negara-negara yang lebih kaya, kenaikan biaya hidup menjadikan menjual diri sendiri sebagai pilihan keuangan yang logis.

Louw, seorang pelatih AI dari Cape Town, memahami dengan jelas harga privasi yang terlibat. Walaupun pendapatannya tidak stabil dan tidak mencukupi untuk menutupi semua perbelanjaan bulanannya, dia bersedia menerima syarat-syarat tersebut untuk menghasilkan wang. Setelah menderita penyakit saraf selama bertahun-tahun dan tidak dapat mencari pekerjaan, wang yang diperolehnya dari pasaran data AI (termasuk Kled AI) membolehkannya mengumpulkan sebanyak $500 untuk mendaftar ke kursus latihan spa dan menjadi pakar urut.

"Sebagai seorang Afrika Selatan, menerima dolar Amerika bernilai lebih daripada yang orang bayangkan," kata Louw.

Profesor geografi internet Universiti Oxford dan penulis buku Feeding the Machine, Mark Graham, mengakui bahawa wang ini mungkin bermakna secara praktikal dalam jangka pendek kepada individu di negara berkembang, tetapi dia memperingatkan bahawa "secara struktur, pekerjaan ini tidak stabil, tiada ruang untuk kemajuan, dan sebenarnya merupakan jalan buntu".

Graham menambahkan bahawa pasaran data AI bergantung pada "perang harga gaji" dan "permintaan sementara terhadap data manusia". Sekiranya permintaan ini berpindah, "pekerja akan tiada jaminan, tiada kemahiran yang boleh dipindahkan, dan tiada jaring keselamatan".

Graham menyatakan bahawa satu-satunya pemenang adalah "platform di belahan utara, yang mengambil semua nilai abadi."

gambar

Pengampuan penuh

Hill, seorang pelatih AI dari Chicago, merasa bercampur perasaan tentang menjual panggilan telefon peribadinya kepada Neon Mobile. Panggilan sepanjang kira-kira 11 jam itu membawanya mendapat $200, tetapi dia mengatakan aplikasi itu sering down dan menunda pembayaran. "Neon selalu terasa mencurigakan dalam pandangan saya, tetapi saya terus menggunakannya hanya untuk mendapatkan sedikit uang saku untuk membayar bil," kata Hill.

Sekarang dia mulai mempertimbangkan semula sama ada duit itu benar-benar mudah. Pada September tahun lalu, Neon Mobile ditutup beberapa minggu selepas pelancarannya, selepas TechCrunch menemui satu kelemahan keselamatan yang membolehkan sesiapa sahaja mengakses nombor telefon, rakaman panggilan, dan rekod teks pengguna. Hill berkata Neon Mobile tidak pernah memberitahunya mengenai perkara ini, dan sekarang dia bimbang suaranya akan disalahgunakan di internet.

Jennifer King, penyelidik privasi data di Institut Kecerdasan Buatan Berpusat pada Manusia Universiti Stanford, bimbang bahawa pasaran data AI tidak jelas mengenai bagaimana dan di mana data pengguna akan digunakan. Beliau menambah bahawa tanpa memahami hak mereka sendiri dan tanpa kemampuan untuk bernegosiasi mengenai perkara ini, "pengguna menghadapi risiko data mereka digunakan semula dengan cara yang mereka tidak suka, tidak faham, atau tidakjangka, dan pada masa itu hampir tiada jalan penyelesaian yang tersedia".

Apabila pelatih AI berkongsi data di Neon Mobile dan Kled AI, mereka memberikan kuasa penuh (global, eksklusif, tidak boleh ditarik balik, boleh dipindahkan dan bebas royalti) yang membenarkan platform menjual, menggunakan, mempamerkan secara awam, dan menyimpan gambar mereka, bahkan mencipta karya terbitan berdasarkan gambar tersebut.

Pendiri Kled AI, Avi Patel, menyatakan bahawa protokol data syarikatnya akan dibataskan hanya untuk tujuan latihan dan penyelidikan AI. "Seluruh model perniagaan bergantung kepada kepercayaan pengguna. Jika penyumbang percaya data mereka mungkin disalahgunakan, platform ini tidak akan berfungsi." Beliau menyatakan bahawa syarikat akan mengulas calon pembeli sebelum menjual set data, mengelakkan kerjasama dengan "institusi yang mencurigakan" seperti industri pornografi, serta "agensi kerajaan" yang dianggap mungkin menggunakan data dengan cara yang bertentangan dengan kepercayaan tersebut.

Neon Mobile tidak memberi respons terhadap permintaan komen.

Profesor undang-undang dari St George's, University of London, Enrico Bonadio, menunjukkan bahawa syarat-syarat perjanjian ini membenarkan platform dan pelanggannya "hampir boleh melakukan apa sahaja terhadap bahan tersebut, secara kekal, tanpa pembayaran tambahan, dan pemberi sumbangan tidak mempunyai cara sebenar untuk menarik balik persetujuan atau negosiasi semula".

Risiko yang lebih mengkhawatirkan termasuk data pelatih yang digunakan untuk membuat deepfake dan penipuan identiti. Walaupun pasaran data menyatakan bahawa maklumat pengenal diri dalam data (seperti nama dan lokasi) akan dikeluarkan sebelum dijual, Bonadio menambah bahawa pola biometrik secara intrinsik sukar untuk dianonimkan secara bermakna.

Penyesalan penjual

Walaupun pelatih AI mampu bernegosiasi untuk mendapatkan syarat perlindungan yang lebih terperinci mengenai penggunaan data, mereka masih mungkin menyesal. Pada tahun 2024, pelakon dari New York, Adam Coy, menjual citranya kepada Captions—sebuah perisian penyuntingan video AI yang kini dinamakan semula sebagai Mirage—dengan harga US$1,000. Perjanjian beliau menetapkan bahawa identitasnya tidak akan digunakan untuk sebarang tujuan politik, tidak digunakan untuk mempromosikan alkohol, tembakau, atau kandungan erotik, dan tempoh kuasa adalah selama satu tahun.

Tidak memberi respons terhadap permintaan komen.

Tidak lama kemudian, rakan-rakan Adam mula berkongsi video yang mereka jumpa secara dalam talian, di mana wajah dan suara Adam digunakan, dengan jumlah tontonan berjuta-juta. Dalam salah satu video Instagram, salinan AI Adam mengenalkan dirinya sebagai "doktor vagina" untuk mempromosikan suplemen perubatan yang tidak disahkan kepada wanita hamil dan selepas bersalin.

"Menerangkan perkara ini kepada orang lain membuat saya merasa malu," kata Coy.

“Komen di ruang ini aneh, kerana mereka mengulas penampilan saya, tetapi itu bukan saya,” tambah Coy. “Pada masa saya membuat keputusan ini (menjual gambar diri), fikiran saya ialah kebanyakan model sebenarnya akan mengambil data dan gambar secara dalam talian, jadi lebih baik saya dibayar.”

Coy mengatakan bahawa selepas itu, beliau tidak menerima sebarang pekerjaan sampingan data AI lagi. Beliau berkata bahawa beliau hanya akan mempertimbangkan untuk menerima pekerjaan semula jika sebuah syarikat menawarkan bayaran yang besar.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.