ผู้ใช้หลายพันคนทั่วโลกขายข้อมูลส่วนตัวเพื่อใช้ฝึกฝนปัญญาประดิษฐ์ amid ความเสี่ยงด้านความเป็นส่วนตัว

ผู้เขียน: The Guardian

แปลโดย Deep潮 TechFlow

คำแนะนำจาก Shenchao: รายงานการสอบสวนฉบับนี้เปิดเผยอุตสาหกรรมสีเทาที่กำลังเติบโตอย่างรวดเร็ว: คนนับพันทั่วโลกกำลังหารายได้จากการขายเสียง ใบหน้า บันทึกการโทร และวิดีโอประจำวันของตนเองเพื่อใช้ในการฝึกอบรม AI

นี่ไม่ใช่การอภิปรายทั่วไปเกี่ยวกับความเป็นส่วนตัว แต่เป็นการสอบสวนที่มีบุคคลจริง จำนวนเงินจริง และผลลัพธ์จริง—นักแสดงคนหนึ่งที่ขายใบหน้าของตัวเอง ต่อมาพบว่าตัวเองปรากฏบน Instagram กำลังโปรโมตผลิตภัณฑ์ทางการแพทย์ที่ไม่ทราบแหล่งที่มา โดยมีผู้ใช้แสดงความคิดเห็นเกี่ยวกับ “รูปลักษณ์” ของเขา

เมื่อความต้องการข้อมูลของบริษัท AI รวมกับช่องว่างทางเศรษฐกิจทั่วโลก กำลังสร้างการแลกเปลี่ยนที่ไม่เท่าเทียม

ข้อความทั้งหมดมีดังนี้:

เมื่อปีที่แล้ว ในยามเช้าวันหนึ่ง แจคอบุส ลูว์ ผู้อาศัยอยู่ในเคปทาวน์ ประเทศแอฟริกาใต้ ออกเดินเล่นตามปกติและให้อาหารนกอินทรีทะเลตามทาง แต่ครั้งนี้เขาบันทึกวิดีโอไม่กี่คลิป—ถ่ายภาพขั้นตอนการเดินของเขาบนทางเท้าและมุมมองรอบตัว วิดีโอนี้ทำให้เขาได้รับเงิน 14 ดอลลาร์สหรัฐ ซึ่งมากกว่าค่าจ้างขั้นต่ำของประเทศถึง 10 เท่า และเทียบเท่ากับค่าใช้จ่ายด้านอาหารครึ่งสัปดาห์ของหนุ่มวัย 27 ปีคนนี้

นี่คือภารกิจ “การนำทางในเมือง” ที่ Louw ทำสำเร็จบน Kled AI Kled AI เป็นแอปที่จ่ายเงินให้ผู้ใช้อัปโหลดข้อมูลเช่น รูปภาพและวิดีโอเพื่อใช้ฝึกโมเดล AI ในเวลาเพียงไม่กี่สัปดาห์ Louw ได้รับเงิน 50 ดอลลาร์สหรัฐจากการอัปโหลดรูปภาพและวิดีโอจากชีวิตประจำวัน

นับพันไมล์ห่างออกไป ในเมืองรานชี ประเทศอินเดีย เด็กนักเรียนอายุ 22 ปีชื่อ Sahil Tigga หารายได้เป็นประจำผ่านแอป Silencio — แอปที่รวบรวมข้อมูลเสียงจากผู้ใช้เพื่อใช้ฝึกอบรม AI โดยจะเข้าถึงไมโครโฟนบนโทรศัพท์ของเขาเพื่อบันทึกเสียงรบกวนจากภายในร้านอาหารหรือจุดตัดถนนที่คับคั่ง เขายังอัปโหลดบันทึกเสียงของตัวเองด้วย Sahil จะเดินทางไปยังสถานที่เฉพาะเจาะจง เช่น ล็อบบี้โรงแรมที่ยังไม่ถูกบันทึกไว้บนแผนที่ของ Silencio เขาได้รายได้มากกว่า 100 ดอลลาร์สหรัฐต่อเดือนจากสิ่งนี้ ซึ่งเพียงพอต่อค่าใช้จ่ายด้านอาหารทั้งหมด

ในชิคาโก เด็กหนุ่มวัย 18 ปีที่เป็นผู้ช่วยวิศวกรเชื่อม Ramelio Hill ได้ขายบันทึกการแชทส่วนตัวกับเพื่อนและครอบครัวให้กับ Neon Mobile—แพลตฟอร์มฝึกอบรม AI แบบโต้ตอบ—โดยได้รับค่าตอบแทน 0.50 ดอลลาร์ต่อนาที และทำเงินได้หลายร้อยดอลลาร์ สำหรับ Hill แล้ว นี่เป็นเรื่องง่ายๆ: เขาเชื่อว่าบริษัทเทคโนโลยีได้รับข้อมูลส่วนตัวของเขาไปแล้วจำนวนมาก ดังนั้นเขาจึงอยากได้ส่วนแบ่งจากมันบ้าง

งานฟรีแลนซ์ “การฝึก AI” เหล่านี้—การอัปโหลดฉากรอบตัว รูปถ่าย วิดีโอ และเสียงของตนเอง—อยู่ตรงจุดสูงสุดของทองคำแดงข้อมูลใหม่ระดับโลก เมื่อความต้องการของซิลิคอนแวลลีย์ต่อข้อมูลมนุษย์คุณภาพสูงเกินกว่าที่จะดึงได้จากอินเทอร์เน็ตแบบเปิด เกิดอุตสาหกรรมตลาดข้อมูลที่กำลังเติบโตขึ้นเพื่อเติมช่องว่างนี้ ตั้งแต่เคปทาวน์ถึงชิคาโก คนนับพันกำลังให้สิทธิ์ข้อมูลชีวภาพและข้อมูลส่วนตัวของตนแก่ AI รุ่นถัดไป

แต่เศรษฐกิจงานชั่วคราวใหม่นี้มาพร้อมกับค่าใช้จ่าย ด้านหลังการแลกเปลี่ยนด้วยเงินเพียงไม่กี่ดอลลาร์ ผู้ฝึกสอนเหล่านี้กำลังให้พลังงานแก่อุตสาหกรรมที่อาจทำให้ทักษะของพวกเขาล้าสมัยในที่สุด ขณะเดียวกันก็เสี่ยงต่อภัยคุกคามในอนาคต เช่น ดีพฟอคส์ การขโมยตัวตน และการแสวงประโยชน์ทางดิจิทัล—ซึ่งพวกเขากำลังเริ่มตระหนักถึงสิ่งเหล่านี้เพียงเล็กน้อย

ทำให้เกียร์ AI หมุนต่อไป

โมเดลภาษา AI เช่น ChatGPT และ Gemini ต้องการข้อมูลการเรียนรู้จำนวนมากเพื่อปรับปรุงอย่างต่อเนื่อง แต่ขณะนี้กำลังเผชิญกับวิกฤตข้อมูล แหล่งข้อมูลการฝึกที่ใช้บ่อยที่สุด—C4, RefinedWeb และ Dolma—ซึ่งครอบคลุมหนึ่งในสี่ของชุดข้อมูลคุณภาพสูงสุดบนเว็บ ตอนนี้เริ่มจำกัดการใช้ข้อมูลของบริษัท AI แบบสร้างสรรค์ในการฝึกโมเดล นักวิจัยประเมินว่าบริษัท AI จะหมดข้อมูลข้อความคุณภาพสูงใหม่ที่ใช้ได้เร็วที่สุดในปี 2026 แม้ว่าห้องปฏิบัติการบางแห่งจะเริ่มใช้ข้อมูลสังเคราะห์ที่สร้างโดย AI เองเพื่อฝึกโมเดลแบบย้อนกลับ แต่กระบวนการวนซ้ำนี้ทำให้ผลลัพธ์ของโมเดลเต็มไปด้วยข้อผิดพลาดและ “ขยะ” ซึ่งอาจนำไปสู่การล่ม

รูปภาพ

แอปพลิเคชันเช่น Kled AI และ Silencio กำลังเข้ามามีบทบาทที่นี่ ในตลาดข้อมูลเหล่านี้ ผู้คนนับล้านกำลังใช้ข้อมูลตัวตนของตนเองเพื่อเลี้ยงและฝึกฝน AI นอกจาก Kled AI, Silencio และ Neon Mobile แล้ว ผู้ฝึกฝน AI ยังมีตัวเลือกอีกมากมาย: Luel AI ที่ได้รับการสนับสนุนจากตัวเร่งความเร็วชื่อดัง Y-Combinator ซึ่งรับข้อมูลการสนทนาหลายภาษาในราคาประมาณ 0.15 ดอลลาร์ต่อนาที; ElevenLabs อนุญาตให้คุณสร้างดิจิทัลคลอนเสียงของตัวเองและให้ผู้อื่นใช้งานในอัตราพื้นฐานที่ 0.02 ดอลลาร์ต่อนาที

ศาสตราจารย์ Bouke Klein Teeselink แห่งมหาวิทยาลัยลอนดอน คิงส์ คอลเลจ ระบุว่า งานชั่วคราวในการฝึกฝน AI เป็นหมวดหมู่งานใหม่ที่จะเติบโตอย่างมาก

Teeselink กล่าวว่า บริษัท AI รู้ดีว่า การจ่ายค่าธรรมเนียมการอนุญาตข้อมูลให้กับผู้คนช่วยหลีกเลี่ยงข้อพิพาทลิขสิทธิ์ที่อาจเกิดขึ้นจากการพึ่งพาการดึงเนื้อหาผ่านเว็บสแครปเพียงอย่างเดียว Veniamin Veselovsky นักวิจัย AI ระบุว่า บริษัทเหล่านี้ยังต้องการข้อมูลคุณภาพสูงเพื่อสร้างแบบจำลองพฤติกรรมใหม่ๆ ที่ได้รับการปรับปรุง “ในปัจจุบัน ข้อมูลของมนุษย์ถือเป็นมาตรฐานทองคำในการสุ่มตัวอย่างจากภายนอกการแจกแจงของแบบจำลอง” Veselovsky เพิ่มเติม

ผู้คนที่ขับเคลื่อนเครื่องจักรเหล่านี้—โดยเฉพาะอย่างยิ่งในประเทศกำลังพัฒนา—มักต้องการเงินนี้และแทบไม่มีทางเลือกอื่น สำหรับผู้ทำงานชั่วคราวในการฝึกอบรม AI จำนวนมาก การทำงานนี้เป็นการตอบสนองอย่างเป็นรูปธรรมต่อช่องว่างทางเศรษฐกิจ ในประเทศที่อัตราการว่างงานสูงและสกุลเงินท้องถิ่นลดค่า เงินดอลลาร์มักจะมีความมั่นคงและคุ้มค่ากว่างานในท้องถิ่น บางคนไม่สามารถหางานระดับเริ่มต้นได้ และต้องทำหน้าที่ฝึกอบรม AI เพื่อหาเลี้ยงชีพ แม้แต่ในประเทศที่ร่ำรวยกว่า การเพิ่มขึ้นของค่าครองชีพก็ทำให้การขายตัวเองกลายเป็นทางเลือกทางการเงินที่สมเหตุสมผล

ผู้ฝึกสอน AI จากเคปทาวน์ ชื่อโลว์ รับรู้ถึงต้นทุนด้านความเป็นส่วนตัวอย่างชัดเจน แม้รายได้ของเขาจะไม่แน่นอนและไม่เพียงพอต่อค่าใช้จ่ายรายเดือนทั้งหมด เขาก็ยินดียอมรับเงื่อนไขเหล่านี้เพื่อหารายได้ หลังจากทนทุกข์ทรมานจากโรคทางระบบประสาทมานานหลายปีและไม่สามารถหางานทำได้ แต่เงินที่เขาหารายได้จากตลาดข้อมูล AI (รวมถึง Kled AI) ช่วยให้เขาสะสมเงินได้ 500 ดอลลาร์สหรัฐ เพื่อสมัครเข้ารับการฝึกอบรมด้านสปา และกลายเป็นนักนวด

“ในฐานะคนแอฟริกาใต้ การได้รับดอลลาร์สหรัฐมีมูลค่ามากกว่าที่ผู้อื่นคิด” ลูว์กล่าว

มาร์ก กรแฮม ศาสตราจารย์ด้านภูมิศาสตร์อินเทอร์เน็ตของมหาวิทยาลัยออกซ์ฟอร์ด และผู้แต่งหนังสือ “Feeding the Machine” ยอมรับว่าสำหรับบุคคลในประเทศกำลังพัฒนา เงินจำนวนนี้อาจมีความหมายในระยะสั้น แต่เขาเตือนว่า “ในเชิงโครงสร้าง งานนี้ไม่มั่นคง ไม่มีโอกาสก้าวหน้า และแท้จริงแล้วเป็นทางตัน”

กราแฮมเสริมว่า ตลาดข้อมูล AI ขึ้นอยู่กับ "การแข่งขันลดค่าจ้าง" และ "ความต้องการชั่วคราวต่อข้อมูลของมนุษย์" เมื่อความต้องการนี้เปลี่ยนไป "แรงงานจะไม่มีความมั่นคงใดๆ ทักษะที่สามารถถ่ายโอนได้ หรือระบบความปลอดภัย"

กราแฮมระบุว่า ผู้ชนะเพียงรายเดียวคือ "แพลตฟอร์มในซีกโลกเหนือ ที่ยึดครองมูลค่าถาวรทั้งหมด"

รูปภาพ

การมอบอำนาจเต็ม

ฮิลล์ ผู้ฝึกอบรม AI จากชิคาโก มีความรู้สึกไม่แน่นอนเกี่ยวกับการขายการสนทนาทางโทรศัพท์ส่วนตัวให้กับ Neon Mobile คำพูดประมาณ 11 ชั่วโมงทำให้เขาได้รับเงิน 200 ดอลลาร์ แต่เขากล่าวว่าแอปนี้มักจะล่มและเลื่อนการจ่ายเงิน "Neon ดูน่าสงสัยเสมอในสายตาฉัน แต่ฉันยังคงใช้มันอยู่ เพียงเพื่อหารายได้พิเศษจ่ายค่า账单" ฮิลล์กล่าว

ตอนนี้เขาเริ่มทบทวนว่าเงินนี้จริงๆ แล้วง่ายดายแค่ไหน เมื่อเดือนกันยายนปีที่แล้ว Neon Mobile ถูกปิดตัวลงเพียงไม่กี่สัปดาห์หลังเปิดตัว เนื่องจาก TechCrunch ค้นพบช่องโหว่ด้านความปลอดภัยที่ทำให้ใครก็ตามสามารถเข้าถึงหมายเลขโทรศัพท์ บันทึกเสียงการโทร และข้อความของผู้ใช้ Hill กล่าวว่า Neon Mobile ไม่เคยแจ้งให้เขาทราบเกี่ยวกับเรื่องนี้ และตอนนี้เขาเป็นห่วงว่าเสียงของเขาอาจถูกใช้ในทางที่ไม่เหมาะสมบนอินเทอร์เน็ต

เจนนิเฟอร์ คิง นักวิจัยด้านความเป็นส่วนตัวของข้อมูลจากสถาบันปัญญาประดิษฐ์ที่เน้นมนุษย์ของมหาวิทยาลัยสแตนฟอร์ด กังวลว่า ตลาดข้อมูลปัญญาประดิษฐ์ไม่ชัดเจนว่าข้อมูลของผู้ใช้จะถูกใช้อย่างไรและที่ไหน เธอเสริมว่า ในกรณีที่ผู้บริโภคไม่เข้าใจสิทธิของตนเองและไม่สามารถเจรจาเกี่ยวกับเรื่องนี้ได้ “ผู้บริโภคจึงเสี่ยงต่อการที่ข้อมูลของพวกเขาจะถูกนำกลับมาใช้ใหม่ในวิธีที่พวกเขาไม่ชอบ ไม่เข้าใจ หรือไม่คาดคิด และในเวลานั้นแทบจะไม่มีทางแก้ไขใดๆ”

เมื่อผู้ฝึกสอน AI แชร์ข้อมูลบน Neon Mobile และ Kled AI พวกเขาจะให้สิทธิ์แบบเต็มรูปแบบ (ทั่วโลก, เฉพาะสิทธิ์, ไม่สามารถเพิกถอนได้, สามารถโอนสิทธิ์ได้ และไม่ต้องจ่ายค่าลิขสิทธิ์) เพื่ออนุญาตให้แพลตฟอร์มขาย ใช้ แสดงต่อสาธารณะ และจัดเก็บภาพลักษณ์ของพวกเขา รวมถึงสร้างผลงานที่ได้รับแรงบันดาลใจจากภาพลักษณ์เหล่านั้น

Avi Patel ผู้ก่อตั้ง Kled AI กล่าวว่า โปรโตคอลข้อมูลของบริษัทเขาจะถูกจำกัดเฉพาะสำหรับการฝึกอบรมและวิจัยด้าน AI “ธุรกิจทั้งหมดขึ้นอยู่กับความเชื่อมั่นของผู้ใช้ หากผู้บริจาคคิดว่าข้อมูลของพวกเขาอาจถูกใช้ในทางที่ผิด แพลตฟอร์มจะไม่สามารถดำเนินงานได้” เขาระบุว่า บริษัทจะตรวจสอบผู้ซื้อก่อนการขายชุดข้อมูล เพื่อหลีกเลี่ยงความร่วมมือกับองค์กรที่ “มีเจตนาสงสัย” เช่น อุตสาหกรรมสื่อลามก และ “หน่วยงานรัฐบาล” ที่พวกเขาเชื่อว่าอาจใช้ข้อมูลในทางที่ขัดกับความเชื่อมั่นนี้

Neon Mobile ไม่ได้ตอบกลับคำร้องขอให้แสดงความคิดเห็น

ศาสตราจารย์ Enrico Bonadio จากมหาวิทยาลัยสตีฟน์สโตน ลอนดอน ชี้ให้เห็นว่าข้อกำหนดของข้อตกลงเหล่านี้อนุญาตให้แพลตฟอร์มและลูกค้าของแพลตฟอร์ม “สามารถทำอะไรก็ได้เกี่ยวกับวัสดุนี้ อย่างถาวร โดยไม่ต้องจ่ายค่าตอบแทนเพิ่มเติม และผู้มีส่วนร่วมไม่มีวิธีใดในการถอนความยินยอมหรือเจรจาใหม่”

ความเสี่ยงที่น่ากังวลมากขึ้นรวมถึงข้อมูลของผู้ฝึกอบรมถูกใช้เพื่อสร้าง deepfake และการแอบอ้างตัวตน แม้ว่าตลาดข้อมูลจะอ้างว่าจะลบข้อมูลระบุตัวตนออกจากข้อมูลก่อนการขาย (เช่น ชื่อและตำแหน่ง) แต่รูปแบบชีวมิติมีลักษณะพื้นฐานที่ยากต่อการทำให้เป็นอนันนามอย่างมีนัยสำคัญ โบนาดิโอเสริม

Regret of the seller

แม้ว่าผู้ฝึกสอน AI จะสามารถเจรจาข้อกำหนดการคุ้มครองที่ละเอียดกว่าเกี่ยวกับการใช้ข้อมูล พวกเขาก็ยังอาจรู้สึกเสียใจ ปี 2024 นักแสดงจากนิวยอร์ก Adam Coy ได้ขายภาพลักษณ์ของตนให้กับ Captions—ซอฟต์แวร์แก้ไขวิดีโอ AI ซึ่งตอนนี้เปลี่ยนชื่อเป็น Mirage—ในราคา 1,000 ดอลลาร์สหรัฐ ข้อตกลงของเขาระบุว่าตัวตนของเขาจะไม่ถูกใช้เพื่อวัตถุประสงค์ทางการเมือง ไม่ใช่เพื่อโปรโมตเครื่องดื่มแอลกอฮอล์ บุหรี่ หรือเนื้อหาทางเพศ และมีระยะเวลาการอนุญาตหนึ่งปี

ไม่ได้ตอบกลับคำร้องขอความคิดเห็น

ไม่นานหลังจากนั้น เพื่อนๆ ของอดัมเริ่มแชร์วิดีโอที่พวกเขาพบบนอินเทอร์เน็ต ซึ่งใช้หน้าตาและเสียงของเขา โดยมีผู้ดูหลายล้านครั้ง วิดีโอหนึ่งบน Instagram แสดงตัวตนของ AI ที่เลียนแบบอดัมว่าเป็น "หมอช่องคลอด" ซึ่งโปรโมตผลิตภัณฑ์เสริมอาหารทางการแพทย์ที่ยังไม่ได้รับการพิสูจน์สำหรับสตรีตั้งครรภ์และหลังคลอด

“การอธิบายเรื่องนี้ให้คนอื่นฟังทำให้ฉันรู้สึกอับอาย” Coy กล่าว

“ความคิดเห็นแปลกมาก เพราะพวกเขากำลังวิจารณ์รูปลักษณ์ของฉัน แต่นั่นไม่ใช่ฉันเลย” Coy เสริม “ตอนที่ฉันตัดสินใจทำสิ่งนี้ (ขายภาพลักษณ์) ฉันคิดว่า โมเดลส่วนใหญ่ก็จะดึงข้อมูลและภาพลักษณ์จากอินเทอร์เน็ตอยู่แล้ว ดังนั้นทำไมไม่รับเงินล่ะ”

โคยกล่าวว่าเขาไม่ได้รับงานฟรีแลนซ์ด้านข้อมูล AI อีกเลยหลังจากนั้น เขาบอกว่าจะพิจารณาทำงานอีกครั้งก็ต่อเมื่อบริษัทใดบริษัทหนึ่งเสนอค่าตอบแทนที่สูงมาก