آلاف الأشخاص حول العالم يبيعون بياناتهم الشخصية لتدريب الذكاء الاصطناعي وسط مخاطر على الخصوصية

iconTechFlow
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
تُظهر أخبار الذكاء الاصطناعي والعملات المشفرة العالمية آلاف الأشخاص يبيعون بياناتهم الشخصية—الأصوات، الوجوه، والمحادثات الخاصة—بمقابل ضئيل. هؤلاء المساهمون، من جنوب إفريقيا إلى الهند والولايات المتحدة، يدعمون منصات مثل Kled AI وNeon Mobile. غالبًا ما تسمح الشروط للشركات باستخدام البيانات إلى الأبد، مما يثير مخاوف تتعلق بالخصوصية. إن بيانات التضخم وطلب السوق هما ما يدفعان هذا الاتجاه، حيث تتطلب نماذج الذكاء الاصطناعي مجموعات بيانات ضخمة. تشمل المخاطر عمليات التزييف العميق وسرقة الهوية، مع قلة سيطرة للمستخدمين.

المؤلف: The Guardian

مُترجم: Deep潮 TechFlow

مقدمة شينتشاو: كشف هذا التقرير الاستقصائي عن صناعة رمادية تنمو بسرعة: آلاف الأشخاص حول العالم يكسبون أموالًا من خلال بيع أصواتهم ووجوههم وسجلات مكالماتهم ومقاطع الفيديو اليومية لتدريب الذكاء الاصطناعي.

هذا ليس نقاشًا عامًا حول خرق الخصوصية، بل تحقيق يشمل أشخاصًا حقيقيين ومبالغ حقيقية وعواقب حقيقية—ممثل باع وجهه، ثم رأى "نفسه" لاحقًا على إنستغرام وهو يروّج لمنتج طبي غير معروف، حيث كان المعلقون يقيمون "مظهره".

عندما يجتمع شغف شركات الذكاء الاصطناعي للبيانات مع الفجوة الاقتصادية العالمية، فإنه يخلق تبادلاً غير متكافئ.

النص الكامل كالتالي:

في صباح من العام الماضي، خرج جاكوبوس لوف، الذي يعيش في كيب تاون، جنوب إفريقيا، للتنزه كما هو معتاد، وقمّم الطيور البحرية على طول الطريق. لكنه هذه المرة سجّل بضع مقاطع فيديو — تُظهر خطواته على الرصيف ومنظوره. وقد كسب من هذا الفيديو 14 دولارًا، أي ما يعادل عشرة أضعاف الحد الأدنى للأجور في البلاد، ونصف نفقات الطعام لهذا الشاب البالغ من العمر 27 عامًا.

هذا مهمة "الملاحة الحضرية" أكملها لوو على Kled AI. Kled AI هو تطبيق يدفع للمستخدمين مقابل رفع صور وفيديوهات وغيرها من البيانات لتدريب نماذج الذكاء الاصطناعي. خلال بضعة أسابيع فقط، كسب لوو 50 دولارًا من خلال رفع صور وفيديوهات من حياته اليومية.

على بعد آلاف الأميال، في رانشي، الهند، يكسب شاب يبلغ من العمر 22 عامًا يُدعى ساهيل تيجا دخلًا منتظمًا من تطبيق Silencio — الذي يجمع بيانات صوتية من الجمهور لتدريب الذكاء الاصطناعي، ويُفعّل ميكروفون هاتفه لتسجيل ضوضاء البيئة مثل مطاعم داخلية أو تقاطعات مزدحمة. كما يرفع تسجيلات صوتيّة خاصة به. ويذهب ساهيل عمداً إلى مشاهد فريدة، مثل صالة فندقية لم تُسجّل بعد على خريطة Silencio. ويكسب من هذا أكثر من 100 دولار شهريًا، وهو ما يكفي لتغطية جميع نفقاته الغذائية.

في شيكاغو، كسب راميليو هيل، مُتدرب اللحام البالغ من العمر 18 عامًا، مئات الدولارات من بيع سجلات محادثات هاتفه الشخصية مع أصدقائه وعائلته إلى Neon Mobile — منصة تدريب ذكاء اصطناعي تفاعلي تدفع 0.50 دولار في الدقيقة —. بالنسبة لهيل، كانت هذه المعادلة بسيطة: فهو يعتقد أن شركات التكنولوجيا كانت بالفعل تمتلك كمًا هائلاً من بياناته الشخصية، ففضل أن يحصل هو أيضًا على نصيب منه.

تُعد هذه "وظائف التدريب بالذكاء الاصطناعي" — رفع مشاهد محيطة، وصور شخصية، ومقاطع فيديو، وصوتية — في طليعة سباق عالمي جديد على البيانات. مع تجاوز رغبة سيليكون فالي في البيانات البشرية عالية الجودة ما يمكن استخراجه من الإنترنت المفتوح، نشأ صناعة سوق بيانات مزدهرة لسد هذه الفجوة. من كيب تاون إلى شيكاغو، يُقرّر آلاف الأشخاص تفويض هوياتهم الحيوية وبياناتهم الخاصة للذكاء الاصطناعي من الجيل القادم.

لكن هذه الاقتصاد الجديد القائم على الوظائف المؤقتة يترتب عليه ثمن. فخلف تبادل بضعة دولارات، يُغذي هؤلاء المدربون صناعة قد تجعل مهاراتهم في النهاية عتيقة، في حين يعرضون أنفسهم لمخاطر مستقبلية مثل التزييف العميق وسرقة الهوية والاستغلال الرقمي—وهي مخاطر لم يبدأوا بعد في إدراكها.

اجعل تروس الذكاء الاصطناعي تستمر في الدوران

تتطلب نماذج اللغة الذكية الاصطناعية مثل ChatGPT وGemini كميات هائلة من مواد التعلم لتحسينها المستمر، لكنها تواجه نقصًا في البيانات. تشغل مصادر التدريب الأكثر استخدامًا — C4 وRefinedWeb وDolma — ربع مجموعة البيانات عالية الجودة على الويب، وهي الآن تقيّد شركات الذكاء الاصطناعي التوليدي من استخدام بياناتها لتدريب نماذجها. يقدّر الباحثون أن شركات الذكاء الاصطناعي ستستهلك جميع النصوص الجديدة عالية الجودة المتاحة بحلول عام 2026 على أقرب تقدير. على الرغم من أن بعض المختبرات بدأت بالفعل باستخدام بيانات اصطناعية تم إنشاؤها بواسطة الذكاء الاصطناعي نفسه للتدريب، إلا أن هذه العملية التكرارية تؤدي إلى ملء نماذجها بـ"نفايات" مليئة بالأخطاء، مما يتسبب في انهيارها.

صورة

تطبيقات مثل Kled AI و Silencio هي بالضبط ما يظهر هنا. في أسواق البيانات هذه، يُغذي ويطور الملايين من الأشخاص الذكاء الاصطناعي من خلال بيع بيانات هويتهم. بالإضافة إلى Kled AI و Silencio و Neon Mobile، هناك العديد من الخيارات الأخرى لمدربي الذكاء الاصطناعي: Luel AI، المدعوم من مُسرّع المشهور Y-Combinator، الذي يحصل على مواد محادثات متعددة اللغات بسعر حوالي 0.15 دولار في الدقيقة؛ وElevenLabs الذي يسمح لك بعمل نسخة رقمية من صوتك، ويوفرها للآخرين بسعر أساسي قدره 0.02 دولار في الدقيقة.

أشار البروفيسور بوكه كلاين تيسيلينك من كلية كينغز لندن في الاقتصاد إلى أن وظائف التدريب على الذكاء الاصطناعي هي فئة عمل ناشئة ستشهد نموًا كبيرًا.

يقول تيسيلينك إن شركات الذكاء الاصطناعي تدرك أن دفع رسوم ترخيص البيانات للأشخاص يساعد في تجنب النزاعات القانونية المتعلقة بحقوق الملكية التي قد تنجم عن الاعتماد الكامل على استخلاص المحتوى عبر الويب. ويقول باحث الذكاء الاصطناعي فينيامين فيسيلوفسكي إن هذه الشركات تحتاج أيضًا إلى بيانات عالية الجودة لنموذج سلوكيات جديدة ومُحسّنة للأنظمة. ويضيف فيسيلوفسكي: "حاليًا، تُعد بيانات البشر المعيار الذهبي للأخذ العيني من خارج توزيع النموذج."

الأشخاص الذين يُشغلون هذه الآلات—وخاصةً من الدول النامية—غالبًا ما يحتاجون إلى هذا المال ولا يمتلكون خيارات أخرى تقريبًا. بالنسبة للكثير من عمال التدريب الخاص بتدريب الذكاء الاصطناعي، فإن ممارسة هذا العمل هو استجابة عملية للفجوة الاقتصادية. في الدول ذات معدلات البطالة المرتفعة وانخفاض قيمة العملة المحلية، فإن كسب الدولار غالبًا ما يكون أكثر استقرارًا وربحية مقارنة بالوظائف المحلية. بعض الأشخاص لا يستطيعون العثور على وظائف دخولية، فيضطرون بسبب البقاء على قيد الحياة إلى القيام بتدريب الذكاء الاصطناعي. حتى في الدول الأكثر ثراءً، فإن ارتفاع تكلفة المعيشة يجعل بيع الذات خيارًا ماليًا منطقيًا.

يعرف لو، مُدرّب الذكاء الاصطناعي من كيب تاون، جيدًا الثمن الذي يُدفع من حيث الخصوصية. وعلى الرغم من عدم استقرار دخله وعدم كفايته لتغطية جميع نفقاته الشهرية، فإنه مستعد لقبول هذه الشروط لكسب المال. فقد عانى لسنوات من مرض عصبي منعه من إيجاد وظيفة، لكن الأموال التي كسبها من سوق بيانات الذكاء الاصطناعي (بما في ذلك Kled AI) ساعدته على جمع 500 دولار لدفع رسوم دورة تدريبية للسبا، ليصبح مُ masseur.

"بصفتي جنوب أفريقي، فإن تلقي الدولار الأمريكي يساوي أكثر مما يتخيله الآخرون،" كما قال لوف.

اعترف البروفيسور مارك غراهام، أستاذ الجغرافيا الإنترنتية بجامعة أكسفورد ومؤلف كتاب "إطعام الآلات"، بأنه من المحتمل أن يكون هذا المال ذا معنى عملي للأفراد في الدول النامية على المدى القصير، لكنه حذر من أن "هذا العمل من الناحية الهيكلية غير مستقر، ولا يوفر فرصًا للتقدم، بل هو في الواقع طريق مسدود".

أضاف غراهام أن سوق بيانات الذكاء الاصطناعي يعتمد على "المنافسة في خفض الأجور" و"الطلب المؤقت على البيانات البشرية". بمجرد تحول هذا الطلب، "لن يكون لدى العمال أي ضمانات، ولا مهارات قابلة للنقل، ولا شبكة أمان".

أشار غراهام إلى أن الفائزين الوحيدين هم "المنصات في نصف الكرة الشمالي، التي استولت على جميع القيم الدائمة".

صورة

التفويض الكامل

يشعر هيل، مُدرّب الذكاء الاصطناعي من شيكاغو، بمشاعر مختلطة تجاه بيع مكالمات هاتفه الخاصة لـ Neon Mobile. فقد كسب 200 دولار من حوالي 11 ساعة من المكالمات، لكنه يقول إن التطبيق غالبًا ما يتعطل ويؤخر الدفع. "كانت Neon تبدو مشبوهة بالنسبة لي، لكنني استمررت في استخدامه فقط لكسب بعض المال الإضافي لدفع الفواتير،" كما قال هيل.

الآن يبدأ في إعادة التفكير في ما إذا كانت هذه الأموال سهلة حقًا. في سبتمبر من العام الماضي، تم إيقاف Neon Mobile بعد أسابيع قليلة من إطلاقه، بعد أن اكتشفت TechCrunch ثغرة أمنية تسمح لأي شخص بالوصول إلى أرقام هواتف المستخدمين وتسجيلات المكالمات وسجلات الرسائل النصية. يقول هيل إن Neon Mobile لم تُبلغه أبدًا بهذا الأمر، وهو الآن قلق من أن صوته قد يُستغل على الإنترنت.

تشعر جينيفر كينغ، باحثة الخصوصية في البيانات من معهد ستانفورد للذكاء الاصطناعي الموجه للإنسان، بالقلق لأن سوق بيانات الذكاء الاصطناعي لا يوضح كيف ولأين سيتم استخدام بيانات المستخدمين. وتضيف أن "المستهلكين يواجهون خطر إعادة استخدام بياناتهم بطرق لا يحبونها أو لا يفهمونها أو لم يتوقعوها، دون أن يكون لديهم أي معرفة بحقوقهم أو فرصة للتفاوض بشأنها، وفي تلك المرحلة يكون لديهم تقريبًا أي سبل للانتصاف".

عندما يشارك مدرّبو الذكاء الاصطناعي بياناتهم على Neon Mobile و Kled AI، فإنهم يمنحون ترخيصًا حصريًا وعالميًا وغير قابل للإلغاء وقابل للتحويل وخالي من حقوق الملكية، يسمح للمنصة ببيع واستخدام وعرض البيانات علنًا وتخزينها، وحتى إنشاء أعمال مشتقة بناءً عليها.

أفاد أفي باتيل، مؤسس Kled AI، أن بروتوكول بيانات شركته سيُستخدم حصريًا لأغراض تدريب وأبحاث الذكاء الاصطناعي. "يعتمد نموذج العمل بأكمله على ثقة المستخدمين. إذا شعر المساهمون بأن بياناتهم قد تُستغل، فلن يتمكن النظام من العمل." وأشار إلى أن الشركة ستقوم بمراجعة المشترين قبل بيع مجموعات البيانات، لتجنب التعاون مع "جهات ذات نوايا مشبوهة" مثل صناعة المواد الإباحية، و"الهيئات الحكومية" التي تعتقد أنها قد تستخدم البيانات بطرق تنتهك هذه الثقة.

Neon Mobile لم ترد على طلب التعليق.

أشار البروفيسور إنريكو بوناديو من جامعة سانت جورج في لندن إلى أن شروط هذه الاتفاقيات تسمح للمنصة وعملائها "بفعل أي شيء تقريبًا على هذا المحتوى، بشكل دائم ودون دفع إضافي، ولا يوجد لدى المساهمين وسيلة فعلية لسحب موافقتهم أو إعادة التفاوض".

تشمل المخاطر الأكثر قلقًا استخدام بيانات المدربين في إنشاء عمليات تزييف عميقة وانتحال الهوية. على الرغم من ادعاء أسواق البيانات أن تقوم بإزالة معلومات التعرف على الهوية (مثل الأسماء والمواقع) قبل البيع، إلا أن الأنماط الحيوية صعبة التخفي بشكل ذي مغزى من حيث الطبيعة، كما أضاف بوناديو.

ندم البائع

حتى لو تمكّن مدرّبو الذكاء الاصطناعي من التفاوض على شروط حماية أكثر تفصيلاً بشأن كيفية استخدام البيانات، فقد يندمون على ذلك. في عام 2024، باع الممثل من نيويورك آدم كوي 1000 دولار صورته لشركة Captions — وهي برنامج ذكي لتحرير الفيديو، وقد أُعيد تسميته الآن إلى Mirage. نصّ اتفاقه على أن هويته لن تُستخدم لأي أغراض سياسية، ولا لترويج الكحول أو التبغ أو المحتوى الإباحي، وأن صلاحية الترخيص تستمر لمدة عام.

التعليقات غير م回应 لطلب التعليق.

بعد فترة قصيرة، بدأ أصدقاء آدم في مشاركة مقاطع فيديو وجدوها على الإنترنت، تحتوي على وجهه وصوته، وحققت ملايين المشاهدات. وفي أحد مقاطع فيديو إنستغرام، ادّعى نسخة آدم المُولَّدة بالذكاء الاصطناعي أنها "طبيبة المهبل"، وتُروّج لمكملات طبية غير مثبتة للنساء الحوامل والنساء بعد الولادة.

"شرح هذا الأمر للآخرين أشعرني بالخجل،" كما قال كوي.

أضاف كوي: "التعليقات غريبة، لأنهم يقيمون مظهري، لكنني لست أنا في الواقع." "عندما اتخذت قراري (بيع صورتي)، كنت أعتقد أن معظم النماذج ستقوم بجمع البيانات والصور من الإنترنت على أي حال، فلماذا لا أحصل على مقابل؟"

قال كوي إنه لم يقبل أي وظائف مؤقتة في بيانات الذكاء الاصطناعي منذ ذلك الحين. وقال إنه سيفكر في قبول وظيفة أخرى فقط إذا عرضت عليه شركة ما مكافأة كبيرة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.