لقد درّب المستخدمون دون قصد ذكاء Google الاصطناعي لمدة 15 عامًا عبر CAPTCHA

iconBlockbeats
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
كشفت أخبار الذكاء الاصطناعي والعملات المشفرة أن نظام reCAPTCHA، وهو نظام CAPTCHA الشهير، قد درّب ذكاء Google الاصطناعي لأكثر من 15 عامًا. قام المستخدمون دون علم بتصنيف بيانات لـ Google Maps وWaymo من خلال إكمال تحديات reCAPTCHA. وفي ذروته، جمع النظام 200 مليون ثانية من العمل البشري يوميًا — أي 500,000 ساعة — دون تعويض. لا تزال بيانات التضخم والتطورات في مجال الذكاء الاصطناعي تُشكّل مشهد التكنولوجيا والعملات المشفرة.
لقد كنت تدرب ذكاء Google الاصطناعي لمدة 15 عامًا. لم تكن تعلم.
الكاتب الأصلي: شاربل، المؤسس المشارك لـ Unfungible
لila، BlockBeats


ملاحظة المحرر: رمز التحقق (CAPTCHA)، وهو الرقم أو الصورة التي يجب النقر عليها عند تسجيل الدخول إلى أي موقع ويب، مألوف جدًا لكل مستخدم للإنترنت. لكن عندما تنقر مرارًا وتكرارًا على "لست روبوتًا"، فإنك تظن أنك تتحقق فقط من هويتك، بينما في الواقع أنت تشارك في إنتاج أكبر وأكثر البيانات سرية في العالم. لقد حوّل لويس فون أهن reCAPTCHA إلى سلوك بشري مجزأ، ليشكل حجر الأساس للبيانات التي تدعم أعمال جوجل الأساسية وشركتها التابعة للسيارات ذاتية القيادة Waymo.


تحت ستار "مجاني" و"آمن"، يعيد الإنترنت تشكيل علاقة عمل جديدة تمامًا: تقضي وقتك في إثبات أنك إنسان، لكنك تساهم في تدريب الذكاء الاصطناعي، وعندما يتعلم الذكاء الاصطناعي، يتم استبدال هذا العمل بالكامل. نُشر هذا المقال منذ أقل من 20 ساعة، وحقق أكثر من 9.5 مليون مشاهدة على تويتر. فيما يلي محتوى المقال الأصلي:


يتم استخدام حوالي 500 ألف ساعة من العمل البشري يوميًا من قِبل جوجل مجانًا. والأفراد الذين يساهمون بهذه الساعات، لا يرغبون سوى في تسجيل الدخول إلى بنكهم الإلكتروني.


reCAPTCHA هو أكثر عمليات جمع البيانات الخفية نجاحًا في تاريخ الإنترنت. في ذروتها، كان هناك 200 مليون شخص يكملون التحقق يوميًا. لكن قلة جدًا من الناس يدركون ما يعنيه كل نقرة خلف الكواليس.


شركة السيارات ذاتية القيادة التابعة لجوجل، Waymo، تبلغ قيمتها السوقية حاليًا 45 مليار دولار. ومعظم بيانات التدريب الأساسية الخاصة بها هي بيانات قدمتها مجانًا أثناء تصفحك لمواقع الويب المختلفة.


هذا هو القصة الكاملة:


السبب: فكرة ذكية


في عام 2000، كانت روبوتات البريد العشوائي تدمر الإنترنت. كانت المنتديات تُملأ بالرسائل غير المرغوب فيها، وصناديق البريد تمتلئ، وكانت المواقع بحاجة ماسة إلى طريقة لتمييز البشر عن الآلات.


حلّ البروفيسور لويس فون أهن من جامعة كارنيغي ميلون هذه المشكلة. وهو الذي اخترع CAPTCHA: نص مشوّش يمكن للإنسان فقط قراءته، ولا يمكن للروبوتات تجاوزه.


لكن فون أهن رأى أكثر من ذلك. ملايين الأشخاص يقضون طاقتهم في هذه التحديات. فماذا لو يمكن استخدام هذه الطاقة للقيام بامرَين في آنٍ واحد؟


في عام 2007، أطلق reCAPTCHA. جوهره الدقيق هو أنه لم يعد يعرض رموزًا عشوائية، بل يعرض كلمتين: واحدة معروفة للنظام، والأخرى هي كلمة حقيقية ممسوحة من كتب وليست قابلة للتعرف عليها من قبل الحاسوب. وتساعد إجاباتك في رقمنة هذه الكتب.


These books come from the New York Times archive and Google Books, up to 130 million copies.


تظن أنك تسجل الدخول إلى موقع عادي، لكنك في الواقع تقوم بعملية التعرف الضوئي على الحروف (OCR) لصالح أكبر مكتبة رقمية عالمية.


في عام 2009، استحوذت جوجل على reCAPTCHA.



بعد ذلك، غيّرت جوجل قواعد اللعبة


انتهى عصر "النص المشوّه" حوالي عام 2012.


تواجه جوجل تحديًا جديدًا: فقد صورت سيارات Street View كل طريق في العالم، لكن الصور هي مجرد بيانات خام. لتمكين الذكاء الاصطناعي من العمل، يجب عليه فهم ما يراه: لوحات الطرق، والعابرين، وأضواء المرور، وواجهات المتاجر.


لذلك أعادت جوجل تصميم reCAPTCHA v2. بدلاً من النص المشوّه في الصورة، هناك شبكة من الصور. "انقر على جميع المربعات التي تحتوي على إشارات مرور." "اختر كل ممر مشاة." "حدّد المتاجر."


هذه الصور مأخوذة مباشرة من جوجل ستريت فيو. نقرتك هي التصنيف.


كل اختيار تُجريه يُخبر نموذج الرؤية الحاسوبية من جوجل: هذه المجموعة من البكسلات هي إشارة مرور، والشكل ذلك هو عبور مشاة. أنت لا تمر بامتحان، أنت تبني مجموعة بيانات.



حجم يفوق التخيل


في ذروتها، كان يتم حل 200 مليون reCAPTCHA يوميًا. كل تحدٍ يستغرق 10 ثوانٍ، مما يعني أن العمل البشري الناتج يوميًا يبلغ 2 مليار ثانية. أي: 500 ألف ساعة يوميًا.


تكلفة وضع العلامات على البيانات بمقابل تبلغ حوالي 10 إلى 50 دولارًا في الساعة. وفقًا لأدنى المعايير: تبلغ القيمة المُستَخلَصة مجانًا من العمل يوميًا ما يصل إلى 5 ملايين دولار.


وإن reCAPTCHA لا توجد فقط في تطبيق معين. فهي موجودة في كل بنك، وكل بوابة حكومية، وكل موقع تجارة إلكترونية. ليس لديك خيار آخر: تريد تسجيل الدخول إلى حسابك؟ قم أولاً بتصنيف مجموعة البيانات. لم تسأل جوجل رأيك قط، ولم تدفع لك دولارًا واحدًا، وحتى لم تُبلغك بهذا الأمر أبدًا.



What did all of this create?


تُقدَّم هذه البيانات مباشرة إلى منتجين:


- خرائط جوجل: أداة الملاحة الأكثر استخدامًا عالميًا. إن قدرتها على التعرف على لوحات الطرق والمتاجر والجغرافيا الحضرية تُعزى جزئيًا إلى ملايين التصنيفات التي قام بها البشر عند تسجيل الدخول إلى الموقع.


Waymo: مشروع القيادة الذاتية من جوجل. لضمان الملاحة الآمنة، تحتاج السيارات ذاتية القيادة إلى التعرف على آلاف الأنماط البصرية بدقة شبه مثالية.


بيانات التدريب الحقيقية لتلك المهام التي تم التعرف عليها تم وسمها من قبل ملايين الأشخاص دون علمهم من خلال reCAPTCHA. أكملت Waymo أكثر من 4 ملايين رحلة مدفوعة في عام 2024، بتقييم قدره 45 مليار دولار أمريكي. ويعتمد أساسها على أولئك "المستخدمين العاديين للإنترنت" الذين لم يكونوا يرغبون سوى في التحقق من بريدهم الإلكتروني.


لماذا لا يمكن لأحد تقليد هذا النموذج؟


تصنيف البيانات مكلف جدًا. وجود شركات مثل Scale AI و Appen و Labelbox يهدف إلى حل هذه المشكلة، حيث توظف مئات الآلاف من العمال، وأحيانًا بأقل من دولار واحد في الساعة.


حل جوجل مختلف: جعلوا التسمية إلزامية. دون دفع أي رسوم، دون الحاجة إلى الموافقة، بل كـ"تذكرة" للوصول إلى كل زاوية من الإنترنت. النتيجة: مليارات الصور الموسومة، تغطية عالمية، طقس على مدار الساعة، كل مدينة في العالم. لا يمكن لأي شركة تسمية تحقيق ذلك. الإنترنت نفسها هي المصنع، وكل مستخدم للإنترنت هو موظف غير متعاقد.



ما زلت تشارك حتى الآن


تم إطلاق reCAPTCHA v3 في عام 2018 ولا يعرض حتى تحديات. إنه يحدد ما إذا كنت إنسانًا من خلال مراقبة طريقة تحريكك للماوس، وسرعة التمرير، ووقت البقاء. يتم إرسال بيانات السلوك هذه أيضًا إلى نظام الذكاء الاصطناعي التابع لجوجل.


لم تختار أبدًا الانضمام بشكل نشط، ولم يكن هناك مربع اختيار يمكنك التحقق منه أبدًا. لكن في هذه اللحظة، لا تزال تفعل ذلك على معظم المواقع التي تزورها.


سخرية مقلقة


كان نية لويس فون أهن عبقرية: تحويل الطاقة التي يُهدرها البشر بالفعل إلى إنتاج مفيد. لكن ما فعلته جوجل باستخدام هذا الرؤية أمر آخر تمامًا. فقد استغلت آلية الأمان التي يُجبر المستخدمون على استخدامها، ونشرتها على نطاق الويب بأكمله، وجمعَت الإنتاج لبناء منتج تجاري بقيمة مئات المليارات من الدولارات. ولم يحصل المستخدمون على أي شيء، بل ولم يكونوا على علم بذلك.


أعمق سخرية تكمن في أنك تقضي سنوات عديدة لإثبات أنك إنسان، من خلال إكمال مهام التعرف البصري التي لم تكن الذكاء الاصطناعي قادرًا على أدائها في ذلك الوقت. ولكن بمجرد أن تتعلم الذكاء الاصطناعي هذه المهارات، لم يعد هناك حاجة إلى التصنيف البصري البشري.


أثبتت أنك إنسان، لكن النتيجة كانت جعل نفسك قابلاً للاستبدال.


الرابط الأصلي


انقر لمعرفة الوظائف الشاغرة لدى BlockBeats


مرحبًا بانضمامك إلى المجتمع الرسمي لـ BlockBeats

قناة تيليغرام للاشتراك: https://t.me/theblockbeats

مجموعة Telegram للنقاش: https://t.me/BlockBeats_App

الحساب الرسمي على تويتر: https://twitter.com/BlockBeatsAsia

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.