คุณได้ฝึกฝน AI ของ Google มาแล้ว 15 ปี แต่คุณไม่รู้ตัว

ผู้เขียนต้นฉบับ: Sharbel ผู้ร่วมก่อตั้ง Unfungible

Lila, BlockBeats

บรรณาธิการ: CAPTCHA คือตัวเลขหรือรูปภาพที่คุณต้องคลิกทุกครั้งที่เข้าสู่เว็บไซต์ ซึ่งผู้ใช้อินเทอร์เน็ตทุกคนคุ้นเคยกันดี แต่เมื่อคุณคลิก「我不是机器人」ซ้ำแล้วซ้ำเล่า คุณอาจคิดว่าคุณแค่กำลังยืนยันตัวตน แต่ในความเป็นจริง คุณกำลังมีส่วนร่วมในการผลิตข้อมูลที่ใหญ่ที่สุดและลับที่สุดในโลก Luis von Ahn ได้เปิดตัว reCAPTCHA ซึ่งรวมพฤติกรรมของมนุษย์ที่กระจัดกระจายให้กลายเป็นรากฐานข้อมูลที่สนับสนุนธุรกิจหลักของ Google และบริษัทรถยนต์ขับเคลื่อนอัตโนมัติภายใต้เครือข่ายอย่าง Waymo

ภายใต้ภาพลักษณ์ของ “ฟรี” และ “ปลอดภัย” อินเทอร์เน็ตได้เปลี่ยนรูปแบบความสัมพันธ์ทางแรงงานอย่างเงียบๆ: คุณใช้เวลาพิสูจน์ว่าตัวเองเป็นมนุษย์ แต่กลับช่วยฝึกฝน AI และเมื่อ AI เรียนรู้แล้ว งานนี้ก็จะถูกแทนที่อย่างสมบูรณ์ บทความนี้เผยแพร่ไม่ถึง 20 ชั่วโมง แต่ได้รับการดูมากกว่า 9.5 ล้านครั้งบนทวิตเตอร์ ด้านล่างนี้คือเนื้อหาต้นฉบับ:

ทุกวันมีแรงงานมนุษย์ประมาณ 500,000 ชั่วโมงที่ถูกกูเกิลใช้โดยไม่เสียค่าใช้จ่าย ขณะที่ผู้ที่บริจาคแรงงานเหล่านี้ เพียงต้องการเข้าสู่ระบบธนาคารออนไลน์เท่านั้น

reCAPTCHA เป็นการดำเนินการข้อมูลแบบซ่อนเร้นที่ประสบความสำเร็จที่สุดในประวัติศาสตร์อินเทอร์เน็ต ในช่วงพีค มีผู้ใช้ 200 ล้านคนต่อวันที่ทำการยืนยันตัวตน แต่แทบไม่มีใครรู้ว่าแต่ละการคลิกมีความหมายอะไร

บริษัทรถยนต์ขับเคลื่อนอัตโนมัติของกูเกิล Waymo ปัจจุบันมีมูลค่าตลาด 45,000 ล้านดอลลาร์สหรัฐ และข้อมูลการฝึกอบรมหลักส่วนใหญ่ของมันมาจากคุณที่ให้ฟรีขณะเข้าเยี่ยมเว็บไซต์ต่างๆ

นี่คือเรื่องราวทั้งหมด:

จุดเริ่มต้น: แนวคิดที่ชาญฉลาด

ในปี 2000 บอทสแปมกำลังทำลายอินเทอร์เน็ต ฟอรัมถูกเติมข้อความไม่เกี่ยวข้อง กล่องจดหมายถูกเต็มไปด้วยอีเมล ไซต์ต่างๆ จึงต้องการวิธีแยกแยะระหว่างมนุษย์กับเครื่องจักร

ศาสตราจารย์ Luis von Ahn จากมหาวิทยาลัยคาร์เนกี เมลลอน ได้แก้ปัญหานี้ โดยคิดค้น CAPTCHA: ข้อความที่บิดเบี้ยวซึ่งมนุษย์สามารถอ่านได้ แต่หุ่นยนต์ไม่สามารถผ่านได้

แต่ von Ahn มองเห็นมากกว่านั้น ผู้คนนับล้านใช้พลังงานไปกับความท้าทายเหล่านี้ แล้วถ้าพลังงานนี้สามารถทำสองสิ่งพร้อมกันได้ล่ะ?

ในปี 2007 เขาได้เปิดตัว reCAPTCHA อีกครั้ง จุดเด่นของมันคือ: มันไม่ได้แสดงรหัสสุ่มอีกต่อไป แต่แสดงคำสองคำ หนึ่งคำคือระบบทราบอยู่แล้ว อีกคำคือคำจริงจากหนังสือที่สแกนซึ่งคอมพิวเตอร์ยังไม่สามารถระบุได้ และคำตอบของคุณช่วยในการดิจิทัลไลซ์หนังสือเหล่านี้

หนังสือเหล่านี้มาจากอาร์คไลฟ์ของนิวยอร์กไทมส์และกูเกิลบุ๊กส์ มากถึง 130 ล้านเล่ม

คุณคิดว่าคุณแค่กำลังล็อกอินเข้าสู่เว็บไซต์ทั่วไป แต่จริงๆ แล้วคุณกำลังช่วยทำ OCR (การรับรู้ตัวอักษรด้วยแสง) ให้กับห้องสมุดดิจิทัลที่ใหญ่ที่สุดในโลก

ในปี 2009 谷歌ได้ซื้อ reCAPTCHA

ต่อมา โกลเกิลได้เปลี่ยนกติกา

ยุคของข้อความที่บิดเบี้ยวสิ้นสุดลงประมาณปี 2012

Google กำลังเผชิญกับความท้าทายใหม่: รถสตรีทวิวถ่ายภาพทุกเส้นทางทั่วโลก แต่ภาพถ่ายเหล่านั้นเป็นเพียงข้อมูลดิบ ในการทำให้ AI ทำงานได้ ระบบต้องเข้าใจสิ่งที่เห็น: ป้ายจราจร เส้นทางข้ามทางม้าลาย ไฟจราจร และหน้าร้าน

ดังนั้น Google จึงออกแบบใหม่ reCAPTCHA v2 แทนที่ข้อความที่บิดเบี้ยวในภาพ จะเป็นตารางรูปภาพ “คลิกที่ช่องทั้งหมดที่มีไฟจราจร” “เลือกทางข้ามสำหรับคนเดินถนนทุกเส้น” “ระบุร้านค้า”

รูปภาพเหล่านี้มาจาก Google Street View โดยตรง การคลิกของคุณคือการติดป้าย

การเลือกแต่ละครั้งกำลังบอกโมเดลการมองเห็นของ Google ว่า: พิกเซลกลุ่มนี้คือไฟจราจร รูปร่างนั้นคือทางข้ามสำหรับคนเดินเท้า คุณไม่ได้กำลังผ่านการทดสอบ คุณกำลังสร้างชุดข้อมูล

ขนาดที่เกินจินตนาการ

ในช่วงสูงสุด มี reCAPTCHA ถูกแก้ไขวันละ 200 ล้านครั้ง แต่ละความท้าทายใช้เวลา 10 วินาที ซึ่งหมายความว่าสร้างแรงงานของมนุษย์วันละ 2 พันล้านวินาที หรือเท่ากับ: 500,000 ชั่วโมงต่อวัน

ต้นทุนการติดป้ายข้อมูลแบบจ่ายเงินอยู่ที่ประมาณ 10 ถึง 50 ดอลลาร์ต่อชั่วโมง โดยคำนวณตามมาตรฐานต่ำสุด: มูลค่าแรงงานที่ถูกดึงออกไปฟรีในแต่ละวันสูงถึง 5 ล้านดอลลาร์

และ reCAPTCHA ไม่ได้มีอยู่แค่ในแอปใดแอปหนึ่ง มันมีอยู่ทุกธนาคาร ทุกพอร์ทัลของรัฐบาล และทุกเว็บไซต์อีคอมเมิร์ซ คุณไม่มีทางเลือก: ต้องการเข้าสู่บัญชี? ต้องทำเครื่องหมายชุดข้อมูลก่อน โกลเกิลไม่เคยถามความเห็นคุณ ไม่เคยจ่ายเงินเดือนให้คุณแม้แต่บาทเดียว และยังไม่เคยแจ้งให้คุณรับรู้เรื่องนี้เลย

สิ่งเหล่านี้สร้างอะไรขึ้น?

ข้อมูลเหล่านี้ถูกป้อนโดยตรงไปยังผลิตภัณฑ์สองตัว:

- Google Maps: เครื่องมือนำทางที่ใช้มากที่สุดทั่วโลก ความสามารถในการระบุป้ายถนน ร้านค้า และภูมิศาสตร์ของเมืองนั้น ส่วนหนึ่งเกิดจากการทำเครื่องหมายโดยมนุษย์หลายพันล้านครั้งขณะลงชื่อเข้าใช้เว็บไซต์

Waymo: โครงการรถยนต์ไร้คนขับของ Google เพื่อการนำทางอย่างปลอดภัย รถยนต์ไร้คนขับจำเป็นต้องระบุรูปแบบภาพหลายพันรูปแบบได้เกือบสมบูรณ์แบบ

ข้อมูลการฝึกที่ใช้เป็นค่าจริงสำหรับงานการระบุนั้นถูกทำเครื่องหมายโดยผู้คนนับล้านโดยไม่รู้ตัวผ่าน reCAPTCHA Waymo ได้เสร็จสิ้นการเดินทางที่จ่ายเงินมากกว่า 4 ล้านครั้งในปี 2024 โดยมีมูลค่า 45 พันล้านดอลลาร์สหรัฐ รากฐานของมันถูกสร้างขึ้นโดยผู้ใช้อินเทอร์เน็ตที่ไม่ได้รับค่าตอบแทนซึ่งแค่ต้องการเช็กอีเมล

ทำไมใครๆ ถึงไม่สามารถลอกเลียนแบบรูปแบบนี้ได้?

การติดป้ายข้อมูลมีค่าใช้จ่ายสูงมาก บริษัทเช่น Scale AI, Appen และ Labelbox มีอยู่เพื่อแก้ไขปัญหานี้ โดยจ้างงานคนนับแสนคน บางครั้งจ่ายค่าจ้างต่ำกว่า 1 ดอลลาร์ต่อชั่วโมง

วิธีแก้ปัญหาของกูเกิลนั้นแตกต่างออกไป: พวกเขาทำให้การติดป้ายกลายเป็นสิ่งบังคับ ไม่ต้องจ่ายเงิน ไม่ต้องขอความยินยอม แต่เป็นเหมือนตั๋วเข้าสู่ทุกมุมของอินเทอร์เน็ต ผลลัพธ์คือ: รูปภาพที่ติดป้ายนับพันล้านภาพ การครอบคลุมทั่วโลก สภาพอากาศตลอด 24 ชั่วโมง และทุกเมืองในโลก ไม่มีบริษัทติดป้ายใดสามารถทำได้เช่นนี้ อินเทอร์เน็ตเองคือโรงงาน และผู้ใช้อินเทอร์เน็ตทุกคนคือพนักงานที่ไม่ได้ลงนามในสัญญา

คุณยังคงมีส่วนร่วมอยู่

reCAPTCHA v3 ที่เปิดตัวในปี 2018 ไม่แสดงความท้าทายอีกต่อไป มันตรวจสอบวิธีการเคลื่อนเมาส์ของคุณ ความเร็วในการเลื่อน และระยะเวลาที่คุณหยุดนิ่ง ข้อมูลพฤติกรรมของคุณจะแจ้งให้ระบบทราบว่าคุณเป็นมนุษย์หรือไม่ ข้อมูลพฤติกรรมเหล่านี้ยังถูกส่งกลับไปยังระบบ AI ของ Google อีกด้วย

คุณไม่เคยเลือกเข้าร่วมอย่างตั้งใจ ไม่เคยมีช่องทำเครื่องหมายให้คุณเลือก แต่ตอนนี้ บนเว็บไซต์ส่วนใหญ่ที่คุณเข้าชม คุณยังคงทำเช่นนั้นอยู่

ความขัดแย้งที่น่ากังวล

จุดมุ่งหมายเริ่มต้นของลุยส์ ฟอน อาห์นนั้นยอดเยี่ยม: แปลงพลังงานที่มนุษย์กำลังเสียเปล่าให้กลายเป็นผลผลิตที่มีประโยชน์ แต่สิ่งที่กูเกิลทำด้วยวิสัยทัศน์นี้กลับอีกเรื่องหนึ่ง พวกเขาใช้กลไกความปลอดภัยที่ผู้ใช้ต้องใช้ นำมันไปใช้งานทั่วทั้งเว็บ เพื่อเก็บเกี่ยวผลผลิตเหล่านั้นสร้างผลิตภัณฑ์เชิงพาณิชย์ที่มีมูลค่าหลายร้อยพันล้านดอลลาร์ ผู้ใช้ไม่ได้รับอะไรเลย แม้แต่ความรู้เกี่ยวกับสิ่งที่เกิดขึ้น

ความขัดแย้งที่ลึกซึ้งที่สุดคือ: คุณใช้เวลาหลายปีเพื่อพิสูจน์ว่าคุณเป็นมนุษย์ โดยทำงานการรับรู้ภาพที่ AI ในเวลานั้นยังทำไม่ได้ แต่เมื่อ AI เรียนรู้ทักษะเหล่านี้ได้ การทำเครื่องหมายภาพของมนุษย์ก็ไม่จำเป็นอีกต่อไป

คุณพิสูจน์ว่าตัวเองเป็นมนุษย์ แต่กลับทำให้ตัวเองสามารถถูกแทนที่ได้

Original link

คลิกเพื่อเรียนรู้ตำแหน่งที่律动BlockBeats กำลังรับสมัคร

ยินดีเข้าร่วมชุมชนอย่างเป็นทางการของ律动 BlockBeats:

กลุ่มสมัครรับข้อมูลบน Telegram: https://t.me/theblockbeats

กลุ่ม Telegram: https://t.me/BlockBeats_App

บัญชี Twitter อย่างเป็นทางการ：https://twitter.com/BlockBeatsAsia