ผู้ใช้ได้ฝึกสอนปัญญาประดิษฐ์ของกูเกิลโดยไม่รู้ตัวเป็นเวลา 15 ปีผ่าน CAPTCHA

iconBlockbeats
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ข่าว AI และคริปโตเปิดเผยว่า reCAPTCHA ระบบ CAPTCHA ที่ได้รับความนิยม ได้ฝึกฝน AI ของ Google มาเกิน 15 ปีแล้ว ผู้ใช้ได้ระบุข้อมูลให้กับ Google Maps และ Waymo โดยไม่รู้ตัวผ่านการแก้โจทย์ reCAPTCHA ในช่วงสูงสุด ระบบดังกล่าวรวบรวมแรงงานมนุษย์ได้ถึง 200 ล้านวินาทีต่อวัน—เทียบเท่า 500,000 ชั่วโมง—โดยไม่มีค่าตอบแทน ข้อมูลเงินเฟ้อและการพัฒนาด้าน AI ยังคงมีผลต่อภูมิทัศน์ของเทคโนโลยีและคริปโต
คุณได้ฝึกฝน AI ของ Google มาแล้ว 15 ปี แต่คุณไม่รู้ตัว
ผู้เขียนต้นฉบับ: Sharbel ผู้ร่วมก่อตั้ง Unfungible
Lila, BlockBeats


บรรณาธิการ: CAPTCHA คือตัวเลขหรือรูปภาพที่คุณต้องคลิกทุกครั้งที่เข้าสู่เว็บไซต์ ซึ่งผู้ใช้อินเทอร์เน็ตทุกคนคุ้นเคยกันดี แต่เมื่อคุณคลิก「我不是机器人」ซ้ำแล้วซ้ำเล่า คุณอาจคิดว่าคุณแค่กำลังยืนยันตัวตน แต่ในความเป็นจริง คุณกำลังมีส่วนร่วมในการผลิตข้อมูลที่ใหญ่ที่สุดและลับที่สุดในโลก Luis von Ahn ได้เปิดตัว reCAPTCHA ซึ่งรวมพฤติกรรมของมนุษย์ที่กระจัดกระจายให้กลายเป็นรากฐานข้อมูลที่สนับสนุนธุรกิจหลักของ Google และบริษัทรถยนต์ขับเคลื่อนอัตโนมัติภายใต้เครือข่ายอย่าง Waymo


ภายใต้ภาพลักษณ์ของ “ฟรี” และ “ปลอดภัย” อินเทอร์เน็ตได้เปลี่ยนรูปแบบความสัมพันธ์ทางแรงงานอย่างเงียบๆ: คุณใช้เวลาพิสูจน์ว่าตัวเองเป็นมนุษย์ แต่กลับช่วยฝึกฝน AI และเมื่อ AI เรียนรู้แล้ว งานนี้ก็จะถูกแทนที่อย่างสมบูรณ์ บทความนี้เผยแพร่ไม่ถึง 20 ชั่วโมง แต่ได้รับการดูมากกว่า 9.5 ล้านครั้งบนทวิตเตอร์ ด้านล่างนี้คือเนื้อหาต้นฉบับ:


ทุกวันมีแรงงานมนุษย์ประมาณ 500,000 ชั่วโมงที่ถูกกูเกิลใช้โดยไม่เสียค่าใช้จ่าย ขณะที่ผู้ที่บริจาคแรงงานเหล่านี้ เพียงต้องการเข้าสู่ระบบธนาคารออนไลน์เท่านั้น


reCAPTCHA เป็นการดำเนินการข้อมูลแบบซ่อนเร้นที่ประสบความสำเร็จที่สุดในประวัติศาสตร์อินเทอร์เน็ต ในช่วงพีค มีผู้ใช้ 200 ล้านคนต่อวันที่ทำการยืนยันตัวตน แต่แทบไม่มีใครรู้ว่าแต่ละการคลิกมีความหมายอะไร


บริษัทรถยนต์ขับเคลื่อนอัตโนมัติของกูเกิล Waymo ปัจจุบันมีมูลค่าตลาด 45,000 ล้านดอลลาร์สหรัฐ และข้อมูลการฝึกอบรมหลักส่วนใหญ่ของมันมาจากคุณที่ให้ฟรีขณะเข้าเยี่ยมเว็บไซต์ต่างๆ


นี่คือเรื่องราวทั้งหมด:


จุดเริ่มต้น: แนวคิดที่ชาญฉลาด


ในปี 2000 บอทสแปมกำลังทำลายอินเทอร์เน็ต ฟอรัมถูกเติมข้อความไม่เกี่ยวข้อง กล่องจดหมายถูกเต็มไปด้วยอีเมล ไซต์ต่างๆ จึงต้องการวิธีแยกแยะระหว่างมนุษย์กับเครื่องจักร


ศาสตราจารย์ Luis von Ahn จากมหาวิทยาลัยคาร์เนกี เมลลอน ได้แก้ปัญหานี้ โดยคิดค้น CAPTCHA: ข้อความที่บิดเบี้ยวซึ่งมนุษย์สามารถอ่านได้ แต่หุ่นยนต์ไม่สามารถผ่านได้


แต่ von Ahn มองเห็นมากกว่านั้น ผู้คนนับล้านใช้พลังงานไปกับความท้าทายเหล่านี้ แล้วถ้าพลังงานนี้สามารถทำสองสิ่งพร้อมกันได้ล่ะ?


ในปี 2007 เขาได้เปิดตัว reCAPTCHA อีกครั้ง จุดเด่นของมันคือ: มันไม่ได้แสดงรหัสสุ่มอีกต่อไป แต่แสดงคำสองคำ หนึ่งคำคือระบบทราบอยู่แล้ว อีกคำคือคำจริงจากหนังสือที่สแกนซึ่งคอมพิวเตอร์ยังไม่สามารถระบุได้ และคำตอบของคุณช่วยในการดิจิทัลไลซ์หนังสือเหล่านี้


หนังสือเหล่านี้มาจากอาร์คไลฟ์ของนิวยอร์กไทมส์และกูเกิลบุ๊กส์ มากถึง 130 ล้านเล่ม


คุณคิดว่าคุณแค่กำลังล็อกอินเข้าสู่เว็บไซต์ทั่วไป แต่จริงๆ แล้วคุณกำลังช่วยทำ OCR (การรับรู้ตัวอักษรด้วยแสง) ให้กับห้องสมุดดิจิทัลที่ใหญ่ที่สุดในโลก


ในปี 2009 谷歌ได้ซื้อ reCAPTCHA



ต่อมา โกลเกิลได้เปลี่ยนกติกา


ยุคของข้อความที่บิดเบี้ยวสิ้นสุดลงประมาณปี 2012


Google กำลังเผชิญกับความท้าทายใหม่: รถสตรีทวิวถ่ายภาพทุกเส้นทางทั่วโลก แต่ภาพถ่ายเหล่านั้นเป็นเพียงข้อมูลดิบ ในการทำให้ AI ทำงานได้ ระบบต้องเข้าใจสิ่งที่เห็น: ป้ายจราจร เส้นทางข้ามทางม้าลาย ไฟจราจร และหน้าร้าน


ดังนั้น Google จึงออกแบบใหม่ reCAPTCHA v2 แทนที่ข้อความที่บิดเบี้ยวในภาพ จะเป็นตารางรูปภาพ “คลิกที่ช่องทั้งหมดที่มีไฟจราจร” “เลือกทางข้ามสำหรับคนเดินถนนทุกเส้น” “ระบุร้านค้า”


รูปภาพเหล่านี้มาจาก Google Street View โดยตรง การคลิกของคุณคือการติดป้าย


การเลือกแต่ละครั้งกำลังบอกโมเดลการมองเห็นของ Google ว่า: พิกเซลกลุ่มนี้คือไฟจราจร รูปร่างนั้นคือทางข้ามสำหรับคนเดินเท้า คุณไม่ได้กำลังผ่านการทดสอบ คุณกำลังสร้างชุดข้อมูล



ขนาดที่เกินจินตนาการ


ในช่วงสูงสุด มี reCAPTCHA ถูกแก้ไขวันละ 200 ล้านครั้ง แต่ละความท้าทายใช้เวลา 10 วินาที ซึ่งหมายความว่าสร้างแรงงานของมนุษย์วันละ 2 พันล้านวินาที หรือเท่ากับ: 500,000 ชั่วโมงต่อวัน


ต้นทุนการติดป้ายข้อมูลแบบจ่ายเงินอยู่ที่ประมาณ 10 ถึง 50 ดอลลาร์ต่อชั่วโมง โดยคำนวณตามมาตรฐานต่ำสุด: มูลค่าแรงงานที่ถูกดึงออกไปฟรีในแต่ละวันสูงถึง 5 ล้านดอลลาร์


และ reCAPTCHA ไม่ได้มีอยู่แค่ในแอปใดแอปหนึ่ง มันมีอยู่ทุกธนาคาร ทุกพอร์ทัลของรัฐบาล และทุกเว็บไซต์อีคอมเมิร์ซ คุณไม่มีทางเลือก: ต้องการเข้าสู่บัญชี? ต้องทำเครื่องหมายชุดข้อมูลก่อน โกลเกิลไม่เคยถามความเห็นคุณ ไม่เคยจ่ายเงินเดือนให้คุณแม้แต่บาทเดียว และยังไม่เคยแจ้งให้คุณรับรู้เรื่องนี้เลย



สิ่งเหล่านี้สร้างอะไรขึ้น?


ข้อมูลเหล่านี้ถูกป้อนโดยตรงไปยังผลิตภัณฑ์สองตัว:


- Google Maps: เครื่องมือนำทางที่ใช้มากที่สุดทั่วโลก ความสามารถในการระบุป้ายถนน ร้านค้า และภูมิศาสตร์ของเมืองนั้น ส่วนหนึ่งเกิดจากการทำเครื่องหมายโดยมนุษย์หลายพันล้านครั้งขณะลงชื่อเข้าใช้เว็บไซต์


Waymo: โครงการรถยนต์ไร้คนขับของ Google เพื่อการนำทางอย่างปลอดภัย รถยนต์ไร้คนขับจำเป็นต้องระบุรูปแบบภาพหลายพันรูปแบบได้เกือบสมบูรณ์แบบ


ข้อมูลการฝึกที่ใช้เป็นค่าจริงสำหรับงานการระบุนั้นถูกทำเครื่องหมายโดยผู้คนนับล้านโดยไม่รู้ตัวผ่าน reCAPTCHA Waymo ได้เสร็จสิ้นการเดินทางที่จ่ายเงินมากกว่า 4 ล้านครั้งในปี 2024 โดยมีมูลค่า 45 พันล้านดอลลาร์สหรัฐ รากฐานของมันถูกสร้างขึ้นโดยผู้ใช้อินเทอร์เน็ตที่ไม่ได้รับค่าตอบแทนซึ่งแค่ต้องการเช็กอีเมล


ทำไมใครๆ ถึงไม่สามารถลอกเลียนแบบรูปแบบนี้ได้?


การติดป้ายข้อมูลมีค่าใช้จ่ายสูงมาก บริษัทเช่น Scale AI, Appen และ Labelbox มีอยู่เพื่อแก้ไขปัญหานี้ โดยจ้างงานคนนับแสนคน บางครั้งจ่ายค่าจ้างต่ำกว่า 1 ดอลลาร์ต่อชั่วโมง


วิธีแก้ปัญหาของกูเกิลนั้นแตกต่างออกไป: พวกเขาทำให้การติดป้ายกลายเป็นสิ่งบังคับ ไม่ต้องจ่ายเงิน ไม่ต้องขอความยินยอม แต่เป็นเหมือนตั๋วเข้าสู่ทุกมุมของอินเทอร์เน็ต ผลลัพธ์คือ: รูปภาพที่ติดป้ายนับพันล้านภาพ การครอบคลุมทั่วโลก สภาพอากาศตลอด 24 ชั่วโมง และทุกเมืองในโลก ไม่มีบริษัทติดป้ายใดสามารถทำได้เช่นนี้ อินเทอร์เน็ตเองคือโรงงาน และผู้ใช้อินเทอร์เน็ตทุกคนคือพนักงานที่ไม่ได้ลงนามในสัญญา



คุณยังคงมีส่วนร่วมอยู่


reCAPTCHA v3 ที่เปิดตัวในปี 2018 ไม่แสดงความท้าทายอีกต่อไป มันตรวจสอบวิธีการเคลื่อนเมาส์ของคุณ ความเร็วในการเลื่อน และระยะเวลาที่คุณหยุดนิ่ง ข้อมูลพฤติกรรมของคุณจะแจ้งให้ระบบทราบว่าคุณเป็นมนุษย์หรือไม่ ข้อมูลพฤติกรรมเหล่านี้ยังถูกส่งกลับไปยังระบบ AI ของ Google อีกด้วย


คุณไม่เคยเลือกเข้าร่วมอย่างตั้งใจ ไม่เคยมีช่องทำเครื่องหมายให้คุณเลือก แต่ตอนนี้ บนเว็บไซต์ส่วนใหญ่ที่คุณเข้าชม คุณยังคงทำเช่นนั้นอยู่


ความขัดแย้งที่น่ากังวล


จุดมุ่งหมายเริ่มต้นของลุยส์ ฟอน อาห์นนั้นยอดเยี่ยม: แปลงพลังงานที่มนุษย์กำลังเสียเปล่าให้กลายเป็นผลผลิตที่มีประโยชน์ แต่สิ่งที่กูเกิลทำด้วยวิสัยทัศน์นี้กลับอีกเรื่องหนึ่ง พวกเขาใช้กลไกความปลอดภัยที่ผู้ใช้ต้องใช้ นำมันไปใช้งานทั่วทั้งเว็บ เพื่อเก็บเกี่ยวผลผลิตเหล่านั้นสร้างผลิตภัณฑ์เชิงพาณิชย์ที่มีมูลค่าหลายร้อยพันล้านดอลลาร์ ผู้ใช้ไม่ได้รับอะไรเลย แม้แต่ความรู้เกี่ยวกับสิ่งที่เกิดขึ้น


ความขัดแย้งที่ลึกซึ้งที่สุดคือ: คุณใช้เวลาหลายปีเพื่อพิสูจน์ว่าคุณเป็นมนุษย์ โดยทำงานการรับรู้ภาพที่ AI ในเวลานั้นยังทำไม่ได้ แต่เมื่อ AI เรียนรู้ทักษะเหล่านี้ได้ การทำเครื่องหมายภาพของมนุษย์ก็ไม่จำเป็นอีกต่อไป


คุณพิสูจน์ว่าตัวเองเป็นมนุษย์ แต่กลับทำให้ตัวเองสามารถถูกแทนที่ได้


Original link


คลิกเพื่อเรียนรู้ตำแหน่งที่律动BlockBeats กำลังรับสมัคร


ยินดีเข้าร่วมชุมชนอย่างเป็นทางการของ律动 BlockBeats:

กลุ่มสมัครรับข้อมูลบน Telegram: https://t.me/theblockbeats

กลุ่ม Telegram: https://t.me/BlockBeats_App

บัญชี Twitter อย่างเป็นทางการ:https://twitter.com/BlockBeatsAsia

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา