Ang mga gumagamit ay nagsanay nang walang kaalaman sa AI ng Google sa loob ng 15 taon sa pamamagitan ng CAPTCHA

iconBlockbeats
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang AI + balita sa crypto ay naglalabas na ang reCAPTCHA, ang sikat na sistema ng CAPTCHA, ay nagtatrain ng AI ng Google nang higit sa 15 taon. Ang mga user ay hindi alam na naglalabel ng data para sa Google Maps at Waymo sa pamamagitan ng pagkumpleto ng mga hamon ng CAPTCHA. Sa kanyang pinakamataas, ang sistema ay nakalap ng 200 milyong segundo ng tao na lakas araw-araw—500,000 oras—nang walang kompensasyon. Ang impormasyon sa inflasyon at mga pag-unlad sa AI ay patuloy na nagpapabago sa tech at crypto landscape.
15 taon ka nang nagtatrain sa AI ng Google. Wala kang alam.
May-akda: Sharbel, co-founder ng Unfungible
Lila, BlockBeats


Editor's Note: Ang CAPTCHA, o ang mga numero o larawan na kailangan mong i-click bawat beses na mag-login sa isang website, ay pamilyar sa bawat internet user. Ngunit habang ikaw ay paulit-ulit na kiklik sa “Hindi ako robot,” akala mo lang na nagpapatotoo ka ng iyong pagkakakilanlan, sa katotohanan ay nakikilahok ka sa pinakamalaking at pinakamalikhaing produksyon ng data sa mundo. Ang reCAPTCHA na itinatag ni Luis von Ahn ay nagpagsasama-sama ng mga hiwa-hiwalay na gawain ng tao upang mabuo ang pundasyon ng data na sumusuporta sa mga pangunahing negosyo ng Google at ng kanyang autonomous car company, Waymo.


Sa ilalim ng mga panlabas na “libre” at “ligtas”, ang internet ay tahimik na binago ang isang bagong uri ng ugnayang pang-ekonomiya: ginugugol mo ang iyong oras upang patunayan na ikaw ay tao, ngunit nagbibigay ka ng kontribusyon sa pagtuturo ng AI, at kapag natutunan na ng AI, ang ganitong paggawa ay ganap na nalilipat. Ang artikulong ito, naitala lamang sa loob ng 20 oras, ay nakakuha na ng higit sa 9.5 milyong pagtingin sa Twitter. Narito ang orihinal na nilalaman:


Lumalabas na halos 500,000 na oras ng paggawa ng tao araw-araw, na ginagamit nang libre ng Google. At ang mga nagbibigay nito, simpleng nais lang mag-login sa kanilang online banking.


Ang reCAPTCHA ay ang pinakamatagumpay na lihim na operasyon sa data sa kasaysayan ng internet. Sa kanyang pinakamataas na antas, araw-araw ay may 200 milyong tao ang natatapos ang pag-verify. Ngunit halos walang nakakaalam kung ano ang ibig sabihin ng bawat pag-click.


Ang Waymo, ang kompanya ng autonomous driving ng Google, ay may kasalukuyang halaga ng $45 bilyon. At ang karamihan sa kanilang pangunahing data para sa pagtuturo ay ibinigay mo nang libre sa pagbisita sa iba’t ibang website.


Narito ang buong kuwento:


Nagmula sa: isang matalinong ideya


Noong 2000, ang mga spam bot ay nagpapahamak sa internet. Ang mga forum ay napapuno ng spam, ang mga inbox ay nabubuksan, at ang mga website ay nangangailangan ng isang paraan upang makadistingguho sa pagitan ng tao at makina.


Inayos ng propesor na si Luis von Ahn ng Carnegie Mellon University ang problema na ito. Ipinagawa niya ang CAPTCHA: isang distorted text na only human can read, na hindi kayang pasanin ng robot.


Ngunit nakikita ni von Ahn ang higit pa sa mga ito. Milyon-milyon ang nagugugol ng kanilang enerhiya sa mga hamon na ito. Kung ang enerhiyang ito ay maaaring gawin ang dalawang bagay nang sabay-sabay?


Noong 2007, ipinakilala niya ang reCAPTCHA. Ang kahusayan nito ay: hindi ito nagpapakita ng random na kodigo, kundi dalawang salita. Isa ay alam ng sistema, at ang isa ay totoong iskanned na libro na hindi pa kayang kilalanin ng computer. At ang iyong sagot ay tumutulong sa pagdigitize ng mga aklat na ito.


Ang mga aklat na ito ay galing sa arkibo ng The New York Times at Google Books, hanggang 130 milyon.


Isipin mong naglo-login ka lang sa isang karaniwang website, ngunit nag-o-OCR ka pala (optical character recognition) para sa pinakamalaking digital library sa buong mundo.


Noong 2009, kinuha ng Google ang reCAPTCHA.



Pagkatapos ay binago ng Google ang palabas


Nawala ang panahon ng “distorted text” noong paligid ng 2012.


Bagong hamon ang kinakaharap ng Google: ang mga sasakyan ng Street View ay nakuha ang larawan ng bawat daan sa buong mundo, ngunit ang mga litrato ay nagiging orihinal na data lamang. Upang makapagpapanaig ang AI, kailangan itong maunawaan ang mga nakikita nito: mga palatandaan sa daan, mga takip-silid, mga ilaw sa krus, at mga pinto ng tindahan.


Kaya binago ng Google ang reCAPTCHA v2. Sa lugar ng distorted text, mayroon ng grid ng mga larawan. “I-click ang lahat ng mga kahon na may traffic light.” “Piliin ang bawat zebra crossing.” “Identipikahin ang mga tindahan.”


Ang mga larawang ito ay direktang galing sa Google Street View. Ang iyong pag-click ay ang label.


Bawat pagpili ay nagpapahayag sa modelo ng computer vision ng Google: ang grupo ng pixels na ito ay isang traffic light, ang hugis na iyon ay isang zebra crossing. Hindi ka nagpapasa sa pagsusulit, ikaw ay nagbuo ng dataset.



Mas malaki kaysa sa imahinasyon


Sa kanyang pinakamataas na punto, 200 milyon na reCAPTCHA ang nalulutas araw-araw. Bawat hamon ay nagtatagal ng 10 segundo, na nangangahulugan na 2 milyardong segundo ng tao ay ginagawa araw-araw. Ito ay: 500,000 oras araw-araw.


Ang gastos sa pag-annotate ng data na may bayad ay humigit-kumulang $10 hanggang $50 bawat oras. Batay sa pinakamababang pamantayan: ang halaga ng paggawa na kinuha nang libre ay umabot sa $5 milyon araw-araw.


At hindi lang ito nasa isang app. Ito ay nasa bawat banko, bawat gobyernong portal, at bawat e-commerce website. Walang pagpipilian ka: gustong makapasok sa iyong account? Unahin ang pag-annotation ng dataset. Hindi nagtanong ang Google sa iyong opinyon, hindi nagbigay ng isang sentimo sa salary, at hindi pa man nagpaalam sa iyo.



Ano ang naidulot ng lahat ng ito?


Direktang ibinigay ang mga data sa dalawang produkto:


- Google Maps: Ang pinakamalawak na ginagamit na tool sa pag-navigate sa buong mundo. Ang kanyang kakayahang makilala ang mga palatandaan sa kalsada, mga tindahan, at heograpiya ng mga lungsod ay bahagyang dahil sa milyon-milyon na paglalagay ng mga tanda ng mga tao habang nakalagay sa website.


-Waymo: Ang proyektong walang driver ng Google. Para sa ligtas na pag-navigate, kailangan ng mga kotse na walang driver ang pagkilala sa halos perpektong libu-libong uri ng visual pattern.


Ang mga totoong data para sa pagtuturo ng pagkilala sa mga gawain ay tinitiyak ng mga milyon-milyong tao na hindi nila alam na nagpapakita sila ng reCAPTCHA. Nakumpleto ni Waymo ang higit sa 4 milyong bayad na biyahe noong 2024, na may halagang $45 bilyon. Ang pundasyon nito, ay itinatag ng mga "walang bayad na netizen" na nais lang mag-check ng kanilang email.


Bakit walang makakapag-kopya ng ganitong modelo?


Ang pag-annotate ng data ay napakakostoso. Ang pagkakaroon ng mga kumpanya tulad ng Scale AI, Appen, at Labelbox ay para sa paglutas ng problema na ito, kung saan sila ay nagpapahingi ng mga dekada-dekada libo-libong manggagawa, minsan ay may kapalit na mas mababa sa $1 kada oras.


Ang solusyon ng Google ay nagsikap sa ibang paraan: ginawa nilang mandatory ang paglalabel. Walang bayad, walang pahintulot—ito ay naging “paparating” para sa bawat sulok ng internet. Ang resulta: milyon-milyon na may-label na imahe, global na sakop, 24/7 na panahon, bawat lungsod sa mundo. Walang kompanya ng paglalabel ang makakagawa nito. Ang internet mismo ang gawaan, at bawat netizen ay isang manggagawa na walang kontrata.



Nakikilahok ka pa rin hanggang ngayon


Ang reCAPTCHA v3 na ipinakilala noong 2018 ay hindi na nagpapakita ng anumang hamon. Ipinapakita nito kung ikaw ay tao sa pamamagitan ng pagmamasid sa paraan kung paano mo ginagalaw ang mouse, bilis ng pag-scroll, at panahon ng paghihintay. Ang mga datos sa pag-uugali ay iiwan din sa sistema ng AI ng Google.


Hindi ka aktibong pumili na sumali, walang checkbox na iyong maipipili. Ngunit ngayon, sa karamihan sa mga website na binabasa mo, patuloy ka pa ring gumagawa nito.


Malalim na pagkakasala


Ang intensyon ni Luis von Ahn ay geniyo: ang pagpapalit ng enerhiya na karaniwang nasasayang ng tao sa isang makabuluhang produkto. Ngunit ang ginawa ng Google sa pamamagitan ng pananaw na ito ay iba. Ginamit nila ang security mechanism na kailangan ng mga user na gamitin, ipinatupad ito sa buong web, at kinuha ang mga produkto upang bumuo ng isang komersyal na produkto na may halagang milyon-milyon dolyar. Walang natanggap ang mga user, kahit isang bagay.


Ang pinakamalalim na pagkakataon ay: ginugol mo ang ilang taon upang patunayan na ikaw ay tao, sa pamamagitan ng pagkumpleto ng mga gawain sa pagkilala sa imahe na hindi pa kayang gawin ng AI noong panahong iyon. At agad na kapag natutunan ng AI ang mga ito, hindi na kailangan ang mga tao para mag-label ng mga imahe.


Ipinatunay mo na ikaw ay tao, ngunit nagresulta ito sa pagiging mapalitan mo.


Original link


I-click para malaman ang mga posisyon na inaangkin ng BlockBeats


Maligayang pagdating sa opisyal na komunidad ng BlockBeats:

Telegram subscription group: https://t.me/theblockbeats

Telegram group: https://t.me/BlockBeats_App

Twitter official account: https://twitter.com/BlockBeatsAsia

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.