Pengguna Secara Tidak Sengaja Melatih AI Google Selama 15 Tahun Melalui CAPTCHA

iconBlockbeats
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita AI + kripto mengungkap bahwa reCAPTCHA, sistem CAPTCHA yang populer, telah melatih AI Google selama lebih dari 15 tahun. Pengguna tanpa sadar memberi label pada data untuk Google Maps dan Waymo dengan menyelesaikan tantangan CAPTCHA. Pada puncaknya, sistem ini mengumpulkan 200 juta detik tenaga kerja manusia setiap hari—500.000 jam—tanpa kompensasi. Data inflasi dan kemajuan AI terus membentuk lanskap teknologi dan kripto.
Anda telah melatih AI Google selama 15 tahun. Anda tidak tahu.
Penulis asli: Sharbel, Co-founder Unfungible
Lila, BlockBeats


Editor's note: CAPTCHA, the numbers or patterns you click every time you log into a website, is something every internet user is familiar with. But each time you click "I'm not a robot," you think you're simply verifying your identity—when in fact, you're participating in the world's largest and most covert data production. Luis von Ahn's reCAPTCHA has aggregated fragmented human actions into the foundational data supporting Google's core businesses, including its autonomous driving company Waymo.


Di balik ilusi "gratis" dan "aman", internet secara diam-diam membentuk hubungan kerja baru: Anda menghabiskan waktu membuktikan bahwa Anda adalah manusia, namun justru memberikan kontribusi untuk pelatihan AI, dan begitu AI belajar, tenaga kerja Anda langsung digantikan. Artikel ini dipublikasikan kurang dari 20 jam yang lalu dan telah meraih lebih dari 9,5 juta tayangan di Twitter. Berikut adalah konten aslinya:


Sekitar 500.000 jam tenaga kerja manusia dimanfaatkan secara gratis oleh Google setiap hari. Dan orang-orang yang menyumbangkan ini hanyalah ingin login ke perbankan online.


reCAPTCHA adalah operasi data tersembunyi paling sukses dalam sejarah internet. Pada puncaknya, 200 juta orang menyelesaikan verifikasi setiap hari. Tetapi hampir tidak ada yang menyadari apa arti di balik setiap klik.


Perusahaan mobil otonom Google, Waymo, kini memiliki nilai pasar sebesar 45 miliar dolar AS. Sebagian besar data pelatihan intinya berasal dari informasi gratis yang Anda berikan saat menjelajahi berbagai situs web.


Berikut adalah cerita lengkapnya:


Latar belakang: Sebuah gagasan cerdas


Pada tahun 2000, bot spam sedang menghancurkan internet. Forum dipenuhi dengan spam, kotak masuk penuh sesak, dan situs web sangat membutuhkan cara untuk membedakan manusia dari mesin.


Profesor Luis von Ahn dari Carnegie Mellon University memecahkan masalah ini. Ia menemukan CAPTCHA: teks terdistorsi yang hanya bisa dibaca oleh manusia, tidak bisa dilewati oleh robot.


Tetapi von Ahn melihat lebih dari itu. Jutaan orang menghabiskan energi mereka dalam tantangan-tantangan ini. Bagaimana jika energi semacam ini bisa digunakan untuk melakukan dua hal sekaligus?


Pada tahun 2007, ia meluncurkan reCAPTCHA. Kehebatannya terletak pada fakta bahwa ia tidak lagi menampilkan kode acak, melainkan dua kata: satu yang sudah diketahui sistem, dan satu lagi adalah kata nyata dari buku yang dipindai yang belum bisa dikenali komputer. Jawaban Anda membantu proses digitalisasi buku-buku tersebut.


Buku-buku ini berasal dari arsip The New York Times dan Google Books, hingga 130 juta judul.


Anda mengira Anda hanya masuk ke situs web biasa, padahal Anda sedang melakukan OCR (Optical Character Recognition) untuk perpustakaan digital terbesar di dunia.


Pada tahun 2009, Google mengakuisisi reCAPTCHA.



Kemudian, Google mengubah aturan permainan


Era teks terdistorsi berakhir sekitar tahun 2012.


Google menghadapi tantangan baru: kendaraan Street View telah memotret setiap jalan di seluruh dunia, tetapi foto-foto tersebut hanyalah data mentah. Agar AI dapat berfungsi, ia perlu memahami apa yang dilihatnya: rambu jalan, zebra cross, lampu lalu lintas, dan fasad toko.


Jadi, Google mendesain ulang reCAPTCHA v2. Alih-alih teks yang terdistorsi, gambar berupa kisi foto. “Klik semua kotak yang berisi lampu lalu lintas.” “Pilih setiap zebra cross.” “Kenali toko.”


Gambar-gambar ini langsung berasal dari Google Street View. Klik Anda adalah tag.


Setiap pilihan memberi tahu model komputer vision Google: kelompok piksel ini adalah lampu lalu lintas, bentuk itu adalah zebra cross. Anda tidak sedang mengikuti ujian, Anda sedang membangun dataset.



Skala yang melampaui bayangan


Pada masa puncaknya, 200 juta reCAPTCHA dibuka setiap hari. Setiap tantangan memakan waktu 10 detik, yang berarti menghasilkan 2 miliar detik tenaga kerja manusia setiap hari. Yaitu: 500.000 jam per hari.


Biaya annotasi data berbayar sekitar $10 hingga $50 per jam. Berdasarkan standar terendah: nilai tenaga kerja yang diekstraksi secara gratis mencapai hingga $5 juta per hari.


Dan reCAPTCHA tidak hanya ada di satu aplikasi. Itu ada di setiap bank, setiap portal pemerintah, setiap situs e-commerce. Anda tidak punya pilihan: ingin login akun? Silakan label dataset terlebih dahulu. Google tidak pernah meminta pendapat Anda, tidak membayar satu sen pun, bahkan tidak pernah memberi tahu Anda tentang hal ini.



What has all of this created?


Data ini langsung diberikan ke dua produk:


- Google Maps: alat navigasi paling banyak digunakan di dunia. Kemampuannya mengenali rambu jalan, toko, dan geografi kota sebagian besar berkat pelabelan oleh miliaran manusia saat masuk ke situs web.


-Waymo: Proyek mobil tanpa pengemudi Google. Untuk navigasi yang aman, mobil otonom perlu mengenali ribuan pola visual hampir sempurna.


Data pelatihan ground truth untuk tugas pengenalan tersebut secara tepat ditandai oleh jutaan orang tanpa sadar melalui reCAPTCHA. Waymo menyelesaikan lebih dari 4 juta perjalanan berbayar pada tahun 2024, dengan valuasi $45 miliar. Fondasinya dibangun oleh para 'warga internet sukarela' yang hanya ingin memeriksa email mereka.


Mengapa tidak ada yang bisa meniru pola ini?


Pemberian label data sangat mahal. Keberadaan perusahaan seperti Scale AI, Appen, dan Labelbox bertujuan untuk menyelesaikan masalah ini, dengan mempekerjakan ratusan ribu pekerja, yang terkadang dibayar kurang dari 1 dolar per jam.


Solusi Google berbeda: mereka menjadikan pelabelan sebagai hal yang wajib. Tanpa biaya, tanpa persetujuan, tetapi sebagai "tiket" untuk masuk ke setiap sudut internet. Hasilnya: miliaran gambar yang dilabeli, cakupan global, cuaca 24/7, setiap kota di dunia. Tidak ada perusahaan pelabelan yang bisa mencapai hal ini. Internet sendiri adalah pabrik, dan setiap pengguna internet adalah karyawan tanpa kontrak.



Anda masih berpartisipasi hingga sekarang


reCAPTCHA v3 yang diluncurkan pada 2018 bahkan tidak lagi menampilkan tantangan. Ia mengamati cara Anda menggerakkan mouse, kecepatan gulir, dan durasi waktu Anda berhenti. Sidik jari perilaku Anda akan memberi tahu sistem apakah Anda manusia. Data perilaku ini juga dikirimkan kembali ke sistem AI Google.


Anda tidak pernah secara aktif memilih untuk bergabung, tidak pernah ada kotak centang yang tersedia untuk Anda centang. Namun, saat ini, di sebagian besar situs web yang Anda kunjungi, Anda tetap melakukannya.


Ironi yang mengganggu


Niat awal Luis von Ahn adalah brilian: mengubah energi yang sebenarnya dibuang manusia menjadi output yang bermanfaat. Namun, tindakan yang dilakukan Google berdasarkan visi ini adalah hal lain. Mereka memanfaatkan mekanisme keamanan yang harus digunakan pengguna, menerapkannya di seluruh web, dan memanen hasilnya untuk membangun produk bisnis bernilai ratusan miliar dolar. Pengguna tidak mendapatkan apa-apa, bahkan tidak menyadarinya.


Ironi terdalam adalah: Anda menghabiskan bertahun-tahun membuktikan bahwa Anda adalah manusia dengan menyelesaikan pekerjaan pengenalan visual yang pada saat itu belum bisa dilakukan AI. Namun, begitu AI belajar melakukannya, annotasi visual manusia tidak lagi diperlukan.


Kamu membuktikan bahwa kamu manusia, tapi justru membuat dirimu bisa digantikan.


Original link


Klik untuk mengetahui posisi yang sedang dibuka oleh BlockBeats


Selamat bergabung dengan komunitas resmi BlockBeats:

Grup langganan Telegram: https://t.me/theblockbeats

Grup Telegram: https://t.me/BlockBeats_App

Akun resmi Twitter: https://twitter.com/BlockBeatsAsia

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.