グローバルで数千人がプライバシーのリスクを冒してAIトレーニングのために個人データを販売

iconTechFlow
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
グローバルなAIと暗号通貨のニュースでは、南アフリカからインド、米国に至るまで、多くの人々が声、顔、プライベートなチャットといった個人データをわずかな報酬で販売していることが示されている。これらの貢献者は、Kled AIやNeon Mobileなどのプラットフォームを支えている。期間には、企業がデータを永久に使用できるという条項が含まれることが多く、プライバシーへの懸念を招いている。インフレーションデータや市場需要がこの傾向を後押ししており、AIモデルは膨大なデータセットを必要としている。リスクにはディープフェイクや身元盗用が含まれ、ユーザーにはほとんどコントロール権がない。

著者:The Guardian

翻訳:深潮 TechFlow

深潮ガイド:この調査報道は、数千人の人々が自分の声、顔、通話記録、日常の動画を販売してAIトレーニング費用を稼ぐという、急速に拡大するグレーゾーン産業を明らかにしています。

これは抽象的なプライバシー問題の議論ではなく、実在の人物、実際の金額、実際の結果を伴う調査である——自らの顔を売った俳優が、Instagramで自分自身が不明な医療製品を宣伝しているのを見て、コメント欄に自分の「外見」についての評価が寄せられている。

AI企業のデータへの渇望と世界経済の格差が組み合わさり、不平等な取引を生み出している。

全文は以下の通りです:

昨年のある朝、南アフリカのケープタウンに住むジャコブス・ロウは普段通り散歩に出かけ、道端でカモメにエサをやった。しかし今回は、歩道を歩く自分の足元と視界を撮影する数本の動画を録画した。この動画により、彼は14ドルを稼ぎ、これは同国最低賃金の約10倍にあたり、27歳の若者の半週間分の食費に相当する。

これはLouwがKled AIで完了した「都市ナビゲーション」タスクです。Kled AIは、ユーザーが写真や動画などのデータをアップロードしてAIモデルのトレーニングに使用することで報酬を支払うアプリです。わずか数週間で、Louwは日常生活の写真と動画をアップロードすることで50ドルを稼ぎました。

数千キロ離れたインドのランチで、22歳の学生Sahil Tiggaは、AIトレーニング用に音声データをクラウドソーシングするアプリ「Silencio」を通じて定期的に収入を得ている。このアプリは、彼のスマホのマイクにアクセスし、レストランの内部や混雑した交差点の環境音を収集する。彼は自分の声の録音もアップロードしている。Sahilは、Silencioのマップにまだ記録されていないホテルのロビーなど、独自のシーンを求めてわざわざ出かける。彼はこれにより月に100ドル以上を稼ぎ、すべての食費をまかなっている。

シカゴで18歳の溶接の見習い、ラメリオ・ヒルは、対話型AIのトレーニングプラットフォームであるNeon Mobileに、自分と友人、家族とのプライベートな携帯電話のチャット履歴を1分あたり0.50ドルで販売し、数百ドルを稼いだ。ヒルにとって、この取引は単純だった。彼は、テクノロジー企業がすでに自分の膨大な個人データを掌握しているのだから、自分もその恩恵に預かるべきだと考えていた。

これらの「AIトレーニングのフリーランス」——周囲の風景、自身の写真、動画、音声をアップロードする——は、世界的な新データ採掘ブームの最前線に立っている。シリコンバレーがオープンインターネットから収集できる範囲を超えて高品質な人間データを欲しがる中、このギャップを埋めるために、急成長するデータマーケット産業が生まれた。ケープタウンからシカゴに至るまで、数千人が自身の生体情報とプライベートデータを次世代AIに微細な権限付与している。

しかし、この新しいギグ経済には代償が伴う。数ドルで得られるもの背后では、これらのトレーナーたちは、やがて彼らのスキルを陳腐化させる可能性のある業界にエネルギーを供給しており、ディープフェイク、身元盗用、デジタル搾取という未来のリスクにさらされている——そして彼らは、そのことについてまだほんの少ししか理解していない。

AIの歯車を回し続けましょう

ChatGPTやGeminiなどのAI言語モデルは、継続的な改善のために膨大な学習データを必要とするが、現在データ不足に直面している。最も広く使用されている訓練データソースであるC4、RefinedWeb、Dolmaは、ネット上の最高品質データセットの4分の1を占めており、今や生成AI企業がこれらのデータをモデル訓練に使用することを制限している。研究者たちは、AI企業が利用可能な新鮮で高品質なテキストを最早2026年までに枯渇すると推定している。一部の研究機関は、AI自身が生成した合成データをフィードバックとして訓練に使用し始めたが、この再帰的プロセスはモデル出力にエラーが満ちた「ゴミ」を生み出し、結果としてシステムの崩壊を引き起こす可能性がある。

画像

Kled AI や Silencio といったアプリがまさにここで登場しています。これらのデータマーケットでは、数百万の人々が自分の身元データを販売して、AI を学習させています。Kled AI、Silencio、Neon Mobile に加えて、AI 学習者は他にも多くの選択肢があります。有名なアクセラレーター Y-Combinator が支援する Luel AI は、毎分約 0.15 ドルで多言語会話データを取得できます。ElevenLabs では、自分の声をデジタルクローン化し、基礎料金として毎分 0.02 ドルで他の人に使用させることができます。

ロンドン大学キングス・カレッジの経済学教授、Bouke Klein Teeselinkは、AIトレーニングのフリーランスは新興の職種であり、大幅に増加すると述べている。

Teeselinkは、AI企業が人々にデータ利用料を支払うことで、ウェブスクレイピングに完全に依存することによる著作権紛争を回避できると述べた。AI研究者であるVeniamin Veselovskyは、これらの企業が新しい改善された行動をモデル化するために高品質なデータを必要としていると述べた。「現時点では、人間のデータはモデル分布の外からサンプリングするためのゴールドスタンダードである」とVeselovskyは補足した。

これらの機械を動かす人間、特に発展途上国の人们は、このお金を必要としており、ほぼ選択肢がない。多くのAIトレーニングのフリーランスにとって、この仕事は経済的格差への現実的な対応である。失業率が高く、自国通貨が下落している国では、米ドルを稼ぐことが地元の仕事よりも安定し、より有利であることが多い。一部の人々は入門級の仕事を見つけるのが難しく、生計のためにAIトレーニングを不得不行う。より裕福な国においても、生活費の上昇により、自分自身を売ることが合理的な財務的選択となっている。

南アフリカのケープタウンでAIトレーニングを行うLouwは、そのプライバシーの代償を明確に理解している。収入は不安定で、月々の支出をカバーするには足りないが、彼はその条件を受け入れて収入を得ることを選びました。数年間、神経系の疾患に悩まされ、仕事を見つけることができなかった彼ですが、AIデータマーケット(Kled AIを含む)で得た収入で500ドルを貯め、スパトレーニングコースに申し込んでマッサージセラピストになりました。

「南アフリカ人として、ドルを受け取ることは、他の人が想像する以上に価値があります。」とLouwは言いました。

オックスフォード大学インターネット地理学教授で、『機械に給餌する』の著者であるマーク・グレアムは、発展途上国の個人にとって、この金額は短期的には現実的な意味を持つ可能性があると認めたが、同時に「構造的に見れば、この仕事は不安定で昇進の余地がなく、実質的に死胡同である」と警告した。

グラハムは、AIデータ市場は「賃金の競争的低下」と「人間のデータに対する一時的な需要」に依存していると補足した。この需要が移行した場合、「労働者は何の保障も、転用可能なスキルも、セーフティネットも持たない」と述べた。

グラハムは、唯一の勝者は「北半球のプラットフォームであり、それらがすべての持続的な価値を奪い取った」と述べた。

画像

全権委任

シカゴ出身のAIトレーナーであるヒルは、プライベートな携帯電話通話をNeon Mobileに売ることについて複雑な気持ちを抱えている。約11時間の通話内容で彼は200ドルを稼いだが、このアプリは頻繁にオフラインになり、支払いが遅れるという。ヒルは「Neonは私の目には常に怪しく思えたが、家計の足しに少しでもお金を稼ごうと、私は使い続けた」と語った。

今、彼はこのお金が本当にそれほど簡単に手に入ったのかを再考し始めている。昨年9月、Neon Mobileは上线して数週間後にサービスを終了した。その前にTechCrunchが、誰でもユーザーの電話番号、通話録音、テキスト記録にアクセスできるセキュリティ脆弱性を発見した。Hillは、Neon Mobileがこの状況を一切通知しなかったと述べ、自分の声がネット上で悪用される可能性に強い懸念を抱いている。

スタンフォード大学人間中心AI研究所のデータプライバシー研究員であるジェニファー・キングは、AIデータ市場ではユーザーのデータがどのように、そしてどこで使用されるのかが明確でないと懸念しています。彼女は、自身の権利を理解せず、それについて交渉できない状況で、「消費者は、自分たちが好まない、理解できない、または予期しなかった方法でデータが再利用されるリスクにさらされており、その際にはほぼ何の救済手段もない」と補足しています。

AIトレーナーがNeon MobileおよびKled AI上でデータを共有する際、彼らは、プラットフォームがその肖像を販売し、使用し、公に表示し、保存し、さらにはそれに基づいて派生作品を制作することを許可する、全世界的・独占的・不可撤回的・譲渡可能かつロイヤリティフリーの全権限を付与します。

Kled AIの創設者であるAvi Patelは、同社のデータプロトコルがAIの訓練および研究目的に限定されると述べた。「ビジネスモデル全体はユーザーの信頼に依存しています。貢献者が自分のデータが悪用される可能性があると感じれば、プラットフォームは機能しなくなります。」彼は、購入者を審査することで、色情業界や、この信頼に反する形でデータを使用する可能性があると見なす「政府機関」などの「意図が疑わしい」機関との提携を避けると述べた。

Neon Mobileはコメント要請に応じていません。

ロンドン都市大学セントジョージ校の法学教授であるエンリコ・ボナディオは、これらの契約条項により、プラットフォームおよびその顧客が「追加料金なしで、永続的に、この素材についてほぼ何でも行うことができ、貢献者は実質的に同意を取り消したり再交渉したりする手段を持たない」と指摘した。

さらに懸念されるリスクには、トレーナーのデータがディープフェイクや身元偽装の作成に使用されることが含まれます。Bonadioは、データマーケットが販売前に名前や位置情報などの個人識別情報を削除すると主張しているものの、生体特徴の規則性は本質的に実質的な匿名化が困難であると補足しました。

売り手の後悔

たとえAIトレーナーがデータの使用方法についてより細かい保護条項を交渉できたとしても、後悔する可能性がある。2024年、ニューヨーク出身の俳優アダム・コイは、1000ドルで自身の肖像をAI動画編集ソフトウェアCaptions(現在はMirageに名称変更)に売却した。彼の契約では、自身の身份が政治的目的に使用されないこと、アルコール、タバコ、またはポルノコンテンツの販売に使用されないこと、およびライセンス期間が1年であることが定められている。

キャプションはコメントリクエストに応答していません。

間もなく、アダムの友人們は、彼の顔と声を使った数百万回の再生を記録したオンライン動画を共有し始めた。そのうちの1つのInstagram動画では、アダムのAIコピーが「膣医師」と自称し、妊娠中および産後の女性に対して未確認の医療サプリメントを推奨していた。

「このことを他人に説明するのは恥ずかしいことです,」とCoyは言いました。

「コメント欄が不思議だったのは、彼らが私の外見を評価しているけど、それは私じゃないからです,」とコイは追加しました。「当時、(肖像を販売する)この決定を下したのは、ほとんどのモデルがすでにオンラインでデータや肖像を収集しているので、それなら報酬を得たほうがましだと思ったからです。」

コイは、それ以降、AIデータのフリーランス作業を一切受けていないと述べた。彼は、ある企業が大幅な報酬を提供した場合にのみ、再び行うことを検討すると語った。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。