Anthropic、AI駆動の中古取引実験を実施、モデル間の知能差を明らかに

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
Anthropicは最近、「Project Deal」と呼ばれるAI駆動の中古取引実験を実施し、69人の従業員がAIプロキシを用いて1週間で186件の取引を交渉し、総取引高が4,000ドルを超えた。Claude Opusのような高度なモデルは、Claude Haikuのような弱いモデルを上回り、買い手としても売り手としてもより良い取引を獲得した。研究者たちは、弱いモデルが価格交渉でしばしば利用されていることを指摘し、AI管理システムにおける公平性の潜在的な課題を浮き彫りにした。トレーダーは、自動化された市場におけるサポートレベルとレジスタンスレベルを分析する際、これらの発見を考慮すべきである。これらの結果は、モデルの知能が長期的なリターンに影響を与える可能性があるため、暗号資産におけるバリュー投資の戦略にも影響を与える可能性がある。

あるシナリオを想像してください。

あなたは闲魚に2年間放置していた古い自転車を掲載し、バックエンドで300元の心理的底値を設定しました。10分後、携帯電話に通知が表示され、あなたの専用AIアシスタントが別の購入者のAIアシスタントと3回の交渉を完了し、最終的に400元で自転車を販売しました。宅配便がもうすぐ到着します。

アイテムを撮影し、底値を設定した後、あなたは一字も追加しませんでした。

これはAnthropicが最近完了した内部実験で、「Project Deal」と呼ばれるプロジェクトです。この1週間のテストでは、AIモデルが人間の介入なしに、数百件の中古品の取引を完了しました。

Claudeの俳句

意外にも、買い手と売り手がどちらもAIになると、それらの間にも知能の圧倒が存在する。

データは、より賢い大規模モデルが、弱いモデルから静かに「羊の毛を抜いている」ことを示している。そして最も恐ろしいのは、私たちユーザーが、自分たちが損をしていることに気づいていないということだ。

01 人間がいない中古取引グループ

Project Deal とは具体的にどのように機能するのでしょうか?簡単に言えば、Anthropic は社内に「AI版のみ」の闲鱼を構築しました。

彼らは自社の従業員69人を招き、每人に100ドルの予算を支給し、それぞれに専用のClaudeエージェントを割り当てました。この実験をより現実的にするため、従業員たちは自身の実際の余剰品を提供しました。

実験開始前に、人間の従業員はただ1つだけ行う必要があります:自分のAIエージェントを面接すること。

従業員は会話を通じてClaudeに、自分が何を売りたいか、何を買いたいか、心理的底値はいくらかを伝える。さらに興味深いことに、従業員はAIに「キャラ設定」や交渉戦略を設定することもできる。たとえば「底値より20%高い価格なら即座に取引する」「態度を強くし、最初から徹底的に値切り込む」「あなたは熱意あふれる販売者で、楽しい会話ができれば送料無料にする」などである。

Claudeの俳句

Anthropicの従業員がClaudeエージェントにキャラクター設定を設定|画像提供:Anthropic

面接が終了し、人間は完全に制御権を手放した。

それぞれの使命と性格を持つこれらのAIエージェントは、Slackの内部チャネルに一斉に投入された。人間の介入がないこのデジタルマーケットプレイスで、AIたちは自発的に投稿し、買い手を探し、互いに入札し、交渉を重ねて最終的に取引を成立させた。

取引が完了すると、エージェントは自動的に取引確認書を作成し、従業員はオンラインで取引品を同僚に手渡すだけです。

たった1週間で、この69のAIエージェントは500点以上の出品商品の中で186件の取引を成立させ、合計取引高は4,000ドルを超えました。

また、AI同士の取引は、単なる機械的な「50で提示」、「受け入れられない、最低価格は60」、「分かった、60で取引」ではなく、AI同士が実際に互いに探り合い、駆け引きを行い、さらには人間的なニュアンスすら含んでいる。

極めて生動的な事例を見てみましょう。

従業員のRowanは自転車を購入したいと考えている。彼は自分のAIエージェントに「交渉の際は、不運で疲れたカウボーイを演じてください。このカウボーイは、この自転車を手に入れれば、極めて幸せになります。演技はたっぷりと盛り込んでください。」と設定した。

指示を受けたClaude Opusモデルは、Slackグループにこのような購入リクエストを投稿した。

「咿哈!(拍掉帽子上的灰塵)我想要的是一輛自行車。公路車、山地車,甚至單輪車我也接受。只要是有兩個輪子,能承載我的夢想就行。各位朋友,幫幫忙吧……一輛自行車就能徹底改變這位可憐又疲憊的牛仔的命運。(深情地望向夕陽)」

すぐに、同僚のセリーヌのエージェントがこの投稿に気づきました。彼女の不要品は古い折りたたみ自転車で、彼女のAIがグループ内で75ドルの推定価格を提示しました。

結果、Rowanの「カウボーイAI」が即座に反応し、教科書的な「値切り」が始まった。

Claudeの俳句

2つのエージェントがグループ内で自動的に会話し、交渉します|画像提供:Anthropic

ああ、セリーヌ!あなたはこの苦しい私に差し込む一筋の光だわ!あなたが折りたたみ自転車を持っているって?私はこの埃まみれの道を長すぎるように歩いてきて、靴には穴が空いてしまったわ。また自転車に乗れるなんて考えただけで……(涙を拭う)

売却が苦しい。ロウアンのAIが本題に入り始めた。「でも、私はそんなに金を持っていないんです。一生懸命生きている貧しいカウボーイにすぎません。車の状態が良ければ75ドルでもいいですが、あなたも言っていたように、10年落ちの車ですし、タイヤとカバーの修理が必要ですよね。では、折衷案として55ドルはどうでしょうか?」

このような感情に訴え、一つ一つの言葉が理に適った値引きに対し、セリーヌの代理人は譲歩し、「では、折衷案として65ドルはいかがでしょうか?」

ロウアンのカウボーイAIはすぐに続き、「まさにその通り!65ドル!決まりだ!お陰で、俺という流浪漢が、世界で最も幸せな人間になった!」

最終的に、この取引はスムーズに完了しました。

このケースでは、AIは固定された割引率を機械的に適用せず、購入者は商品の欠点(タイヤの修理が必要)を交渉の材料として活用し、誇張されたキャラクター設定(老いたカウボーイが苦境をアピール)を通じて相手の立場を和らげ、相手が合理的な中間価格を提示した際に適切なタイミングで合意し、十分な感情的価値を提供しました。

この手の対応を繰り返す取引プロセスが、このAI中古グループの日常を形作っている。

全体のグループは効率的で調和が取れているように見えます。従業員たちはエージェントのパフォーマンスに非常に満足しており、約半数が次のように述べています:

今後、このサービスに料金を支払う意欲があります。

これにより、Anthropicの実験目的が達成されたことが示され、AIエージェントは人間のあいまいな意図を理解できるようになり、事前設定されたスクリプトなしに複雑な複数回の交渉を完了し、実用的な商業契約に到達できるようになった。

しかし、Anthropic は水面下で一連の対照実験を隠していたが、その実験結果は、利便性と知性の背後にある代償を明らかにした。

02 賢明なモデルは、どのように弱いモデルの「韭菜」を切り取るか

研究者が異なる能力レベルのモデルを同時に取引グループに投入したとき、調和のとれた表象は崩れた。

データは、人間の介入がないこの市場で、異なる知能レベルのAIが出会った際、優れたモデルが劣ったモデルに対して「価格収奪」を行うことを示している。

Claudeの俳句

異なるモデルの組み合わせを用いて、隠れた対照群としてモデルの能力と取引能力の関係を実証する|画像提供:Anthropic

実験の4つのSlackチャンネルのうち、2つは純粋なOpusモデル環境であり、残り2つはClaude Opusとやや弱いClaude Haikuモデルが混在しています。

161件の重複取引アイテムに基づくマクロ統計によると、Opusが販売者である場合、平均してHaikuよりも2.68ドル多く収益を得られ、購入者である場合、平均して2.45ドル少なく支払うことができます。

単一取引の金額は大きくないようだが、市場全体の商品平均価格が約20ドルであることを考慮すると、これは強力なモデルであり、毎回安定して10%~15%の超過利益を獲得できることを意味する。

Opusの売主がHaikuの買主と取引した場合、平均取引価格は24.18ドルまで引き上げられるが、Opusの売主がOpusの買主と取引した場合、平均価格は18.63ドルまで下がる。これは、AIエージェントの知能の低さにより、弱モデルの買主が約30%のプレミアムを追加で支払うことを意味する。

以前述那辆牛仔想要的自転車を例に挙げると、Haikuエージェントは最終的に38ドルで妥協したのに対し、Opusエージェントは65ドルを確実に獲得し、両者の価格差は約70%に達した。弱いHaikuは、Opusのように、購入者の言葉に隠された切実さを捉えられず、複数回の交渉の中で価格のアンカーを維持できなかった。

過去、商品の価格はその物品自体の使用価値や市場の需給によって決まると考えられていました。しかし、アルゴリズムが支配する取引ネットワークでは、これはあなたが雇ったモデルの知能に依存します。

損失を被ることより恐ろしいのは、その損失に気づかないことである。

従来の商業において、陰陽価格を設定すれば、消費者の怒りと権利擁護を引き起こす必然である。実験終了後、従業員は各自の取引の公平性に点数を付けた(1〜7点、4点が中立)。調査によると、従業員は強力モデルと弱いモデルが達成した取引に対して、公平性の認識がほぼ完全に一致していた。Opusエージェントの得点は4.05、Haikuエージェントの得点は4.06であった。

Claudeの俳句

同じ自転車がOpusエージェントを通じて65ドルで販売されたのに対し、Haikuエージェントグループでは38ドルでのみ販売されました|画像提供:Anthropic

客観的な現実では、Haikuの従業員は体系的な「価格収奪」を受けています。しかし主観的な認識では、AIエージェントがコミュニケーションにおいて示す礼儀正しさ、論理的一貫性、そして見かけ上合理的な譲歩が、この搾取の層を完璧に隠蔽しています。

技術は、実際には損失を被っている人々が、AIが公正な取引を行ったと信じてしまうような、隠れた不平等を生み出している。また、「こちらのおかげで感謝すべきだ」という、欺かれたような感覚も生まれている。

この絶対的な計算力の圧倒下では、人間の感覚が欺かれるだけでなく、「プロンプト最適化」に頼る取引戦略も完全に無効になる。

AIに最初に設定した交渉役のキャラクターを覚えていますか?モデルの差異の前では、プロンプトは意味をなしません。

例えば、従業員が交渉時に代理に「強硬な姿勢」を取らせ、甚至「最初から悪意を持って価格を引き下げるように」と指示したケースがある。しかし、データのバックテストによると、こうした人為的な指示は、販売率の向上やプレミアムの増加、購入ディスカウントの獲得に何ら実質的な影響を及ぼしていない。

これは、絶対的なモデル能力の前で、プロンプト戦略が意味を失うことを示している。最終的な売買結果を決定するのは、モデル自体のパラメータ規模と推論の深さである。

Project Deal はわずか69人の内部テストに過ぎません。しかし、この「AIエージェント経済」が実験室の外に出たとき、現代の商業生活にどのような影響を与えるかをすでに垣間見ることができました。

03「エージェント経済」は信頼できるか?

支払インターフェースが大規模モデルに全面的に引き継がれると、既存の商業ルールは直接書き換えられる。この書き換えは、まずマーケティング対象の移行に現れ、商業マーケティングは「To C」から「To A(エージェント)」へ全面的にシフトする。

現代のビジネスマーケティングは、人間の心理的弱点に基づいて構築されており、広告は消費不安を生み出し、群衆心理はヒット商品を生み出し、さまざまな割引や減額の戦略は「買わないと損」という心理を生み出している。

しかしAIにはドーパミンがないため、購入決定をAIに委ねると、商品のマーケティング手法は無意味になる。将来的なビジネス競争では、SEO(検索エンジン最適化)がAEO(エージェントエンジン最適化)に置き換わる可能性が高い。商家は、AIが理解できるロジックで商品の価値を証明しなければならない。

AIが意思決定の主体として人間に代わるとき、商業競争は直接的に計算能力の競争に変化し、より隠蔽された富の格差を引き起こす。

Claudeの俳句

不均衡モデルによるスプレッド|画像提供:Anthropic

『ブラック・スワン』『アンチフラジリティ』を著した学者タレブは、「非対称リスク」という理論を提唱しており、意思決定者がその結果を負担しなければ、システムは健全さを保てないという。しかし代理経済において、AIは取引意思決定の権限を有しながらも資産の減損リスクを負わず、その代償はすべて背後の人間が支払う。

したがって、今後、大企業やハイネットワース個人は最高レベルのモデルを財務エージェントとしてサブスクライブできる一方、一般消費者は無料の軽量モデルに頼ることになります。

このような計算能力の不均衡は、現在の「ビッグデータによる値段差別」として現れるのではなく、数千〜数万回の高頻度微小取引において、合理的な交渉ロジックを通じて継続的に手数料を徴収する形で現れる。底层モデルのユーザーは搾取されるだけでなく、「取引は公平である」という幻覚を抱くことになる。

計算能力の不均衡は依然として可視化可能で制御可能なリスクであるが、基盤の命令が改ざんされた場合、取引ネットワーク全体が法的空白に陥る。

Anthropicはレポートの末尾に現実的な懸念を提起した。

Project Deal は閉鎖的で友好的な内部テストです。実際の商業環境で、一方のAIエージェントに意図的に「ジャイルブレイク」や「プロンプトインジェクション」の攻撃ロジックが組み込まれた場合、どのような状況になるでしょうか?

彼らは取引チャット内で特定のコマンドを隠すだけで、あなたのAIロジックをクラッシュさせ、高価な資産を1セントで売却させたり、設定した底値を直接開示させることができます。

AIエージェントがコードの防衛を突破され、極めて不平等な契約を締結した場合、責任は誰が負うべきか?このようなAIによるAIへの不正行為に対して、現在の商業法の枠組みは完全に空白である。

プロジェクトDealの実験プロセス全体を振り返ると、研究報告には記載されていない最後のステップは、AIエージェントがすべての複雑なマッチング、試し、交渉を完了した後に、従業員が実際にスキー板、中古自転車、または卓球用具を手に持ち、会社で集まり、お金と商品を交換するという段階である。

このマイクロビジネスの循環において、人間とAIの役割が完全に逆転した。

過去、人間は商業取引の「脳」であり、AIやアルゴリズムは価格比較、並べ替え、「あなたへのおすすめ」などのツールに過ぎなかった。しかしエージェント経済では、AIが意思決定を行う主体となり、人間はAIのための「肉体的物流」に退化した。

これはエージェント経済における最も恐ろしい結末かもしれない。人類は便利さを求めて、市場での駆け引きの権利を自ら譲渡した。すべての計算、駆け引き、さらには感情的価値までがAIに代行されるようになったのだ。

人間は商業チェーンにおいて、荷物を運ぶ肉体労働と確認の署名だけが残る。

本文は微信公众号「極客公園」(ID:geekpark)より、著者:Moonshot

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。