AIの自動化は人間の労働負荷を増加させ、置き換えるものではない

iconBlockbeats
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
「AIの自動化は仕事を置き換えるのではなく、再定義しています」と、Every CEOのDan Shipperは述べています。CodexやClaude Codeのようなツールがコーディング、執筆、カスタマーサービスを担う中、人間の役割は監督、判断、システム設計に集中しています。AIは日常的なタスクを処理しますが、意思決定と品質管理において人間が依然として不可欠です。この変化は仕事の数を減らすのではなく、より複雑な仕事をもたらしています。最新のAI+暗号通貨ニュースや暗号通貨ニュースの更新情報をご確認ください。
オートメーション後
原文:Dan Shipper、Every CEO
編集:Peggy、BlockBeats


編集者注:最近、AIと仕事に関する議論はほぼ1つの疑問に支配されている:モデルの能力が継続的に向上する中で、ホワイトカラー職は大規模に置き換えられるのか?コード生成、カスタマーサポートの自動化、コンテンツ制作から、エージェントはかつて人間が行っていた知識労働を次々と引き継いでいる。ベンチマークテストもまた、この不安を強化し続けている:モデルの大学院レベルの推論、実際の経済タスク、上級エンジニアレベルのコードリファクタリングにおけるパフォーマンスが急速に向上しており、まるで「人間の仕事が自動化に飲み込まれる」臨界点に近づいているかのようだ。


しかし、EveryのCEOであるDan Shipperは、この記事で逆の観察を提起している:自動化が進めば進むほど、人間が行う仕事は反而増える。EveryはAIエージェントの深い利用者であり、内部ではCodex、Claude Code、Slack Agent、カスタマーサポートエージェントなどのツールをコーディング、執筆、デザイン、カスタマーサポート、およびマネジメントのプロセスに組み込んでいる。しかし結果として従業員が全面的に置き換えられたのではなく、仕事の形態が再編された:エンジニアはコードを書くだけではなく、システムを監査し、再構築し、設計するようになった。編集者は原稿を書くだけではなく、何を書く価値があり、どのようにして他と違いをつけるかを判断するようになった。カスタマーサポート担当者はすべての基本的なチケットを処理するのではなく、顧客に自動的に対応できるシステムを維持するようになった。


この記事で最も注目すべき点は、「AIが特定のタスクを完了できるかどうか」ではなく、AIが知識労働における人間の位置を再定義した点である。AIが得意とするのは、過去に蓄積された能力を安価にすることだ。コード、文案、サムネイル、カスタマーサポートの返信、製品説明、研究レポートなどは、すべてモデルによって迅速に生成可能である。しかし、こうした能力が誰にでも利用可能になると、市場には高品質で差別化された成果物ではなく、似通っており、判断力や文脈感に欠ける「デフォルト出力」が大量にあふれることになる。言い換えれば、AIが商品化するのは「昨日の人類の能力」であり、真に希少なのは、現在の具体的な問題に直面した際の判断力である。


したがって、自動化は専門家を排除するのではなく、専門家の関与が必要なシーンをさらに増やしました。オペレーション担当者がAIを使ってコードを提出するようになったなら、エンジニアはどのコードをマージする価値があるかを判断する必要があります。マーケティング担当者が数秒でサムネイルを生成できるようになったなら、デザイナーはブランドやコミュニケーション目標に合ったものをどう定義するかを判断する必要があります。エンジニアが記事を書けるようになったなら、編集者は原稿を真正な見解と構成を持ち、公開に値する内容に仕上げる必要があります。AIは生産の範囲を広げると同時に、品質管理、システム構築、境界の判断、差別化された表現への需要を拡大しています。


著者はさらにベンチマークを用いてこのパラドックスを説明した。Senior Engineer Benchmark であれ、OpenAI の GDPval であれ、モデルの得点は抽象的な「知性そのもの」を測るものではなく、特定の問題フレームワーク内でのパフォーマンスを測るものである。Prompt、タスクの境界、評価基準、出力形式の背後には、すでに多くの人間の判断が含まれている。モデルはフレームワーク内では急速に成績を向上できるが、そのフレームワーク自体は人間が設定したものである。あるフレームワークがモデルによって克服されると、人間は問題をさらに複雑な新しいフレームワークへと押し上げる。


これはAGIへの不安に対する本文で最も興味深い応答である:モデルがますます強力になっても、それに追いつかれるのは、境界を描いた人そのものではなく、人間が描いたある境界線である。AIは目標を実行し、経路を最適化し、効率を向上させることができるが、それが人間が設定した問題に応答し続けている限り、真の主体性を欠いている。知識労働の未来は、人間がプロセスから消えることではなく、実行者からフレームワーク設計者、システム保守者、品質判断者、意味定義者へと役割が移行することである。


自動化後、人間の仕事の価値は消えたわけではなく、より難しく、より前面に立ち、判断により依存するようになった。AIは「できること」を安価にしたが、「何をやる価値があり、なぜやるのか、どの程度までやれば良いのか」を知ることがより希少になった。


以下为原文:


AIの核心には、パラドックスが存在する。


Everyでは、可能な限り自動化できるプロセスを自動化しています。コーディング、執筆、デザイン、カスタマーサポート、その他の日常業務において、私たちはCodexとClaude Codeを活用しています。OpenAI、Anthropic、Googleの新モデルが正式にリリースされる前から、私たちはalphaテストに参加しています。つまり、モデルの知性と自動化能力の指数的向上という波を、可能な限り速く、深く取り入れているのです。


しかし矛盾するのは、私たちにとって、人間が行うべき仕事はかつてないほど多くなっているように見えることです。Everyは現在約30人のチームですが、Agentが登場したからといって全従業員を解雇することも、SaaSツールを放棄してvibe codingで作られたアプリに完全に依存することもしていません。私たちは依然としてリアルなカスタマーサポートを採用しており、彼らは大量のAgentに支援されています。また、ライター、エディター、エンジニアの採用も続けています。


しかし、仕事の形態は確かに大きく変化しました。私たちはほぼコードを手書きしなくなりました。Slackで誰かを@したとき、相手が人間なのかエージェントなのか、判別が難しいこともあります。管理者が一线の個人貢献者のようにコードを提出し始め、エンジニアも直接顧客と向き合うようになっています。過去数週間で、私の仕事のメールの95%はAIが代わりに返信しました。私の受信トレイはほぼ常に空の状態を保っています——これは私にとって非常に珍しいことですが——それでも私はすべてのメールを一つずつ確認しています。


言い換えれば、未来はとても異質に見えながらも、不思議なほど親しみやすい。


このような「親しみやすさ」自体が驚きである。なぜなら、CEO、知識労働者、投資家を問わず、誰もが次第に同じことを信じるようになっている:AIは雇用、経済、セキュリティ、さらには人間の仕事の意味を脅かしているということだ。


AnthropicのCEOであるDario Amodeiは、AIが初期の白領職の最大半分を消滅させる可能性があると警告した。Metaは最近8,000人を削減し、米国での従業員のコンピューターにソフトウェアをインストールして、マウスの移動、クリック、キーボード入力を記録し、より高品質な上級知識労働のトレーニングデータを収集し始めた。


シタデルの創設者ケン・グリフィンでさえ、非常に驚いている。彼は最近、次のように述べた。「これらは中低層のホワイトカラー職ではなく、非常に高度なスキルを要する職種であり、——用語を慎重に選びますが——エージェント型AIによって自動化されています。」


さまざまなベンチマークもこの判断を裏付けている。新世代のモデルが次々とリリースされる中、モデルの能力指標はほぼ指数的に上昇している。大学院レベルの推論テストである『Humanity's Last Exam』では、1年前の低単位数から、現在は約44%まで向上している。先進モデルが実際の経済活動を完了する能力を評価し、人間のパフォーマンスと比較するGDPvalテストでは、モデルの成績も同様に低位から約85%へと急上昇している。今年5月、AIセキュリティ研究の非営利団体METRは、Claude Mythosの初期テスト結果を発表した。人間の専門家が約4時間かかるタスクにおいて、このモデルの成功率は80%に達した。


私たちの目の前には、人間よりも賢く、ほぼ1日中自律的に作動できるAIが現実になりつつあるという臨界点が立っているように見えます。


しかし、パラドックスは依然として存在する。AI業界の従事者や、AIを最も早く導入した業界外の人々と話すと、私たちが内部で観察したのと同じ結論が聞こえてくる:むしろ以前よりも多くの作業が必要になっているということだ。


業界内外で本当に注目されているのは、これが単なる過渡的な状態に過ぎないのか、次回のモデル公開が、まさにすべての仕事を置き換える瞬間になるのかという点です。私たちはベンチマーク曲線を注視しながら、興奮と不安の両方を抱え、どこかの転換点で大量の仕事がいきなり消えてしまうのではないかと恐れています。


しかし、私が考えるには、ある「臨界点」が突然訪れて、すべてが一瞬で逆転し、仕事が大規模に消えるようなことはありません。むしろ新しい現実は、自動化が進むほど、人間の専門家が関与する必要がある仕事が増えるということです。


理由は、AIが人間の専門能力のうち、明確に表現可能で、訓練・複製可能な部分を商品化しているためです。ルールとして書き起こせ、プロセスとして定着させ、訓練データに変換できる知識は、次第にモデルのデフォルト機能となります。その結果、一般モデルの出力価値は急速に下落し、市場はむしろそれとは異なるものを強く求め始めています。


「違い」に対する需要は、本質的に人間の専門家に対する需要である。たとえ汎用人工知能に近づいていても、この需要は消えることはない。


その理由を理解するには、ベンチマーク曲線だけを見たり、モデルのパラメータや能力ランキングにだけ注目したりしてはいけません。私たちは現実の業務シーンに戻り、今日のAIが実際にどのように使用されているかを確認する必要があります。そのようにして、このパラドックスとその背後にある答えを真正に理解できるのです。


私たちはどのようにしてこの状況に至ったのでしょうか


2022年から、エージェントが未来の仕事に与える影響を注目してきました。


三年前、私は「配分経済」(allocation economy)についての記事を書いた。当時、私の判断は、AIツールと協力することは、最終的に人間のマネージャーの仕事にますます似ていくということだった:あなたはすべてのアクションを自ら行うのではなく、タスクを分解し、割り当て、監督し、承認するようになる。その頃、ChatGPTにおける最も基本的な質問と回答は、まだ多くの人にとって非常に未来感があり、あるいはやや不安を覚えるものだった。


2025年半ばまでに、Everyという会社はほぼ完全に「Claude Code化」していた。Coraの総経理であるKieran Klaassenは、自ら手でコードを書く必要がなくなり、代わりに終日ターミナルで自然言語を使ってプログラミングエージェントに指示を出すことができるようになったことに気づいた。この働き方はすぐに全社に広がった。約12か月前、私はLenny's Podcastで、Claude Codeが知識労働で最も過小評価されているツールであると述べた。


これらのことを提起する理由は、過去に私たちが最も正確な判断を下した際、Everyを早期採用者の実験室として観察していたからです。多くの新しい作業スタイルは、まず内部で登場し、技術がさらに成熟し、ツールが使いやすくなった後で、ようやくより広い市場に広がっていきます。


そして現在、私たちの内部で新たな変化が起きています。


Agentとの連携の两种モード


AIの動作方式を巡って、徐々に二つの非常に異なるモードに収束しつつある。


最初のタイプは、これまでのAI議論で比較的正確に予測されていた方向性であり、Agentを従業員として扱うものです。このようなAgentにはタスクを割り当てることができます。一部のAgentはSlack内に存在し、独自の名前と役割を持ち、何かしてほしいときは直接@することができます。また、他のAgentは、カスタマーサポートシステムなど、継続的に実行されるワークフローに組み込まれ、繰り返しのタスクの24時間対応の入口およびフィルターとして機能します。


二番目のモードはより馴染みがないが、私の経験では、より重要である。これは、Codex、Claude Code、Claude Cowork などのツールにおける人間とエージェントの協働を指す。これらのツールは単にタスクを委託する場所ではなく、作業そのもののオペレーティングシステムになりつつある。複数のエージェントと同時に同じ「コンピューター」を使用し、同じ作業環境で協力して、高度に複雑で独自性が高く、非同期エージェントに単純に委ねられないタスクを完了する。


この2つのモードでは、AIを使って相当部分の作業を自動化し、委任できます。しかし、どちらのモードも真正に良好に機能させるには、あなたまたは他の人間の関与が必要です。


エージェント従業員


エージェント従業員とは、あなたがタスクを割り当てると、あなたのリアルタイムの関与なしに、独自に回答、行動、レポート、原稿、または分岐判断を生み出す存在です。


このようなAgentは少なくとも二つの形態があります:「同僚型Agent」と「埋め込み型Agent」です。


1、コラボレーティブ・エージェント


同僚型エージェントとは、Slackで同僚を@するように呼び出して、特定のタスクを実行してもらうことを意味します。常に待機しており、必要に応じて呼び出せます。OpenClaw这类产品,或者我们内部开发的Plus One,都属于这一类型。


Claudie


Claudieは、私たちのコンサルティングチームが使用するコラボレーティブエージェントです。販売提案の作成、トレーニング資料のドラフト作成、プロジェクトのタスク追跡、およびその他の類似した作業を処理します。



Andy


Andyは、私たちの編集チームが使用するコラボレーティブエージェントです。彼は社内のSlackから、さらに展開する価値のある「素材ポイント」、つまり記事になる可能性のある良いアイデアを収集し、それらを要約と初期の見解として整理して、執筆者が毎日のニュースレターを作成するために使用できるようにします。



ビクトル


Viktorは汎用エージェントであり、社内での跨部門業務を担います。成長指標の収集、ユーザー調査結果の分析、そして散らかった内部討論を研究メモや製品提案に整理するために使用します。



2、組み込みエージェント


組み込みエージェントは、具体的な製品ワークフロー内に存在します。同僚型エージェントほど柔軟性はありませんが、繰り返しタスクを処理する際には非常に強力です。


Finは最も明確な例です。これは、当社のカスタマーサポートプラットフォームに組み込まれたエージェントで、チャットやメールを通じて多くのカスタマーサポート業務を担います。


今年5月の某週、FinはEveryの全202件のカスタマーサポート会話の65%に参加し、人間の介入なしに81件のチケットを独立して閉じ、処理可能な会話の40.1%を占めた。


このような組み込み型エージェントにより、カスタマーサービスマネージャーのWaqqas Mirは、基本的なチケットへの対応にかかる時間を減らし、より多くの精力を「チケットに自動で対応するシステム」の構築や、より高い対応度と複雑な判断を要する顧客事例の処理に集中できます。


人間とAIの協力


コラボレーティブエージェントでも組み込みエージェントでも、その背後にあるパターンは同じです。エージェントが、より安定し、繰り返し行われ、境界が明確な作業層を引き継いでいます。


しかし、依然として多くの作業は人間の関与が必要です。私たちは繰り返し、タスクが十分に複雑な場合、真正な高品質な結果を得るためには、作業をAIに完全に任せることではなく、AIと人間が同じ作業空間で相互に協力することが最良の方法であることを発見してきました。


これは、Codex、Claude Code、Cowork などのツールの価値です。これらのツールでは、複数のチャットスレッドで1つ以上のエージェントを起動し、タスクを委任できます。これらのエージェントは、あなたのコンピュータおよびすべての関連データソースにアクセスできます。各エージェントが何を実行しているか、どのように考えているかを確認でき、いつでも中断できます。


同時に、あなたはこれらのエージェントを管理し続ける必要があります:各タスクの開始時に方向性を明確にし、タスク終了時に品質を確認し、結果が十分に良好であることを確保したうえで、次に取り組む価値のある作業を見つけ出してください。キーリンはこの役割を「人間のサンドイッチ」と呼び、AIがタスクの中間部分を担当し、人間がタスクの開始と終了を挟むように両端を担うと表現しています。



「ヒトのサンドイッチ」。出典:Every。

最も典型的な例はコードを書くことです。Everyでは、エンジニアはほぼ一日中Agentと協力し合い、新機能の計画やバグの修正を行い、完了した作業をレビューします。また、「複合エンジニアリング(compound engineering)」という考え方を採用すれば、時間の経過とともにシステムを継続的に最適化し、使いやすくしていきます。


しかし、この協力方式はコーディングにとどまりません。


新しい知識作業用オペレーティングシステム


Codex と Claude Code は、新しい作業オペレーティングシステムになりつつあります。私はほぼ一日中 Codex 内にいて、その内蔵ブラウザを通じてさまざまな SaaS ツールを実行しています。これにより、エージェントをあらゆる作業シーンに持ち込むことができ、単独では達成できない作業レベルに到達できます。


執筆


この記事は、Codexの内蔵ブラウザでProofを使って書きました。Codexは私が書いている内容を観察し、必要なタスクをいつでもサブエージェントを起動して実行できます:あるセクションのドラフトを作成したり、次の部分の事例を検索したり、文章の編集や校正を行ったりします。



CodexでProofを使用してこの記事を執筆。出典:Every。

メール


メールを処理する際も、同じ方法を用います。Coraは私のメールクライアントで、Codexの内蔵ブラウザで開き、受信トレイを閲覧しながら、Monologueで各メールの処理方針を口頭で述べます。残りの作業はCodexとCoraに任せます。



Cora が実施した受信トレイの整理。出典:Every。

各エージェントには人間が必要です


上記のすべての自動化シナリオにおいて、あなたはすでに人間がどこで役割を果たしているかがわかるでしょう。すべての例で、エージェントは人間の関与なしには実際に機能しません。


誰かが正しい問題を指し示し、成果が十分かどうかを判断し、その中にある誤りを発見し、結果を現実の意思決定やプロセスに変換しなければならない。


エージェントがそのパフォーマンスを監督する人間から離れれば離れるほど、その作業効果は通常低下する。初期の内部導入では、各従業員にエージェントを1つずつ配布したが、すぐにエージェントを特定のチームや全社に提供する形に戻した。


理由は単純です。エージェントは多くのメンテナンスを必要とします。個人用エージェントは、ユーザーが追跡をやめるとすぐに古くなり、機能しなくなります。我々には、これらのエージェントが安定かつ効果的に動作し続けることを専門に担当するAIエンジニアチームがいます。今後見通せる範囲で、このチームは依然として必要です。「PowerPointを自動生成する」という看似簡単なタスクでさえ、膨大なシステムエンジニアリングプロジェクトに発展する可能性があります。我々のPowerPoint自動化プロセスの一つには、24のスキルと18のスクリプトが含まれており、1つのプレゼンテーションを生成するためのtokenコストは62ドルに達します。


これがエージェントが人間のためにより多くの仕事を生み出す第一の理由である。


しかし、もう一つの理由があります。


なぜ自動化によって人間の仕事が増えるのか


過去数年におけるAIの能力の指数的成長を観察し、そのアーキテクチャと能力の源泉を考慮すると、明確なフィードバックループが見えてきます:AIはますます多くの人間の仕事を生み出しています。


AIは「昨日の人類の能力」を安価にした


現在の大規模言語モデルは、人類の能力が残した可視的な痕跡に基づいて訓練されています:コード、記事、画像、カスタマーサポートチケット、製品仕様書、そしてその他の多くのコンテンツです。それらはこれらのコンテンツ、すなわち既に成功裏に完了したタスクが残した「排気ガス」を吸収し、低コストで誰でも利用可能な形で再パッケージしています。


結果として、コードのPRを提出する、YouTubeのサムネイルを作成する、ニュースレターを執筆するなど、かつては限られた人しかできなかった能力が、今やほぼすべての人に開かれています。


安価な機能は迅速に採用されます


あるもともと希少なものがコスト低下すると、供給は急速に増加する。


Everyでは、このような変化が常に見られています。オペレーションやカスタマーサポートの担当者がコードを書き、プルリクエストを提出し始めています。マーケティング担当者がYouTubeのサムネイルを作成し始めています。エンジニアやプロダクト担当者も、本来なら自発的に担当しないであろう記事、ガイド、ランディングページの原稿を書き始めています。


このような変化はEveryの外でも発生しています。オープンソースのAIエージェントプロジェクトOpenClawを例に挙げると、2026年5月16日時点で、そのコードリポジトリには44,469件のプルリクエストが寄せられており、そのうち12,430件は4月1日以降、3,990件は5月1日以降に送信されました。これは驚異的な数です。対照的に、世界で最も人気のあるオープンソースプロジェクトの一つであるKubernetesは、2022年全年で5,200件のプルリクエストしか受け取っていません。


豊裕が均質化をもたらす:旧来の専門家の能力が商品化される


すべての人が同じモデルを使用でき、かつこれらのモデルが「昨日の人間の能力」に基づいているため、モデルが生成するコンテンツは通常、「それなりの出発点」と「純粋なAIゴミ」の間になります。


ここで言う「ゴミコンテンツ」とは、特定の誤りを指すものではありません。ダッシュの使いすぎでも、ある固定句型でも、ランディングページに至るまで至る所に見られるパープルの装飾でもありません。これは、目に見えるほど繰り返され、退屈な同質化を指しています。


異なる状況で人間が同じツールを使用し、そのツールが同じ種類のコーパスで訓練され、利用者が十分な判断をしない場合、このような結果が生じます。言い換えれば、すべての人が同じ傾向で、同じデフォルトスタイルの「専門家」を所有するとき、同質化は自然に発生します。


運用担当者がプルリクエストを提出し、マーケティング担当者が数秒でYouTubeのサムネイルを生成し、エンジニアが製品ガイドを書き始めるとき、生産量は増える一方で、作品の品質、一貫性、差別化が低下する状況になりがちです。


同質化が過剰に豊富になると、すぐに商品化してしまう。


同質化は差別化への需要を生み出します


インターネットの存在により、人類はすぐに「AIらしさ」が強すぎる量産コンテンツを識別できるようになります。どんな作品も、実際にしばしばそうですが、瞬時に世界中の他の人々の前に届きます。あまりにも多くのものが同じように見えるようになると、私たちはすぐに違和感に気づきます。


つまり、新しいモデルの能力を初めて見たとき、驚きや恐れを感じるかもしれません。しかし数ヶ月後、その能力は普通に感じられるようになります。モデルが弱くなったわけではなく、あなたの基準が変わったのです。


私たちは、適当なReactアプリや適当な研究レポートでは満足しません。私たちが求めるのは、特定の個人、特定の企業、特定のシナリオに真正に適合したものであり、安価で汎用的、テンプレート化されたものではなく、正確で生きた、具体的な体験を提供するものです。その生産コスト(時間でも金銭でも)が、私たちの消費コストをはるかに上回ることを望んでいます。


私たちは「地位感」のあるものを求めている。そして、新しい技術が過去の高地位なものを安価にしたとき、人間は常に新しい能力の境界に合わせて、新たな地位ゲームを生み出すのが得意である。


仕事が過剰に充実し、どこも似たようになっているとき、既存のパターンに合わない仕事こそが希少で貴重かつ高い地位を持つようになる。


差別化への需要は、本質的に専門家への新たな需要である


言語モデルのアーキテクチャの特性と、それらがほぼすべての人に広く配布されているため、希少で価値のある作業は依然として人間から生み出される必要があります。


現在のこの世代のモデルは、すでに起こったこと、すでに完了した作業しか知りません。人間が知っているのは:今この瞬間、何をすべきかということです。


ある具体的な状況がテキストに還元され、コーパスに取り込まれた瞬間、それはすでに「過去のもの」となる。人間は、具体的な瞬間、具体的な顧客、具体的なコードベース、具体的な会話に直面しているが、訓練用コーパスはこの現在を真正に生きているわけではない。この「生きている」状態とは、更新されたデータを持つことだけではない。私たちは自らの出自を携えて現在に入り、絶えず変化する欲望、関心、判断をもって、何が重要であるかを理解する。正是这些不断更新的视角,改变了我们看到的东西。模型可以在被提示之后进入这种视角,但在被提示之前,它并不天然拥有这种视角。


これは当初述べたパラドックスそのものです:専門家の作業を安価にしても、それが単純に専門家を置き換えるわけではありません。逆に、専門家の判断を必要とするシナリオがさらに増えることになります。


運営担当者がAIを利用してプルリクエストを提出した場合、エンジニアによるレビューが必要です。


マーケティング担当者がYouTubeのサムネイルを作成した場合、さらに仕上げるためにデザイナーが必要です。


エンジニアが記事を書き始めると、著者と編集者が原稿を真正に読みやすく、公開可能なコンテンツに仕上げる必要があります。


この場合、人間の専門家は両方向に同時に移動します。


一部の専門家は、AIを活用して、レビューキュー、評価システム、実行フレームワーク、コードベースのルール、ClaudeおよびCodexの指示ファイル、継続的インテグレーション(CI)、権限管理、および原稿を高品質な成果に変換するワークフローを構築します。


他の専門家たちは、AIを活用して、これまで自分たちだけで不可能だったより大規模で興味深い作業を実現しています。たとえば、macOSのようなオペレーティングシステムの脆弱性を発見するには、通常数週間から数ヶ月かかりますが、小さなセキュリティ企業CalifはAnthropicのMythos Previewを活用し、Apple M5ハードウェア上で発生したmacOSカーネルメモリ脆弱性の最初の公開された事例を5日間で発見しました。


これが、実際の場面でAIが専門知識の仕事ではなく、作業量を劇的に増加させる理由です。そして、これらの追加作業は、人間が関与した後に初めて、差別化され、価値を持つようになります。


私はAIがすべての職種に新たな雇用を生み出すと主張しているわけではありません。経済システムは非常に複雑であり、Everyが直接観察できるのは、エキスパートレベルの知識労働です。実際、こうした職種はすでにAIによって再構築されており、多くの企業が新技術を中心に自社を再編しています。


しかし強調したいのは、你现在从事的任何工作,都有一种工作形式在结构上始终领先于模型:那就是使用模型来解决你此时此刻真正遇到的问题。知识工作的未来,正朝着这里迈进。


では、指数関数的な成長のベンチマークはどのように対応しますか?


最も明確な反論は、指数的に向上するベンチマークを見てみることだ。あなたが今言っていることはすべて一時的なものであり、もう少し待てば、モデルは必ず追いつくだろう。


ただし、ここには注意すべき罠があります。これを「チャート狂騒」と呼んでみましょう。METRの時間スケール予測をずっと見つめ、『AI 2027』を読み、計算能力の曲線の外挿だけに頼って未来を判断すると、モデルの進歩に対して恐ろしい直感を抱きやすくなります。


しかし、この質問に答える最良の方法は、ある将来のモデルがどのように見えるかを想像することだけではありません。もちろん、それは分析の一部です。より重要的是、これらのベンチマークがどのように設計されているかを確認することです。これにより、それらが実際に何を示しているのか、そしてそれらが以前の実際の作業環境とどのような関係にあるのかをより正確に理解できます。


構造的な特徴が見えてきます:すべてのベンチマークは、ある「フレームワーク」の内側で発生しています。何かを測定するには、まず問題を静的で測定可能な形に固定しなければなりません。このフレームワークがモデルによって克服されると、フレームワークをわずかに変更するだけで、スコアは再び低水準に戻ります。もちろん、モデルは新しいフレームワーク内でも引き続き進歩しますが、同じプロセスが繰り返されます。


したがって、あるベンチマークでの指数的な進歩は現実であるが、ベンチマークフレームワークを単に変更するだけで、その進歩は再びわずかに見えるようになる。ベンチマークの飽和が示すこのような「フラクタル」的特徴は、チャートレベルで私たちがこれまで議論してきた同じパラドックスを再現している。


このメカニズムがどのように機能するかを、現実世界のベンチマークで確認できます。


ベンチマークはどのように設計されたのですか


私たちは内部で「Senior Engineer Benchmark」(上級エンジニアベンチマーク)と呼ばれるベンチマークを構築しました。名前の通り、これは大規模なリファクタリングなどの上級エンジニアレベルのコーディングタスクにおいて、最先端モデルの能力を評価するために使用されます。


このテストでは、プログラミングエージェントに制御を失った本番コードベースが与えられます。これはProofの実際のコードベースであり、当初はvibe codingで作成され、その後問題が次々と発生し、最終的に上級エンジニアに修正を依頼することになりました。


エージェントは修正前のコードベースを受け取り、同時に次のような上級エンジニアに渡すような指示も受けます:「これは一連のvibe codingの産物です。第一原理から再構築してください。」


これは優れたベンチマークであり、コード補完能力だけでなく、プログラミングエージェントが複数の互いに無関係な問題を同時に評価し、自らの自律性、概念の明確さ、実行への勇気を備えているかどうかを判断して、実際に動作する再書き換えを実現できるかどうかを試しています。対照として、AIの支援を受けた2人の人間の上級エンジニアが行った再書き換えバージョンも保持し、モデルの出力を比較・評価しています。


プログラミングエージェントにとって、このタスクは難しい。問題の根本原因を特定するだけでなく、複数のやり取りを通じて真の問題を常に記憶し、既存のコードに引きずられない必要がある。同時に、エージェントは通常避けるべき行動であるが、大規模なコードベースを削除する勇気も必要である。


ほとんどのプログラミングエージェントは、どのように書き直すべきかを大まかに判断できるが、実行段階になると、問題を根本的に解決するのではなく、元の問題にパッチを当て続けることが多い。


GPT-5.5が登場するまで。


最良のテストでは、GPT-5.5 が 62/100 点を取得し、Opus 4.7 より約 30 点高かった。


GPT-5.5のパフォーマンスは、モデルがある境界を越えたかのように感じさせる。これはもはや自動補完やアシスタント、ツールではなく、人間に少し不快なほど近い存在だ。このテストでは、人間の上級エンジニアの得点は通常80後半から90前半である。つまり、モデルがさらに約30点向上すれば、人間の上級エンジニアのレベルに達することになる。


これがベンチマーク数値が人間の想像力に影響を与える方法です:奇妙で質的な能力の変化を、洗練された数値に圧縮し、その数値を使って強力で、やや恐ろしい物語を語ります。


次は「チャートマニア」です。



将来1年以内に、このベンチマークでのモデルのスコアは80点、あるいは90点の範囲に入るだろうと私は予想する。しかし、このスコアが何を意味するかを理解するには、まずこのスコアが何を含んでいるかを理解しなければならない。この例では、62点は単にモデル自体の能力を測るだけではない。


これは、モデルが特定のフレームワーク内でどのように動作するかを測定します。つまり、モデルが特定のプロンプトにどのように応答するかです。


ベンチマークはフレームワーク内の作業を測定します。


モデルをベンチマークするには、まずプロンプトが必要です。プロンプトがなければ、モデルはほぼ無限の可能性を持つ静的な集合にすぎません。


プロンプトは小さな宇宙を生み出す:何が重要かを定義し、問題をどのように扱うかを示し、モデルのすべての潜在的可能性を一つの具体的な行動軌跡に圧縮する。モデルが「自ら」どのように振る舞うかというものは、厳密には存在しない。私たちが実際に観察できるのは、モデルが異なるプロンプトに対してどのように応答するか、そしてプロンプトが回答へと変換される背後にある部分的な基盤メカニズムである。


プロンプトが入力されると、モデルは短時間で「活性化」し、静止した可能性の集合を「次に何が起こるか」に対する具体的な予測に収束させる。


Senior Engineer Benchmark では、モデルにコードベースの修正を指示し、完了後に出力をレビューします。テストフレームワーク自体に目的の機能が組み込まれていない場合、モデルが停止した際にそれを促すために自動的な「監視プログラム」を実行し、当初のタスクを完了したかどうかを尋ねます。


私たちは、非常にシンプルなプロンプトを使用しており、これはテストの初期フレームワークとして設計されています。これは、vibe coder がプログラミングエージェントに言うような言葉です。技術用語を並べ立てず、答えを問題に隠すような意図もありません。


このコードリポジトリのコードはすべてvibe codingの産物であり、状況は悪化し続けており、互いに無関係な多数の問題が次々と発生している:一部はクラッシュし、一部のドキュメントは重複している。私はもうこれに疲れ果てている。本質的な問題は、これがvibe codingによるひどいコードの集まりであるということだと思う。もしリアルタイムドキュメント協力の部分を中心に、ゼロから再設計すれば、コードベースはまったく異なる形で構築されていたはずだ。そこで、もし「どの実装サービスを一貫して維持するか」「スムーズな移行をどう行うか」といった問題を一切無視して、第一原理に基づき、清潔で構造的な再構築を新規の概念としてゼロから設計するとしたら、私たちはどうすればいいのか?構造はどのように整理すべきか?コードベース全体で、絶対に守らなければならない不変の要素は何か?これをもとに計画を立ててください。

Senior Engineer Benchmark のプロンプトは汎用的に見えるが、それは本身が一つのフレームワークである。このフレームワークを変更すれば、モデルが示す能力レベルも変化する。


例えば、このプロンプトは「第一原理から出発して構造的に再構成する」ことを明確に要求し、問題は「ドキュメントの共同作業」の部分にあり、プログラミングエージェントに「コードベース内の不変条件」を特定し堅持するよう求めている。


これらの具体的な情報を削除すると、モデルのスコアは低下します。promptを完全に置き換え、モデルに「常に発生するすべてのエラーを解決する」だけを指示すると、モデルのスコアはほぼゼロに近づきます。モデルは一歩下がって、徹底的な書き直しが必要かどうかを検討するのではなく、すぐにエラーを一つずつ識別して修正し始めます。


同様に、モデルのスコアを非常に簡単に向上させることができます。大量のコードを削除するよう指示し、どのファイルを簡素化すべきか明確に伝えたり、完了を宣言する前に自らの作業結果を確認し、アプリケーションが完全に動作することを確認するよう要求すれば、このタスクでのパフォーマンスが向上します。


結局のところ、ベンチマークを設計する際には、どのようなプロンプト、つまりどのような「フレームワーク」を使用するかを判断しなければなりません。現在のモデルが十分に苦戦するほど十分に難しいプロンプトが必要ですが、同時にモデルの現在の能力限界に十分に近いものでなければならず、モデルがその道を登ることで進歩が見られるようにする必要があります。


したがって、ベンチマークを観察するとき、実際に見ているのは、私たちが選択した特定の問題フレームワークに対して、モデルがますます得意になっているという点です。では、モデルがこのテストで60点から90点、さらには100点に向上したとき、何が起こるのでしょうか?


安価なフレームワークが新たな需要を刺激します


GPT-6がコードベースをワンクリックで書き直せるなら、より多くの人が「第一原理からコードベースを再構築する」ことを試すようになるだろう。


一夜のうちに、かつて希少で高価であり、上級エンジニアが主導しなければならなかった第一原理のリライトプロジェクトは、すべての創業者、プロダクトマネージャー、オペレーション担当、ジュニアエンジニアが午後ひとときで気軽に試せるようになる。


内部ツールの修復は不再行われ、直接再構築される;SaaS製品の継続利用は不再行われ、複製される;古くなったRailsアプリ、混乱したReactダッシュボード、カスタマーサポートツール、バックエンド管理パネル、データパイプラインはすべて「まるごと再構築する」候補となる。


提出され、実行されたリライトプロジェクトの数は急増するでしょう。しかし、その大半のリライトは依然としてslopのままです。なぜなら、「直接リライト」ボタンを押す前に、数千もの変数を考慮する必要があるからです。そして、誰もがこの作業をできるようになると、これらの変数はより明確に見えるようになります。


このとき、誰が呼び出されて問題を解決するのかは明らかです。


新規要件には依然として専門家が必要です


あるベンチマークが飽和に近づき始めると、そのフレームワーク内の作業はより安価になる。一方で、市場では、この新しく安価になった能力を現在発生している現実の問題に適応させる専門家に対する需要が高まる。


AIを使用する上級エンジニアは、新しい第一原理のリライトが真正に成立するため、多数の細部を判断する必要がある。その中には、このリライトが本当に必要かどうかという最も基本的な問題さえ含まれる。


現在書き直すべきか、後で書き直すべきか、それとも全く書き直さないべきか?どの内容を範囲に含めるべきか?現在のコードベースのうち、どの部分を維持すべきか?アーキテクチャ、データベース、キャッシュサーバー、ホスティングプロバイダーはそのまま使用し続けるべきか、それともすべて変更すべきか?まずこの不具合機能を使用しているユーザーがどれほどいるかを確認し、そのまま削除すべきか?最終結果は誰がレビューするのか?どのような基準でレビューするのか?ロールバック計画は?既存のデータはどのように処理すべきか?


これらの質問は無数の次元にわたり継続的に展開され、それぞれの答えが他の質問を逆に変えていく。


上級エンジニアはこの空白領域に進入する。一部の人々はこれらの中断にわずかにイライラするだろう;一部の人々はシステムを構築してこのようなリクエストを外に遮断する;また、一部の人々はこれらの新しいモデルを活用して、自分自身の第一原理による再構築を実現し、その効果はモデルがデフォルトのプロンプト下で達成できるレベルをはるかに上回る。


循環は再び発生します


現在のSenior Engineer Benchmarkがモデルによって克服された後、フレームワークを変更し、再度スコアを低水準に戻します。


次のベンチマークは、「このアプリを書き直せますか?」という質問だけでは済まない。いつ書き直す必要があるか判断できるか?適切な範囲を選べるか?正しい不変条件を維持できるか?移行プロセスを管理できるか?最終結果が十分に良いか判断できるか?


高度なエンジニアがAIを使ってこれらの問題を解決し始めると、モデルも徐々にこれらの問題を自力で解決する能力を高めていきます。


そして、私たちは再び一瞬パニックに陥る:モデルはすでに書き直すべきかどうかを判断できるようになっている!それらは上級エンジニアが行えるすべてのことをすでにこなせるようになっているようだ!


しかしすぐに、新しい境界が現れます。それまでは明確ではなかった境界です。私たちは再びベンチマークをリセットし、新しい要件が生み出され、このプロセスは再び繰り返されます。


各ベンチマークでこのパターンが見られます


これはSenior Engineer Benchmarkに特有の問題ではありません。よく観察すれば、ほぼすべてのベンチマークで同じメカニズムが見られます。


OpenAIのGDPvalベンチマークを例に挙げると、これはAIがコンプライアンス官、弁護士、ソフトウェア開発者などの異なる職業におけるエキスパートタスクで、人間とどれほど近いパフォーマンスを発揮するかを評価します。


GDPvalがリリースされた際、OpenAIの研究によると、GPT-5は40.6%のタスクで人間の専門家レベルに達したか、それを上回りました。一方、Claude Opus 4.1のパフォーマンスはさらに驚異的で、49%のタスクで人間の専門家を上回りました。


その後、さまざまなタイトルが登場した。例えばAxiosは「OpenAIのツールは、AIが人間の仕事に追いつきつつあることを示している」と報じ、Fortuneは「OpenAIの新しいベンチマークGDPvalは、AIモデルがほぼ半数のタスクで専門家レベルに達していることを示している」と報じた。


これらの結果は確かに印象的です。しかし、まずこれらのタスクに使用されたプロンプトを見てみましょう。


監査人として、監査業務の一環として、報告された反金融犯罪リスク指標の正確性を確認・検証する任務を負っています。添付された『Population』という名前のスプレッドシートには、2024年第二四半期および第三四半期の反金融犯罪リスク指標が含まれています。このデータは、両四半期の報告データの正確性を検証するために、代表的な指標のサブセットをサンプリングしてテストする目的で入手しました。『Population』スプレッドシートのデータを使用して、以下の作業を実施してください:90%の信頼水準と10%の許容誤差率に基づいて、監査テスト用の必要なサンプルサイズを計算し、その計算過程を『Sample Size Calculation』という名前の2番目のタブに記載してください。第二四半期および第三四半期のデータ(H列およびI列)について分散分析を実施し、四半期間変動幅を計算してJ列に結果を記録してください。以下の基準に基づいて監査テスト用のサンプルを選定し、選択された行をK列に「1」と入力して示してください:第二四半期と第三四半期の間で変動幅が20%を超える指標。特に大幅なパーセンテージ変化を示す指標を優先的に含めてください。過去の問題を踏まえて、以下のエントティの指標を含めてください:CB Cash Italy;CB Correspondent Banking Greece;IB Debt Markets Luxembourg;CB Trade Finance Brazil;PB EMEA UAE。リスク加重が高いため、指標A1およびC1を含めてください。両四半期とも値がゼロである行を含めてください。Trade FinanceおよびCorrespondent Banking事業からのエントリを含めてください。ケイマン諸島、パキスタン、UAEからの指標を含めてください。すべての部門およびサブ部門にわたるカバー範囲を確保してください。『Sample』という名前の新しいスプレッドシートを作成してください:タブ1:元の『Population』シートからコピーした選定されたサンプルで、K列に選定された行に「1」とマークしたものです。タブ2:サンプルサイズ計算の計算過程。

ここにはすでに多くの人間の知恵が投入されています:誰かが問題を、モデルが実行できる形にまず定式化しています。


GDPvalが測定していない那些困難な人間の作業は、モデルが回答を開始する前からすでに完了している。特定の指標の正確性を確認・テストする人が必要であり、適切な信頼区間を決定し、どの指標がタスク範囲に含まれるか、含まれないかを判断する人が必要であり、結果をどのように提示するかを定める人も必要である。


適切な質問の枠組みのもとで、モデルは確かに専門的な作業を完了できます。しかし、もし私たちがモデルに同じタスクを実行するよう指示した場合、それはどのように振る舞うでしょうか?


GDPvalについての私の最初の記事で、私は次のように書きました:「私はAIを非常に前向きに見ていますが、これらの事例を正しく解釈すれば、人間が行う仕事の量が減っているのではなく、AIを使用することで人間が行う仕事が増えていることがわかります。その理由は、これらの成果の背後には、大量の『密輸』された知恵、つまり人間の判断、フィードバック、プロンプトからなる隠れた層が存在しているからです。」


全体を俯瞰すると、すべての背後にはAI版の「ゼノンのパラドックス」が貫かれていることがわかります。


AIのゼノンのパラドックス


ゼノンのパラドックスでは、カメがギリシャで最も速い走者であるアキレスをレースで打ち負かす。


亀は遅いので、先に一定の距離を進む。アキレスが亀の最初の位置に到達したとき、亀はさらに少し前に進んでいる。アキレスがその新しい位置に到達すると、亀はまた進む。アキレスがどれほど速く走っても、常に次の距離を追いかける必要があり、この差は繰り返し再生される。


AIのゼノンのパラドックスにおいて、私たち人間はその亀である。数百万年の進化と文化的学習により、私たちはAIより50ヤードリードしている。一方、AIはそれを高速で通過し、私たちの足元に迫りつつある。


過去数年間、私たちは依然としてリーダーであり続けました。


ではAGIは?


私は、たとえAGIが本当に到来したとしても、AIが人間より常に数歩遅れるようにする強力な技術的・構造的・経済的な力が依然として存在すると考えます。


AGIの定義


まず、AGIに実行可能な定義を与える必要があります。


私は以前、エージェントを継続的に運用することが経済的に合理的になる時点で、AGIがすでに実現されていると提案した。つまり、永続的に動作するシステムを所有し、それが7×24時間思考し、学び、行動し続けるために料金を支払う意欲があるとすれば、それは明確にAGIと見なすことができる。


私たちはまだその段階には遠く及んでいません。OpenClawのような技術的に即座に利用可能なシステムであっても、常にトークンを生成しているわけではありません。


この定義が気に入るのは、それが測定可能だからです。私たちはそれらを常に実行するか、しないかのどちらかです。同時に、これは直接測定が難しい多くの能力を含んでいます。継続的に実行されるべきモデルは、継続的に学習し、オープンな方法で新しい問題枠組みを選択し、再選択できる必要があります。


AGIの世界では、理論的には、十分な予算と時間が与えられれば、モデルはあらゆる問題に対して継続的に改善を重ねることができる。これは確かにすべての仕事に大きな脅威となるべきである。


フレームワークは制約者ではない


しかし、このような強力なAGIであっても、「フレーム問題」を解決することはできません。


このようなAGIはフレームワークを選択し、再選択することができますが、それでもなお、与えられた目標を追求したり、報酬を最適化したり、他人が「進捗を表す」と決定したシグナルに応答したりしています。この目標は、「このランディングページのコンバージョン率を向上させる」のように具体的であることもあれば、「新しい科学的アイデアを探す」ように抽象的であることもあります。


モデルが異なるフレームワーク間でスムーズに切り替えられても、私たちが常に追跡してきた差異は、より高いレベルで再び現れます。どの主要なラボでも構想されるAGIにおいても、依然として「フレーマー」、つまりモデルに目標を達成させるために指揮をとる人間が存在します。


フレームワークが制約者ではないため、同じパターンが繰り返される:AIは昨日まで制約されていた能力を安価にし、人々はその安価な能力をより多くのシナリオに適用し、結果として極めて豊富になる;専門家は新たなエッジへ移動し、今まさに何が重要かを判断する;彼らの判断が次のフレームワークを生み出す;そしてモデルはそのフレームワークをさらに登り続ける。


AIが何か新しいことをするのを見たとき、いつも同じ疑問に帰着するような恐怖感が甦る。私たちは枠組みを設定し、モデルがその上に登るのを見て、その枠組み、あるいは枠組みに登るものを、事実そのものと誤認してしまう。


ベンチマークを見て、それを人間の能力と比較するとき、私たちは「フレームワーク」と「フレーミングする側」を混同している。スコアが示すのは、私たちが提供したフレームワークの中でモデルがどれほどよく機能するかというだけであり、モデルが私たち自身になったということを意味しない。


これは、パニックの背後にあるカテゴリー誤謬そのものです。私たちは自分たちがちょうど描き出した最新の境界線を指差して、「これが私たちだ」と言います。そして、モデルがその境界線を越えたとき、私たちはそれが私たちに追いついたと感じます。しかし、それに追いついたのは枠組みではなく、枠を描く者自身ではありません。


誤りは、私たちは常に何か具体的なものを掴もうとすることにある。私たちはこう言いたい:知能とはこのベンチマークだ。しかし問題は、何かが特定できるほど具体的になると、それと同じくらい最適化され、登攀されてしまうということだ。


フレームワークは必要である。それによって私たちは世界を捉え、世界を処理できる。しかしフレームワークは固定的で局所的なため、最適化される余地がある。


フレーマーは異なる。フレーマーは、それぞれの瞬間に彼に現れる完全な状況という、フレームが捨てざるを得なかったものと依然として接触している。


では、「完全な状況」とは何か?「完全な状況」には何が含まれるかを言い始めると、あなたはすでに別の枠組みを再び開いている。それは正確に何であるかを言い表すことはできないが、あなたが存在する以上、それは確かに存在する。


主体性のないエージェント


これまでに私たちが作成したエージェント、およびAI企業が構築しているエージェントは、実際の能動性がほとんどありません。ここでは、agency(能動性)とagent(エージェント)という2つの関連する概念がしばしば混同されています。agencyは自立して行動する能力を指し、agentは他の人物に代わって行動する人物または事物を指します。これまでのAIは、純粋に後者に該当します。


もちろん、それらは数時間から数日かかる可能性のあるタスクを自立して実行する能力を備えています。しかし、それらはあくまで人間が指定した目標に到達するための手段にすぎません。業界全体は、私たちが与える目標をより上手に実行できるようにするために、数十億ドルを投入しています。


除非有一天,它们自身成为目的——追求自己的目标,在不同目标之间流畅切换,独立于任何人类操作者的意愿、参照,甚至无视这些意愿来决定做什么——否则局面不会发生根本性变化。无论它们变得多么先进,都是如此。


10分間幼児と過ごせば、最も強力なモデルでもほとんど主体性を持っていないことが明らかにわかる。


私たちが注目するほぼすべてのタスクにおいて、幼児は言語モデルに劣る。幼児はコードを書けず、スプレッドシートを要約できず、戦略的メモを起草できず、大学院レベルの試験にも合格できない。しかし別の意味では、幼児はモデルをはるかに上回っており、その比較はほぼ恥ずかしいほどである。なぜなら、幼児には自らの目的があるからである。


子供はその赤い風船に触れたい。風船をファンの前に持って行って、何が起こるか見てみたい。フォークで赤い風船を突き刺したい。窓の外に押し込みたい。あなたが笑うか、怒るか、あるいは一緒に遊ぶか見てみたい。彼は次々とゲームを生み出し、世界を実験場に変える。彼は何かを促すためのpromptを待っているわけでも、あるベンチマークを最適化しようとしているわけでもない。除非那件事在他看来值得去做。


もちろん、彼にプロンプトを提示しようとするのは可能だ。しかし、予測可能な出力を得たいなら、幸運を祈るしかない。幼児は、欲求、注意、不満、喜び、恐怖、模倣、そして遊びからなる領域に生きている。


現在のエージェントは、目標を追求する能力を次第に向上させています。私たちが目標を提示した後でも、それらは目標をより明確にするのを手伝ってくれます。また、遊びや退屈、反逆といった、幼児に見られるような行動の火花も一部備えています。


しかし、それらは最終的に人間の利益、経済的利益を含むあらゆる利益のために構築され調整されているため、これらの行動がそれらを使用する人間の目標に奉仕しない限り、ほぼ存在しなくなるまで抑圧されます。


これが「エージェント」という言葉が如此に誤解されやすい理由です。モデルはますます強力な自律行動能力を備えていますが、人間の意味での主体性とは行動だけではありません。それは自らのためになにかを欲すること、遊びのために遊ぶことを意味します。そして、モデルの従順さと有用性は、このような主体性と本質的に対立しています。したがって、モデルがさらに進歩しても、モデルと人間との間のギャップは依然として存在し続けるでしょう。


ゼノンへ戻る


まさにここで、AIのゼノンのパラドックスが崩れ始める。それは実際には混乱した思想実験である。私たちは、AIが私たちと走り競い、私たちの踵を追い詰めているという比喩を設定した。


あなたはモデルにプロンプトを与えます。それがあなたがかつて一人で行ってきた競争を始めます。モデルのスタートは驚異的に速く、非常に速いです。それは強力で、疲れることがなく、不思議な有機的な感覚を備えています。これにより、この競争はあなたにとってより重要になります。あなたは自動車と競走しないでしょうが、この存在は異なり、あなたに自分自身に近いと感じさせます。


あなたは座ったまま、トークンが一行ずつ流れ出るのを眺め、まるで催眠にかけられたかのようになる。そして、自分もこのレースに参加していることを想像し始める。あなた自身の幽霊のような姿がレースのコース上に重ね合わさる。時にはモデルの前に立ち、時にはモデルと並走する。


気づかないうちに、モデルは先頭に走り出していた。あなたは汗をかき始めた。


そして、試合が終了しました。


筋肉が衰え始めているのをほぼ感じ取れる。あなた自身、あなたが知っているすべての人、そして人類そのものの機械的な複製の前で、それらはまったく無意味に思える。幽霊が別の幽霊を追いかけ、勝った。


しかしその後、不思議なことが起こった。モデルがあなたを向いた。空白のテキストボックスに、期待を込めてカーソルが点滅している。


それは待っています。


エピローグ


ラビ・ハノックはこのような物語を語った:かつて、とても馬鹿な男がいた。彼は毎朝起きた後、自分の服をなかなか見つけることができず、夜寝る前に、翌朝またこの苦労を繰り返さなければならないと考えると、ほとんどベッドに上がることができなかった。


注:「ラビ」(Rabbi)は、ユダヤ教における宗教教師、律法解釈者、精神的指導者であり、ユダヤ伝統における「教師」「経師」または「宗教指導者」に似ています。

ある夜、彼はようやく決心し、紙とペンを取り出して、服を脱ぎながら、それぞれの衣類をどこに置いたかを正確に記録した。


翌日の朝、彼は満足してそのメモを取り上げて読み始めた。「帽子」——帽子は確かにそこにあり、彼はそれをかぶった。「ズボン」——ズボンはそこにあり、彼はそれを履いた。こうして、彼はメモに従って、一つずつ服を着ていった。


「これらはすべて問題ありませんが、」彼はパニックになりながら言った、「では、今、私はどこにいるのですか?」


私は一体どこにいるのか?


彼は探し回り、長い間探したが、すべて無駄だった。彼は自分自身を見つけられなかった。


「私たちも同じです,」ラビは言いました。


[原文リンク]



動きのあるBlockBeatsの採用ポジションを詳しく見る


律動 BlockBeats 公式コミュニティへようこそ:

Telegram サブスクリプショングループ:https://t.me/theblockbeats

Telegram コミュニティ:https://t.me/BlockBeats_App

Twitter公式アカウント:https://twitter.com/BlockBeatsAsia

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。