著者:a16z
翻訳:深潮 TechFlow
深潮導読:MITは企業の生成AIパイロットプロジェクトの95%が成功に至らないと主張しているが、a16zは自社ポートフォリオ企業の実データをもってこの主張に反論。フォーチュン500企業の29%、グローバル2000企業の19%が既にAIスタートアップの有料顧客となっており、プログラミングツールにより最優秀エンジニアの生産性が10〜20倍向上している。この23,928語のレポートは内部データに基づき、どのAIシナリオが実際の価値を生み出しているか、どのシナリオが依然として概念的な炒作にとどまっているかを明らかにする。
AIが大企業でどの程度進展しているかについての推測は多いが、現在の情報のほとんどは、自己報告されたAIの使用や、定量的なデータではなく定性的な購入者の感情を捉えた調査で構成されている。また、既存のわずかな研究は、AIが企業でうまく機能していないと主張しており、特にMITの研究は、生成AIのパイロットプロジェクトの95%が実用化に至らなかったと主張している。
私たちの内部データと企業経営陣との対話を基に、この統計データは信じがたいと判断しました。私たちは、AIが最も広く採用されている場所やROIが明確に現れている場所を綿密に追跡し、企業におけるAIの実際の効果に関する確実なデータをまとめています。
企業におけるAIの浸透率
我们的分析显示,财富500强中29%的企业和全球2000强中约19%的企业是领先AI初创公司的活跃付费客户。

この統計に含まれるには、これらの企業がAIスタートアップとトップダウンの契約を締結し、パイロットを成功裏に転換し、自社組織内で製品を導入しなければなりません。
この短い期間でこのような浸透レベルに達したことは顕著である。なぜなら、フォーチュン500企業は技術の早期採用者として知られていないからである。歴史的に見ると、多くのスタートアップは、初期の動力を得るためにまず他のスタートアップに販売しなければならず、数年後に初めて企業との契約を結び、フォーチュン500規模の顧客を獲得するまでにさらに多くの収益と時間が必要だった。
AIはこの常識を覆した。OpenAIは2022年11月にChatGPTをリリースし、消費者と企業にAIの可能性を即座に示した。これにより、過去のどの技術世代も引き起こさなかったAIへの関心の嵐が巻き起こり、大企業はこれまで以上に新製品に早期に賭ける意欲を高めた。その結果、たった3年余りで、フォーチュン500の約3分の1、グローバル2000の5分の1が組織内で本格的な企業向けAI導入を実現している。
企業のAIにおいて何が効果的か

この採用はどこで最も速く発生し、それはモデルが本質的に得意とする作業にどのようにマッピングされますか?
我々は、各ユースケースの収益の勢いを、GDPval(OpenAIが提唱する有名なベンチマークで、モデルが現実の経済において価値を生むタスクを実行する能力を評価する)が定義するモデルの理論的能力に重ね合わせることが、最も示唆に富む評価方法であると発見しました。この2つの要因は、モデルがどれほど優れる可能性があるか、そして今日どれだけの価値を実際に提供しているかを総合的に示しています。これにより、AIの採用が現在どこにあり、今後どこに向かう可能性があるか、そしてモデル能力が成熟しているにもかかわらず、採用面で依然としてAIが未達成の領域がどこにあるかを明確に理解できます。
今日、企業AIはどこで最も価値を提供していますか?
収益の勢いにおいて、企業のAI導入は明確なユースケースと業界が主導している。プログラミング、サポート、検索がこれまでの主要なユースケースを占めており(プログラミングはこのグループ内でも桁違いの異常値)、テクノロジー、法律、医療保健分野がAI導入に最も積極的な業界である。

プログラミング:プログラミングはAIの主な使用事例であり、ほぼ1桁上の規模に達している。これは、Cursorなどの企業が報告する爆発的な成長や、Claude CodeやCodexなどのツールの超高速成長から明らかである。これらの成長率は、ほぼすべての最良の予測を上回っており、これまでにフォーチュン500/グローバル2000企業がAIツールを導入した大部分はコード関連である。
多くの点で、プログラミングはAIの理想的な使用例であり、技術的能力面でも企業市場の受容面でもそうである。コードはデータ集約的であり、オンラインにはモデルのトレーニングに使用できる大量の高品質なコードが存在する。また、テキストベースであるため、モデルが解析しやすい。厳密な構文と予測可能な結果を持ち、正確で明確である。さらに重要なのは、コードは検証可能であるということだ。誰でもそれを実行し、それが有効かどうかを確認できるため、モデルの学習と改善に密なフィードバックループを生み出す。
ビジネスの観点から見ても、これは非常に優れた応用です。私たちは常に、ポートフォリオ企業が、AIコーディングツールにより最優秀エンジニアの生産性が10〜20倍向上していると聞いてきました。エンジニアの採用は常に困難で高コストであり、その生産性を向上させるあらゆる手段には明確なROIが存在します——AIコーディングツールがもたらす生産性の向上は、採用を促す大きなインセンティブを提供しています。また、エンジニアは通常、最適なツールの早期採用者でもあります。プログラミングは、他の多くのビジネス業務と比べてより個別的なタスクであるため、彼らは協調や官僚主義といった他の部門を悩ませる要因に煩わされることなく、単純に最良のツールを見つけ、採用しやすいのです。
また、プログラミングツールは、タスクを100%エンドツーエンドで完了しなくても付加価値をもたらす。たとえば、バグの検出やボイラープレートコードの生成といったあらゆる加速は、時間を節約し、有用である。プログラミングは人間が密接に関与するワークフローであるため、開発者は今日も開発プロセスを監督しており、これらのツールは出力の加速を図りながらも、人間の判断によるレビュー、編集、反復の余地を残している。これにより、企業の信頼性が高まり、採用パスがよりスムーズになる。
プログラミング能力は指数的に向上しており、各研究所はコードを勝利のユースケースとして明確に焦点を当てている。これは大きな影響を及ぼす。コードはあらゆる他のアプリケーションの上流に位置し、あらゆるソフトウェアの基本的な構成要素であるため、AIによるコードの加速は他のすべての分野の進展を促進する。これらの分野における参入障壁が低下し、AIを活用した新たな機会が開かれる一方で、同様のアクセス可能性により、スタートアップが持続的な競争優位を築くことはかつてないほど重要になっている。
サポート:バーの反対側で、コードとは対照的に存在する。ソフトウェアエンジニアリングは通常、組織内で最も多くの投資と注目を集めるが、サポートは見過ごされがちである。サポート業務はバックグラウンドで、エントリーレベルの仕事であり、企業は自社で管理するのが煩雑で複雑だと考えているため、海外の企業やビジネスプロセスアウトソーシング会社(BPO)に外注されることが多い。
AIは、いくつかの理由からこの業務の管理に優れていることが実証されています。まず、サポート対応の大部分は時間制限があり、明確な意図(例:返金の要求)を伴うため、エージェントに処理すべき明確な課題を提供します。サポートは、タスクが明確に定義されている唯一の機能でもあります。サポートチームは規模が大きく、人員の流動性も高いため、新規代表を迅速かつ標準化された方法で訓練する必要があります。そのため、各代表の業務を導くための明確に文書化された標準操作手順(SOP)が整備されています。これらのSOPは、AIエージェントが模倣できる明確なルールとガイドラインを提供します。これは、他のほとんどのビジネス環境と区別される点です。他の環境では、対応が長期間にわたり、定義が曖昧であり、顧客やサービス担当者以外の多くのステークホルダーが関与します。
サポートは、ROIを最も明確に示す企業機能の一つです。サポートは定量的な指標に基づいて運営されています:対応したチケット数、顧客のCSAT(満足度)スコア、解決率です。現在の状況とAIエージェントとのどのA/Bテストでも、AIエージェントは有利な結果をもたらします:より多くのチケットに対応し、解決率を向上させ、顧客満足度スコアを高めます——すべてがより低いコストで実現されます。ほとんどのサポートは既にBPOにアウトソースされているため、AIソリューションの導入には限られた変更管理で済み、導入パスをより容易にします。
100%正確である必要はなく、人間への自然な出口(例:「マネージャーに引き継ぎます」)があるため、販売サイクルをより速く進めることができ、AIサポートエージェントのパイロット実施もリスクが低い。最悪の場合、100%のケースは単に人間が対応するよう引き継がれるだけである。
最後に、サポートは本質的に取引的である。顧客は反対側に誰がいるかには関心がなく、そのためサポートにはAIが再現できない人間的な関係は必要ない。これらの特徴が、DecagonやSierraなどの企業が急速に成長し、SalientやHappyRobotなどのより専門的なサポート参加者が増加している理由を説明している。
検索:最後に明確な企業市場の牽引をもつレベルのカテゴリは検索である。ChatGPTの主な使用事例自体が検索であるため、検索の影響はChatGPTの収益と利用に深く浸透している可能性があり、ここでは大きく過小評価されている。
AI検索は、そのカテゴリが広範であるため、多くの独立した大規模なスタートアップの出現を可能にしました。企業内における主要な課題の一つは、従業員が自社システムのさまざまなデータセットから関連情報を簡単に検索・抽出できるようにすることです。Gleanは、このユースケースにおける主要なスタートアップサプライヤーとして繁栄しています。多くの大規模業界は、非常に特定の業界情報(内部および外部)に基づいて運営されており、Harvey(法律検索から始まる)やOpenEvidence(医療検索から始まる)などの企業は、この分野を中心に製品を構築することで繁栄しています。

業界
技術:これまでにAIを最も広く採用した業界はテクノロジー業界である。ChatGPT自身は、ビジネスユーザーの27%がテクノロジー業界から来ていると報告しており、Cursor、Decagon、Gleanなどの企業の多くの初期顧客もテクノロジー企業である。テクノロジー業界が常に早期採用者であり、AIの波を生み出した業界であることを考えれば、これはまったく驚くべきことではない。
さらに驚くべきことに、過去に早期採用者とは見なされていなかった市場が、今回は強い需要を示しました。
法律:法律は、AIにおける先駆的な業界の一つであるという点で驚異的である。法律分野は過去、ソフトウェアの導入が困難な市場と見なされており、スケジュールが長く、購入者が技術的に未熟であった。
従来の企業ソフトウェアは、弁護士に対して限られた価値しか提供していません。静的なワークフロー工具は、弁護士が通常行う非構造的で繊細な作業を加速できないからです。しかしAIは、技術が弁護士にもたらす価値をはるかに明確にしています。AIは、濃密なテキストの解析、大量のテキストに対する推論、そして要約や返信の作成が得意であり、これらはすべて弁護士が日常的に行う作業です。AIは現在、個々の弁護士の生産性を高めるためのコパイロットとして頻繁に活用されていますが、さらにその範囲を広げ始めています。ある場合では、法律事務所がより多くの案件を処理できるようにすることで、実際に収益を生み出しています(例:Eveは原告法に特化しており、このようなケースです)。
結果は明確です。Harveyは設立3年以内に約2億ドルの年間継続的収入(ARR)を報告し、Eveのような企業は450人以上の顧客を抱え、今年の秋に10億ドルの評価額に達しました。
医療保健:医療保健は、従来のソフトウェアではこれまでにない方法でAIに応答している市場です。Abridge、Ambience Healthcare、OpenEvidence、Tennrなどの企業は、医療記録、医療検索、または医療の提供と支払いを管理する複雑なルールのバックオフィス自動化といった特定のユースケースに基づいて、急速に収益を拡大しています。
医療保健分野は、1)高度で複雑な業務が従来のワークフローソフトウェアが解決できる問題とマッチしにくく、2)EpicなどのシステムがEHRの記録を支配し、新規ソフトウェアベンダーの参入を圧迫してきたため、ソフトウェアの導入が遅れていました。しかしAIの登場により、企業は医療記録担当者などの行政業務を置き換えたり、医師が行っているより価値の高い業務を強化したりすることで、EHRシステムの記録を回避する個別の人的作業を担えるようになりました。この作業は十分に独自であるため、EHRを破棄して置き換える必要がなく、既存のソフトウェアベンダーを置き換えることなく、これらの企業は迅速に拡大できます。
分析に関するいくつかの注意点
これらの推定値は最良の推定値です。各カテゴリで発生する収益額を過小評価し、モデルの能力を過大評価している可能性があります。
収益を過小評価した可能性がある理由は:
収益分析は、大規模で独立した企業AI事業を生み出すのに十分に成功した部門とユースケースに基づいており、他のスタートアップが対応しているユースケースのロングテールは除外している。
これらの市場の多くには、顕著な収入を生み出している非スタートアップ企業の参加者も存在します(例:コード分野のCodex/Claude Code、法律分野のThomson ReutersのCoCounsel)。ただし、本分析では独立したスタートアップ企業の参加者に焦点を当てます。
私たちの分析で述べられている多くのタスクは、モデル企業のコア製品(例:ChatGPT や OpenAI の検索)に統合されている可能性がありますが、これらは分割されず、今回の分析には含まれていません。
この分析は、消費者またはプロフェッショナル消費者向けビジネスではなく、企業ビジネスに焦点を当てています。Replit や Gamma などの成功したビジネスは、相当数のビジネスユーザーを抱えていますが、現在は主に消費者またはプロフェッショナル消費者向けに焦点を当てています。本分析は企業AIおよび企業が価値をどのように得ているかに焦点を当てているため、消費者主導のビジネスは除外しています。
能力の面では、AIが経済のさまざまなセクターに与える影響を測定することは極めて困難であり、多くの経済学者がその試みを続けている。仕事自体が本質的に定義が曖昧でロングテールであるため、完全な自動化は非常に難しい。現在のところ、企業が部分的な自動化からどれほどの価値を得られるかは明確ではない——AIが人間のタスクの50%しか実行できない場合、自動化できないタスクの重要性はボトルネックとなるため上昇し、その相対的価値も高まる可能性がある。したがって、今日の能力状態を過大評価している可能性がある。なぜなら、能力の1%の向上が経済的価値の1%の増加に直結するわけではないからだ。しかし、相対的な能力と、新しいモデルのリリースごとにそれらがどのように改善されているかに注目することは依然として示唆に富んでいる。
AIがすべての市場に進出しています

この分析は、GDPvalベンチマークを通じて、トップ評価モデルが人間の専門家に勝つ確率を測定しています。これに基づけば、2025年秋以降、モデルは経済的に価値のある作業において顕著に向上していることが明らかです。
では、なぜこの評価で上位にランクされた業界すべてが、他の業界と同じタイプの収益の勢いを示していないのでしょうか?
これまでAIを積極的に採用してきた業界にはいくつかの共通点がある:それらはテキストベースであり、機械的で繰り返しの作業を伴い、人間がプロセスに参加して人的判断を加え、規制が限定的であり、明確に検証可能な最終出力(例:実行されるコード、解決されたサポートチケット)を持つ。多くの業界はこれらの特性を持っていない。それらは物理世界を扱ったり、人間関係に大きく依存したり、多数の利害関係者間で顕著な調整コストが発生したり、規制やコンプライアンスの障壁があったり、検証可能な結果が欠如していたりする。収益の勢いとモデルの能力は明らかに関連しているが、モデルの能力が理論的に人間の勝率50%未満の分野(例:法律)では、Harveyのような企業は、個人の法律業務を補助する副操縦士製品を通じて市場シェアを迅速に獲得し、モデルの進化に伴ってコア製品を継続的に改善することができている。
ここで最も注目すべき発見は、モデルの能力が急速に向上していることです。過去4か月で、会計と監査ではGDPvalで約20%の飛躍的改善が見られ、警察・探偵業務などの分野でも約30%の改善が示されています。これらの飛躍は、関連分野において注目すべき新製品や新企業を生み出すと期待されます。さらに、モデルを提供する企業は、電子表格や財務ワークフローにおける核心的な作業、レガシーシステムや業界の難しい課題をコンピュータで処理すること、そして長期的なタスクにおける意味のある改善を図ることを明確に発表しており、これは簡単に短く分割して消化可能な部分に切り分けられない新たな種類の仕事の開拓を可能にしています。
開発者への示唆
企業がどこで価値を得ており、どのようにROIを考慮しているか、そしてどの部門が明確に効果を実感しており、どの部門が今後注目されるかを理解することで、AI構築者がどの機会に注目すべきかをより明確に考えることができます。
テクノロジー、法律、医療保健の購入者向けサービスは現在明らかに肥沃な市場であるが、各カテゴリーに「勝者」が1つだけ存在すると私たちは信じていない。たとえば法律分野では、社内法務、法律事務所、特許弁理士、原告側弁護士など、さまざまなタイプの弁護士が存在し、それぞれ異なるワークフローとニーズを有している。医療保健分野も同様に、さまざまなタイプの医師や医療施設などによって構成されている。
これらの部門に加えて、もう一つの生産的な考え方は、能力が強化されているが、収益面ではまだブレークスルーを達成していない企業です。現在、多くのビジネスはモデルの能力が製品を真正に解き放つ前に構築されていますが、それらは十分な技術基盤と顧客/市場の認知を築いており、モデルの解き放ちが訪れた際には最も有利な立場にあります。
最後に、ラボが最新の研究をどの経済的に価値のある分野に集中させているかに注目することが重要です。長期エージェントの急速な改善、コンピュータ利用への大規模な投資、およびテキスト以外のモダリティ(例:スプレッドシート、プレゼンテーション)への信頼性の高いインターフェースの研究により、新たな一連のスタートアップが、意味のある企業価値を生み出すために必要な基盤をすぐに手に入れることになります。
データ方法:このデータは、本報告のために当社とデータを共有した先進的な企業AIスタートアップを含む、プライベートデータ、公開データ、およびa16zでのスタートアップおよび大企業との数千件の対話から分析された匿名データを総合したものである。
