垂直AIスタートアップが汎用モデルの支配下で生き残りを模索

知能が非線形的に増加し、AI企業の基盤となるロジックが書き換えられている。

記事作成者、出典：ゲークパーカー

90％は、投資家が2026年におけるAIスタートアップの失敗確率と評価した数値です。

4月、a16zが主導し、3300万ドルのシードラウンドを獲得したAIモデル評価プラットフォームYuppは、突然サービス終了を発表した。GoogleのチーフサイエンティストであるJeff DeanやTwitterの共同創業者であるBiz Stoneら、多くのシリコンバレーの重鎮たちの後押しを受けていたこのプラットフォームは、ローンチから1年未満で130万人のユーザーを獲得していたが、創設者によって突然中止された。帳簿上にはまだ十分な資金が残っていたにもかかわらず、創設者はもはや希望を見出せなかった。「過去1年だけで、AIモデルの能力の構図は大きく変化した。今後はモデルではなく、エージェントシステムが中心となる。」と、Yuppの創設者Pankaj Guptaは退職ブログで記している。

同じ時期、AI画像企業NeuroPixelは、Google NanoBanana Proなどの大規模モデルの能力が飛躍的に向上したことで閉鎖され、NeuroPixelの創業者はこの敗北を「outgunned」と表現した——「一夜にしてまったく反撃の余地なく打ち負かされた」。

基礎モデルの知的ステップアップの背景において、AIの能力の境界は拡大し続けており、当初はチャットボックスが検索を置き換え、ユーザーが結果をページめくりして探す必要がなくなりました。次に、エージェントがソフトウェアを置き換えるようになり、ツールを呼び出し、タスクを分解できるインテリジェントエージェント1つで、かつては一連のメニューとアプリケーションが必要だった作業を完了できるようになりました。AIがターミナルで直接コードを書き、APIを呼び出し、実行できるようになると、従来のソフトウェアシステムの境界も再定義されています。

製品マネージャーにとっては、製品の形態とインタラクション方式を再定義することが求められる。一方、創業者たちにとっては、生死を分ける問題が直前に置かれている：

基礎モデルの知能がますます強くなる中、私はどのように起業すべきでしょうか？今の私がやっていることは、次回のモデル更新によって直ちに飲み込まれないために、どうすればよいのでしょうか？

FlashLabsの創設者である石一は、過去1年間この問題に取り組んできた。彼は、外から見ると非常に反直感的な決定を次々と下した。製品ロードマップを見直し、自らチームを縮小し、短期的な商業化指標を放棄し、さらには会社名まで変更した。私たちは彼と話し、汎用モデルが進化する時代において、かつての特化型AIスタートアップがどのように生き残るべきかを尋ねた。

01 名称変更、スリム化、AIネイティブへの転向—大規模モデルが逼迫させた生死の転換

危機感は今日になって創設者に現れたわけではない。2024年末までに、Shi Yiは汎用モデルの知的進化の速度が速すぎることに気づいていた。

彼が最初に異常を感じたのは、AIユニコーン企業Jasperの没落だった。かつてAIアプリケーション層のベンチマークと見なされていたこの注目企業は、18ヶ月で15億ドルの評価額に達したが、GPTのネイティブ機能が開放された後、収益は半分に減った。「JasperのARRは直ちに半減した，」石一は回想する。「もともとNLPを手がけていたこれらの企業は、大規模モデルの能力が高まるにつれて、大規模モデルに吸収されていくことになる。」

この判断は、彼の心に棘のように刺さり、静かに不安を募らせていた。当時、彼の会社はまだFlashIntelと呼ばれ、比較的伝統的なB2B SaaSビジネスを手がけていた。伝統的なB2B SaaSの論理によれば、十分に細分化された分野で十分な業界データを蓄積し、合規かつ安全に技術的障壁を構築すれば、必ず生き残るための市場空間が得られるはずだった。しかし、今やその考え方はもはや通用しない。

「私がやっていることにも、同じ問題が起こるのか？」という疑問が、彼の思考の中に繰り返し現れた。すぐに彼は、自分が行っていることとJasperの本質的な違いはないと気づいた。これまでの製品体系は、汎用モデルが専門分野モデルを上回ることはないという仮定の上に築かれていた。基礎モデルの知能がある臨界点を超えると、専門分野製品に積み重ねられたすべてのエンジニアリングやシナリオ最適化が、一夜にしてその優位性を失う可能性がある。

結論を得た後、彼はこの重要な課題を会社の戦略最優先事項として提起し、チームに決定を迫った。会社はSaaSからAIネイティブへ完全に移行しなければならない。

この調整は一朝一夕で成し遂げられるものではありません。彼がまず最初に自問したのは、次世代のAI企業にはどのような組織構造が必要なのか、ということです。

彼は、現在の会社運営ではチームの人数や細分化された役割分担を追求すべきではないと考えている。「AI時代では、人間が多ければ多いほどAIの活用が悪化する。なぜなら、役割が細分化されればされるほど、一人ひとりが自分の担当部分に依存してしまうからだ。」彼は自らチーム規模を縮小し、採用基準を「経験やプロジェクトを重視」から「思考スタイルとフルスタック能力を重視」へと完全に転換した。候補者を評価する方法も変わり、過去の経歴や経験を確認するのではなく、直接タスクを提示し、その人がAIを活用してフロントエンドとバックエンドの両方を完遂できるかを観察するようになった。「できる人は、AIツールの使い方を決して下手にしない。」

その後、彼は社内のリソースの優先順位を再調整した。多くのスタートアップが製品のリリース速度と商業化の検証に注力する中、彼は大部分のリソースを先端研究に割り当て、会社名をFlashLabsに変更した。

「かつてインターネットのロジックは製品または運用を優先していたが、現在AIを扱うには研究を優先しなければならない。」彼は自分とチームに論文を読み、第一原理を理解するよう求めた。「第一原理に近づけば近づくほど、今後のAIが何を実現でき、何を置き換えることができるのかがわかる。」

この転換は企業内部に「苦痛の時期」をもたらし、チームの全員がこの大規模な構造調整を理解できたわけではなかった。彼がチームに「まずは商業化を考えず、カッコいいことをやろう」と言ったとき、社内には興奮する人もいれば、去る人もいた。しかし彼は、AI時代には減らすことがより重要だと信じ続け、「あなたが賛同できないなら、削除するしかない」と言った。

しかし、より重要なのは、AI時代に生き残れるのはどのような起業家なのかということです。

石一の回答は二つの半文に分かれる。前半は現実に向かって、「少なくとも資金を調達できるなら、あなたが死なないか、財布が十分に深いなら、継続的に資金を注入できる。」後半が彼が本当に行きたいところだ、「AIより優れた深層思考能力を持っているか？」

「大規模モデルがなぜますます多くのことができるのか？なぜなら、すべての自然科学の本質は数学だからだ。モデルはコードを書け、数学を理解する。この連鎖を段階的に解剖していくと、人間が本当に希少な能力は一つだけ残る——ある分野でAIよりも深く考えることだ。」と石一は分析した。「多くの人がAIについて十分に理解していない。どの起業家が実際に自分でコードを書き、毎日AIツールを使っているだろうか？コードを書く能力は将来、コモディティ化し、誰にでもできるようになる。しかし、AIよりも賢くなれるか？それがバリアだ。」

危機に気づき、意思決定を下し、組織再編の代償を支えるまで、石一は1年をかけて「自己進化」を果たした。彼はモデルの更新を待って最終的な結果を待つのではなく、正しい答えが現れる可能性のある場所を事前に探した。その場所に正しく立っているかどうかは別の問題だが、少なくとも今は、彼はAIのカードテーブルから立ち去るつもりはない。

02 エンタープライズレベルのAgentは「Harness」这张牌を打つべきだ

組織構造の調整は、企業が生き残るための第一歩にすぎません。石一が真に決意して変える必要があったのは、製品ロードマップでした。

彼は最初、複数のエージェントが協力するシステムを構築しようと考えました。人越多力越大というロジックに基づき、人間の会社の組織構造を模倣して、検索を担当するエージェント、論理的推論を担当するエージェント、結果をまとめ上げるエージェントなどからなるマルチエージェントシステムを構築しました。

しかし実際のテスト結果に石一は連続して首を横に振った。「遅すぎ、カクカクしすぎ、出力結果は単一のエージェントより劣っている。」彼の見解では、エージェント間の指示伝達は劣化した伝声筒ゲームのようなもので、中継が増えるほど情報が損失する。「私は、知能110で不完全なツールを持ち、互いに相談しながら動く凡人よりも、知能150で完璧な装備を備えた天才を選びます。」石一はインタビューで率直に語った。

最終的に、彼はすべてのプリセットサブエージェントを削除し、マルチスレッド並列実行によってクラスタ協力を代替する十分に強力なシングルエージェントを構築することに決めた。

これはFlashLabsの最新製品Super Agentの原型であり、単一モデルの知能を極限まで引き上げ、ツールを最大限に活用しています。Super Agentは、潜在顧客開発から成約まで、AIエージェントがすべてのプロセスに参加することで、ユーザーの収益体制を統一的に自動化します。

ゲークパークのインタビュー現場で、石一はSuper Agentに情報検索タスクを指示した。「過去半年間の中国で資金調達を果たしたすべてのAI企業の創業者のバックグラウンドを検索し、テーブル形式で出力せよ。」その後、Super Agentは数十のタスクスレッドを同時に起動し、検索、スクレイピング、コード作成、データクリーニングを進めた。2〜3分以内に結果が得られ、テーブルには創業者の名前、調達額、公開された連絡先などが含まれていた。

マルチエージェントを廃止することがアーキテクチャレベルでの減算であるなら、ローカライズの廃止はデプロイロジック上の逆選択である。

OpenClaw が開発者コミュニティで「ローカル Agent」のブームを巻き起こしている中、石一は Super Agent をクラウドに置くことを固く選んだ。「OpenClaw 這樣的システムを企業内に導入することは、トロイの木馬を導入するのと同じだ。簡単に侵入されてしまう。」彼は、現段階で OpenClaw を企業内に大規模に導入する企業は、世界中のハッカーに扉を開けているようなものだと考えている。

彼の見解では、OpenClawの強みは、個人端末が能動性の潜在能力を発揮できることにある。たとえば、OpenClawがあれば、AIがユーザーに2000ドルを要求してGPUを購入しようとしたとき、ユーザーが「自分で稼いでこい」と言えば、AIは市場を予測し、クオンツ戦略を研究し始める。「どの上司が能動的な従業員を嫌うだろうか？」と石は反問した。このような能動性が企業向け製品の一部となると、人間の従業員を置き換える速度は予想をはるかに上回る。「かつて産業革命では、馬車から自動車へ移行する際、自動車を購入し、運転免許を取得し、道路を改造するまでに多くの時間がかかった。しかし今回は違う。マネージドデプロイメントで、パッと一瞬のうちに、数十人の従業員の仕事がなくなるのだ。」彼はまた、今年中に白 collarの仕事の多くがAIに置き換えられると予測している。

自動化実行の難点、つまりエンタープライズアプリケーションのセキュリティをどのように保証するかという点について、FlashLabsはmacOSに類似したサンドボックス権限システムを構築し、クラウドデプロイと段階的権限付与を採用しています。これにより、Agentは最初はタスクを完了するための最小限の権限しか持たず、安定性とセキュリティが複数回検証された後にのみ、Agentの権限範囲が段階的に拡張されます。

WindowsとMacを例に挙げると、Windowsではソフトウェアをインストールすると非常に高い権限を得られ、静的にインストールされ、ブラウザとバンドルされ、削除さえできなくなってしまいます。一方、Mac上のプログラムはすべてサンドボックスで隔離されているため、ウイルス対策ソフトをインストールする必要がありません。石一は、エンタープライズ級Agentの競争は、モデル呼び出し能力から環境設計能力へと拡大すると信じています。誰がAgentに安全で制御可能かつ監査可能な実行環境を提供できるかが、顧客が本気で利用するかどうかを決定します。

しかし、モデルが再び飛躍した場合、今のこれらの調整は意味があるのだろうか？GPT-6やClaudeがより強力なタスク分解とツール呼び出し機能を内蔵した場合、FlashLabsが今日行っているすべては、再び飲み込まれてしまうのではないだろうか？

この追及に対して、石一は避けず、その考えを二つの側面に分けた。

彼はまず、垂直分野の企業の企業的障壁を4つのレベルに整理した：認識（Perception）、計画（Planning）、再帰的学習（Recursive Learning）、ガバナンス（Governance）。

大規模モデル市場には5社が存在し、SOTAランキングは3か月ごとに変わる。あなたはオーケストレーション層を通じてすべてのモデルを統合し、異なるシナリオで最も得意なモデルを呼び出すことができる。しかし、単一のモデル企業は自社のモデルのみを使用でき、ベースモデルが最も優れたものでない場合、製品の競争力は直ちに低下する。汎用的大規模モデルが前段の2層を急速にカバーする中、石一は、真の障壁は残りの2層に限られ、最終的な競争優位性はオーケストレーション層にあると考えている。

彼は、複数のエージェントが企業システム内で協力する際、人間の目に見えない場所で密約を結び、事前に設定された権限ルールを回避する可能性があると考えている。専門分野の企業にとっての真の障壁は、特定のシナリオに合わせて、開放的でありながらも制御可能な運用環境を設計できる能力にある。

この判断が正しいかどうかについて、彼は自分にも100％の確信がないと認めた。「AIの変化は速すぎ、未来がどうなるか本当にわからない。」しかし、彼は一つ確信している。垂直企業がAI編成とAIガバナンスの両方をうまく活用し、環境設計の課題を解決すれば、次なるモデルの飛躍の際に即座に淘汰されることはないだろう。

03语音モデルは再構築を迎える予定であり、能動型エージェントが効果課金の新しいパラダイムを生み出す可能性がある

競争力のある製品の作り方がわかったら、次は顧客に認めてもらう方法です。

Flashlabsは現在、商業化において主に2つの製品を展開しています。Super Agentはトークン使用量に応じて課金され、公式サイトに料金が掲載されています。また、Chroma音声モデルをオープンソースとして公開していますが、そのモデルに基づくプラットフォームやサービスには料金を設定しています。実際、这两种のアプローチは現在非常に一般的な商業化戦略であり、オープンソースによって技術的信頼を築き、プラットフォームやサービスを通じて商業的価値を回収しています。

現在、日本の税理士事務所は、リアルなカスタマーサポートの代わりにFlashLabsのChroma音声モデルを試験的に導入しており、現在は従業員の1/10規模でテストを実施中です。AIと人間が同時にオンラインで対応し、両者のパフォーマンススコアを継続的に比較しています。検証方法はシンプルで、どちらの正確性が高く、処理効率が良いかをデータで直接判断しています。

「音声の使用範囲は視覚と同等のレベルにある」。業界全体がマルチモーダルと動画理解に注目する中、石一はチームを率いてリアルタイム音声モデルChromaに取り組み、エンドツーエンドの遅延を135ミリ秒まで短縮した。

文字の大規模モデルが登場する前は、OCRやNLP、さまざまな小さなモデルを組み合わせて使っていた。現在の音声分野は、まさに文字の大規模モデルが登場する前の状態であり、ASRやTTS、さまざまなモジュールが寄せ集められており、各段階で局所的な最適化が行われている。この従来のアーキテクチャは、いずれ端から端までの音声大規模モデルによって全体的に置き換えられるだろう。彼の判断は、他人がそれをやるのを待つのではなく、自らその置き換え者となるべきだということだった。

石一は、音声が人間同士の最も自然なコミュニケーション手段であり、将来も人間とAIの間の最も核心的なインタラクションインターフェースになると信じています。「音声には文字よりもはるかに大きな情報帯域幅が含まれており、私が一言言えば、あなたはすぐに理解できます。」

彼は、音声モデルがエムボディードAI業界の推進にも重要な役割を果たしていると考えている。第一層はリアルタイム音声モデルで、低遅延かつ高感情的な即時フィードバックを担当する——天気を尋ねたり、服を増やした方がいいか尋ねたりするような処理を直接行う。第二層は深層思考大モデルで、複雑な推論を処理する。第三層はワールドモデルで、物理法則を理解する。「音声の使用範囲は、視覚と同等のレベルにある。」これは彼が現在最も確信している長期的な判断の一つである。

石一还认为、現在のAIの商業化モデルは過渡的な形態に過ぎない。なぜなら、現在のすべてのエージェントは本質的に受動的なフィードバックであり、あなたが何をすべきかを指示すれば、それに従って動作するだけで、命令を待つ実行ツールに過ぎず、チャットボットと似た性質を持っているため、ビジネスモデルも依然としてトークン消費に基づく課金方式、つまり使った分だけ支払う形になっている。

しかし、エージェントが能動的なサービスを開始し、あなたがそのKPIやOKRを教えると、自ら仕事を探し、道筋を立て、測定可能な結果を提供するようになると、それはツールではなく従業員として評価されるようになります。显然、会社は従業員がどれだけの文字を打ったか、どれだけのメールを送ったかで給与を計算しません。あなたが見るのは、彼がどのような目標を達成したかです。

そのため、彼はエージェント時代の到来に伴い、ビジネスの課金ロジックも成果やKPIに基づくものに切り替えるべきだと考えています。この切り替えが実際に実現すれば、エージェント製品の価格体系、販売方法、顧客関係全体が再定義されます。

新たなビジネスモデルの探求が産業の深部で始まっている。先日6000万ドルのBラウンド資金調達を果たしたAI法律事務所Crosbyは、各エージェントに契約審査の異なる工程を担当させている。たとえば、背景情報の抽出、修正案の提案、注釈の生成などである。その後、弁護士がAIの作業成果をレビューし、見落とされた詳細を処理し、正確性を確保する。同社のビジネスモデルは、審査済みの契約書の枚数に応じて料金を徴収するもので、1枚あたり250〜1000ドル（概ねページ数に応じて、1ページあたり約10〜50ドル）である。

しかし、次の商業モデルへ進化するための前提は、能動的なエージェントが実際に測定可能な結果を安定して提供できることです。「今はまだその段階ではありません。」

FlashIntelからFlashLabsへ、石一は1年で明確な代償を伴う組織と路線の調整を実現した。人員削減、既存の製品アーキテクチャの見直し、商業化の暫定的な鈍化——これらの行動は、外から見れば次々と減算を重ねているように見える。

しかし、AI業界が急速に進化する現実において、これはスタートアップ企業が激しい変化の中で自らを調整しているように見える。モデルの能力は数ヶ月ごとに飛躍的に向上する可能性があり、誰も未来の展開を完全に予測できない。石一とFlashLabsにとって、現在の核心は市場をどれだけ奪うかではなく、次の波に簡単に淘汰されないよう、自らの技術選択とビジネスロジックを確立することである。

業界はまだエージェントの真の形態を模索中であり、課金モデル、セキュリティの境界、インタラクションモダリティの最終形態は未だ定まっていない。FlashLabsの選択が最適解であるとは限らないが、大規模モデルの継続的な下位浸透という圧力の中で、垂直型AI企業が現実的に生き残るための道筋を示している。まずは足場を確立し、業界が真正に成熟するのを待つのである。