著者:宝玉
これは、ClawdBot/OpenClawの著者であるPeter Steinberger氏が、Peter Yang氏の司会で行う、もう1本の40分間のインタビューです。
Peter は PSPDFKit の創業者で、iOS 開発において20年以上の経験を持っています。2021年、同社は Insight Partners から1億ユーロの戦略的投資を受けた後、彼は「引退」を選びました。現在、彼が開発した Clawdbot(現在は OpenClaw に名称変更)が注目を集めています。Clawbot は WhatsApp、Telegram、iMessage を通じてチャットできる AI アシスタントで、あなたのコンピュータ上のさまざまなアプリケーションと連携しています。
ピーターはClawbotを次のように説明しました:
それはまるで、あなたのコンピュータに住んでいる友人のようなものです。少し変ですが、驚くほど頭が良いです。
このインタビューで、彼は多くの興味深い見解を共有しています。たとえば、複雑なエージェント(Agent)のオーケストレーションシステムが「スロップ(slop)生成機」である理由、AIを24時間連続稼働させることが「虚栄心の指標」である理由、そしてプログラミング言語がもう重要でなくなった理由などについて語っています。
1時間プロトタイプ、30万行のコード
ピーター・ヤンは、Clawbotが一体何であり、ロゴがなぜエビであるのか尋ねた。
ピーター・シュタインベーグェルは、ロブスターの質問に直接答える代わりに、物語を語った。彼は「リタイアメント」から戻ってきてから、インスピレーションに従ってコーディング(vibe coding)に没頭している。これは、AIエージェントがあなたに代わってコードを書くような仕事の仕方だ。しかし問題なのは、このエージェントが30分も動き続けることもあれば、2分で止まって質問を投げかけてくることもあるということだ。昼食を取に戻って来たら、すでにエージェントが止まってしまっていることがよくあり、非常に面倒である。
彼は、いつでもスマートフォンからパソコンの状態を確認できるようなものを欲しがっていた。しかし、彼は自分で作ろうとはしなかった。なぜなら、彼はそれがあまりにも自明のことであると感じており、大手企業がいずれ作るだろうと考えていたからだ。
昨年の11月になっても誰もやらないままだったので、私はもういいや、自分でやってしまおうと思いました。
最初のバージョンは非常に単純なものでした。WhatsApp を Claude Code に接続するだけです。メッセージを送信すると、AI が呼び出され、結果が返ってきます。1 時間で構築を終えることができました。
その後、それは「生き返った」。現在、Clawbotには約30万行のコードがあり、ほぼすべての主要なメッセージプラットフォームをサポートしている。
「これが未来の方向性だと思っています。誰もが非常に強力なAIを持ち、人生の終わりまでそばにいてくれるのです。」
彼は、「一度AIにコンピュータへのアクセス権を与えると、基本的にあなたが行えるすべてのことがAIにもできるようになる」と述べました。

モロッコのその朝
楊・ピーター氏は、今やパソコンの前に座って見ている必要はなく、単に指示を出すだけでよいと述べました。
ピーター・シュタインベッガーはうなずいたが、彼が話したかったのは別の話だった。
あるとき、彼はモロッコで友人の誕生日を祝っていたが、その間ずっとClawbotを使い続けていた。道を尋ねたり、レストランの紹介を求めたりするのは些細なことだった。本当に彼を驚かせたのはその日の朝のことだった。誰かがTwitterに投稿し、彼が公開したあるライブラリにバグがあると指摘していたのだ。
「私はそのツイートの写真を撮り、WhatsAppに送りました。」
AIはツイートの内容を理解し、これはバグ報告であることに気づきました。AIは該当のGitリポジトリをチェックアウトし、問題を修正し、コードをコミットしました。その後、Twitterでその人に対して問題が修正済みであることを返信しました。
そのとき私は思いました、「これでいいの?」と。
もう1度、信じられないようなことがありました。彼は道を歩いていて、文字を入力するのが面倒だったので音声メッセージを送ってしまいました。問題は、彼がClawbotに音声メッセージのサポートをまったく実装していないということでした。
「入力中」と表示されているのを見て、ああまずいなと思いました。結果的には、正常に返答してくれました。
その後彼はAIにどうやってやったのか尋ねた。AIはこう言った。「拡張子のないファイルを受け取ったので、ファイルヘッダを見てOgg Opus形式であることを確認しました。あなたのコンピュータにはffmpegがインストールされているので、それをWAVに変換しました。その後whisper.cppを探したのですが、インストールされていませんでした。しかし、あなたのOpenAI APIキーを見つけたので、curlを使って音声を送信して文字起こしをしました。」
楊・ピーターは聞いてこう言った。「これらの物は本当に効果があるが、少し怖い感じがする。」
ウェブ版のChatGPTよりもはるかに優れており、まるで制限が解除されたかのようなChatGPTです。多くの人が気づいていないことですが、Claude Codeのようなツールは単にプログラミングが得意というだけでなく、あらゆる問題に対して有効な解決策を提供できます。

コマンドラインインターフェース(CLI)軍団
ピーター・ヤンは、彼にその自動化ツールがどのように構築されたのか、自分で書いたのか、それともAIに書かせたのか尋ねた。
ピーター・シュタインベッガーは笑った。
彼はこの数ヶ月の間、「CLI軍団」を拡充し続けています。エージェントが最も得意とするのは何でしょうか? コマンドラインツールの呼び出しです。なぜなら、トレーニングデータにはそれがすべてだからです。
彼はGoogleサービス全体にアクセスできるCLIを構築し、Places APIも含めて利用できるようにしました。また、AIがメッセージを返す際にmemeを送信できるように、絵文字やGIF専用の検索ツールも作成しました。さらに、音声を視覚化するツールも作っており、AIが音楽を「体験」できるようにすることを目指しています。
「ローカルのデリバリープラットフォームのAPIをハッキングして、今やAIが私に食事がどのくらいで届くか教えてくれるようになりました。また、Eight SleepのAPIを逆解析して、今ではベッドの温度をコントロールできるようになりました。」
【注:Eight Sleep は温度調節機能付きのスマートマットレスであり、公式では API が公開されていません。】
Peter Yang が追問した。「これらはすべて、AI に作ってもらったの?」
「最も面白いのは、以前 PSPDFKit で Apple エコシステムの開発を 20 年間やってきたことです。Swift や Objective-C には非常に精通していました。しかし戻って来てからは、Apple がすべてを管理しようとする姿勢にうんざりしていたことから、軌道を変えることに決めました。また、Mac アプリのターゲット層が狭すぎるのも理由の一つです。」
問題は、ある熟練した技術スタックから別のものへ移る過程が非常に苦痛だということです。すべての概念は理解しているつもりでも、構文が分からないのです。propsとは何か? 配列をどう分割するのか?というような小さな問題ごとに調べ物をしなければならず、自分はまるで初心者に戻ったかのように感じられてしまいます。
その後、AIが登場し、すべてが消え去った。あなたのシステム思考、アーキテクチャ能力、センス、依存関係の判断力こそが、本当に価値のあるものであり、今やこれらはあらゆる分野に簡単に移行できるようになった。
彼は一瞬ためらった。
突然、自分なら何でも作れると感じた。言語は重要ではなくなり、大切なのは自分のエンジニアリングの考え方だ。

現実世界を制御する
ピーター・シュタインベッガーが自身の設定をデモする。彼がAIに与える権限リストは驚くべきものである:
メール、カレンダー、すべてのファイル、フィリップス・ハーユーの照明、ソノスのスピーカー。AI が彼を朝起こし、ゆっくりと音量を上げてくれる。また、AI は彼のセキュリティカメラにもアクセスできる。
ある時、彼に見張らせました。不審者がいないかを確認するためです。次の日の朝、彼が私に言いました。「ピーター、誰かいますよ。」私は録画を見てみましたが、彼はその夜ずっと私のソファをスクリーンショットしていました。カメラの画質が悪かったため、ソファに誰か座っているように見えたのです。
ウィーンのアパートでは、AIはKNXスマートホームシステムも制御できます。
「本当に私を外に閉じ込めることができるのよ。」
Peter Yang さんが尋ねました。「これらはどのように接続されているのですか?」
「それは、直接それに話しかけることだ。これらは非常に巧妙で、自分でAPIを探し、グーグル検索をし、あなたのシステムの中からキーを探し出すことができる。」
ユーザーたちのプレイ方法はさらにエスカレートしている:
- 誰かがTescoでオンラインショッピングをさせた
- 誰かがAmazonで注文しました
- 誰かがすべてのメッセージに自動で返信するように設定してしまった
- 誰かがそれを家族のグループチャットに招待して「家族の一員」として扱っている。
「British Airwaysのウェブサイトでチェックインを手伝ってもらったんだ。これはまさにターリングテストだよ。航空会社のウェブサイトでブラウザを操作するって、そのインターフェースの使いにくさ、君ならご存知だろう?」
最初は、システム全体がまだ未熟であったため、約20分かかりました。AIは彼のドロップボックスでパスポートを見つけて情報を抽出し、フォームに入力し、人間による検証を通過する必要がありました。
今やほんの数分で完了します。これは、本当にブラウザを操作しており、人の行動パターンと区別がつかないため、「私は人間です」という検証ボタンをクリックできるからです。

80%のアプリは消えてなくなる
Peter Yangの質問:ダウンロードしたばかりのユーザーが安全に始めるためにどのような使い方がありますか?
ピーター・シュタインベッガー氏は、それぞれのユーザーの道のりはすべて異なると語っています。あるユーザーはインストールしたその日にiOSアプリの作成を始め、あるユーザーは直ちにCloudflareの管理を始めた人もいます。あるユーザーは最初の週に自分自身に導入し、次の週には家族に導入し、3週目には企業向けバージョンの作成を始めた人もいます。
「私がノンテクの友人にインストールした後、彼は私にプルリクエストを送り始めました。彼はこれまでの人生で一度もプルリクエストを送ったことがありませんでした。」
しかし彼が本当に言いたかったのは、より広い視点のことでした:
もしあなたがよく考えてみれば、この製品はあなたのスマートフォンにある80%のアプリに代わるものになるかもしれません。
なぜまだ MyFitnessPal を使って食事を記録するのか?
「私は無限にリソース豊富なアシスタントを持っています。それが、私がケンタッキー・フライド・チキンで誤った決断をしたことをすでに把握しています。私が写真を送ると、それはデータベースに保存され、カロリーが計算され、ジムへ行くべきだというアラートが届きます。」
なぜ Eight Sleep の温度設定のためにアプリを使うのでしょうか?AI は API 権限を持っているので、直接設定できます。なぜ ToDo アプリを使うのでしょうか?AI が記憶してくれます。なぜ飛行機のチェックインのためにアプリを使うのでしょうか?AI が代行します。なぜショッピングアプリを使うのでしょうか?AI はおすすめし、注文し、追跡もできます。
「アプリ全体が徐々に消えていく階層が出てくるだろう。なぜなら、APIを持っているアプリは、単にあなたがAIが呼び出すサービスに過ぎないからだ。」
彼は2026年が多くの人が個人用のAIアシスタントを探求し始める年になるだろうと予測し、大手企業も参入してくるだろうと述べました。
「Clawbotが必ずしも最終的な勝者であるとは限らないが、この方向性は正しい。」

ただ話しかけなさい
話題をAIプログラミングの方法論に移しましょう。Peter Yang氏は、人気の高い記事「Just Talk to It(単に話しかけろ)」を書いたと述べています。彼の説明をもっと詳しく聞いてみたいものです。
ピーター・シュタインバーグャーの主張する核心的な点は、「エージェントトラップ(agentic trap)」にはまらないことである。
「Twitterで、あまりにも多くの人がエージェントのすごさに気づき、さらにそれを強化しようと試みて、気づかないうちに穴に落ち込んでいるのを見かけます。彼らは作業フローを加速するためのさまざまな複雑なツールを構築するのですが、結局はただのツールを作っているだけで、本当に価値のあるものを作っていないのです。」
彼自身も同じ轍を踏んでしまったことがある。初期の頃、彼はスマホで端末にアクセスできるようになるために、2か月かけてVPNトンネルを構築した。あまりにうまく機能してしまい、ある日レストランで友人と食事をしていた際、彼は会話に参加するのではなく、スマホを使ってずっとコーディングをしていた。
私はやむを得ず休まなければならなかった。主に精神的な健康のためである。

スロップタウン
彼が最近取り憑かれたのは、ガストウンという名前のオーケストレーションシステムです。
非常に複雑なオーケストレーター(orchestrator)で、10〜20のエージェントが同時に動作し、お互いに通信しながら分業しています。観察者(watcher)、監督者(overseer)、市長(mayor)、pcats(おそらく「市民」や「ペットの猫」など、補助的な役割を果たす存在)など、さまざまな役割があります。それ以外にも、さまざまな役割があることすら分からないほどです。
Peter Yang:ええと、市長も?
「ええ、ガストウンプロジェクトには市長がいます。私はこのプロジェクトを『スロップタウン(Slop Town)』と呼んでいます。」
RALPHモードもあります(「使い捨て」のシングルタスクループモードで、AIに小さなタスクを与えて、完了したらすべてのコンテキストメモリを破棄し、すべてをゼロからやり直すという死ぬまでループするものです)。
これはまさに究極のトークン焼却機だ。一晩かけて動かして、翌朝得られるのはただのスロップ(雑煮のようなもの)である。
問題の核心は、これらのエージェントに「品位」がないということです。ある面では非常に知的に見えるほどですが、あなたがそれらを導かなかったり、何を望んでいるのかを伝えなかったら、出力されるのは役に立たないものです。
「他人がどのように仕事をしているかは分かりませんが、自分自身はプロジェクトを始めるときには、漠然としたアイデアしかありません。実際に作業を進めたり、遊んだり、感じたりする中で、自分のビジョンが少しずつ明確になっていきます。試行錯誤を重ね、うまくいかないこともありますが、その過程で自分の考えは最終的な形へと進化していきます。次のプロンプトは、私が今感じていること、見ていること、考えていることによって決まります。」
もしすべてを事前仕様に書こうと試みれば、あなたは人間とコンピュータのこの循環を失ってしまいます。
「感覚や味わいに無関心であるならば、どうやって良いものを作れるのかわかりません。」
誰かが Twitter で「すべてRALPHによって生成された」と自慢するメモアプリを紹介していました。ピーターは返信しました。「そうですよね、RALPHが生成したように見えます。正常な人ならこんなデザインはしません。」
楊・ピーターの要約:多くの人がAIを24時間動かすのは、アプリを作るためではなく、AIを24時間動かせることを証明するためです。
これは、基準がないまま大小を競うようなものです。私もループを26時間回すようにして、当時はとても自慢げでした。しかし、これは驕慢な指標であり、まったく意味がありません。すべてを作り上げられること=すべてを作り上げるべきだというわけでも、それが良いものであるというわけでもありません。

Plan Mode は寄せ集め(ハック)です
Peter Yang が、コンテキストをどう管理しているか尋ねています。会話が長くなるとAIが混乱してしまうため、手動で圧縮したり要約したりする必要があるのでしょうか?
ピーター・シュタインベッガーは、これは「古いパターンの問題」だと言った。
Claude Code にはまだこの問題がありますが、Codex ははるかに良いです。紙の上では文脈長が30%ほど増えるだけかもしれませんが、実際の使い心地では2〜3倍の違いがあります。これは内部の思考メカニズムに関係していると思います。現在、私の機能開発の多くは1つの文脈ウィンドウ内で完結し、議論と構築が同時に進行しています。
彼は worktrees を使わなかった。それは「不要な複雑さ」だからだ。彼は単に複数のリポジトリを checkout していた。clawbot-1、clawbot-2、clawbot-3、clawbot-4、clawbot-5 といった具合である。空いているものを使い、テストを実施し、main ブランチに push して同期する。
「すべてが忙しいときは、ちょっと工場のように感じるかもしれません。しかし、1つだけ起動していると待ち時間が長くなりすぎて、集中状態に入ることができません。」
Peter Yangは、これはリアルタイム戦略ゲームのようだと述べており、攻撃するチームを管理・監視しなければならないと説明しています。
plan modeについて、Peter Steinberger氏には論争を巻き起こすような見解があります:
「Plan mode は、Anthropic がモデルが衝動的すぎるために、コードをすぐに書くのを防ぐために追加した暫定的な仕組みです。もし最新のモデル、たとえば GPT 5.2 を使うと、あなたはモデルと会話します。『この機能を作りたいんだけど、こうやったらどうかな、このデザインスタイルが好きで、いくつかの案を出してほしい。まずは話してみよう』と話しかけると、モデルは提案をし、あなたたちが議論し、合意に達した後で初めて実行に入ります。」
彼はタイプを打たない。彼は話す。
私はほとんどいつも彼と話しています。

Discord ドライバ開発
ピーター・ヤンが、新しい機能を開発するプロセスについて尋ねています。まず問題を探究するのでしょうか?それともまず計画を立てるのでしょうか?
ピーター・シュタインベガー氏は、「おそらく私がこれまでに最も馬鹿げたことをやった」と語っています。彼は自身のClawbotを公開のDiscordサーバーに接続し、誰もが彼のプライベートAIと会話できるようにしました。そのAIには彼のプライベートな記憶が含まれており、すべてが公開の場で行われました。
このプロジェクトは言葉ではうまく説明できません。アイアンマンに出てくるJarvis(ジャービス、AIアシスタント)と映画『HER』のハイブリッドのようなものです。実際に目の前でデモをした人たちはみんな超えて興奮してくれますが、Twitterに画像と文章を投稿しても注目されません。だから、ユーザー自身が実際に体験してもらうことにしました。
ユーザーたちはDiscordで質問したり、バグを報告したり、要望を出したりします。彼の現在の開発フローは、Discordのチャットのスクリーンショットを撮り、それを端末にドラッグしてAIに「これについて話しましょう」と言います。
「私はタイプするのが面倒くさい。誰かが『これは○○や△△をサポートしていますか?』と尋ねてくると、AI にコードを読ませて、FAQ を1つ作らせるのだ。」
彼はさらに、クローラーを作成し、毎日少なくとも1回はDiscordのhelpチャンネルをスキャンして、AIが最大の問題点を要約するようにし、その後、それらの問題を修正しています。

MCP不要、複雑なオーケストレーションも不要
Peter Yang が尋ねます。「あなたはあの派手な機能を使っていますか?マルチエージェント、複雑なスキル、MCP(モデルコンテキストプロトコル)など?」
私のスキルの多くは生活スキルです。食事の記録、買い物、その類いのものです。プログラミングのスキルはほとんど必要ありません。MCPも、その他のものは一切使いません。
彼は複雑なスケジューリングシステムを信じていなかった。
私は今、サイクルの中にいます。より良い感じのする製品を作り出すことができます。より速い方法があるかもしれません。しかし、もうAIの限界ではなく、私が直面しているのは自分の思考速度に制限されていることが主で、ときにはCodexの待機時間に制限されているのです。
彼の以前のPSPDFKitの共同創業者で、かつて弁護士だった人物も現在、彼にプルリクエスト(コードのマージリクエスト)を送っている。
「AI によって、技術的な背景を持たない人も物事を構築できるようになるのは、とても素晴らしいことです。私は、このコードが完璧ではないという反対意見があることを知っています。しかし、私は pull request を prompt request(プロンプトリクエスト)と見なし、それは意図を伝えるものです。ほとんどの人は、システムを十分に理解していないため、モデルを最適な結果へと導くことができません。そのため、私は意図を手にした方が良いと考え、自分で実行するか、あるいは彼らの PR を基に再構築します。」
彼は彼らを共著者として記載するが、他人のコードを直接マージすることはほとんどない。

自分の道を切り開け
楊ピーターの要約:つまり、重要なポイントは、スロップジェネレーターを使わず、人間をループの中に保つことです。なぜなら、人間の脳とセンスは代替不可能だからです。
ピーター・シュタインバーグャーは一文を追加した。
あるいは、自分自身の道を見つけることです。多くの人が私に「あなたはどうやってやっているのですか?」と尋ねますが、答えはこうです:自分自身で探求しなければなりません。これらのことを学ぶのには時間がかかり、自分自身の間違いを犯さなければなりません。これは何を学ぶにも同じことであり、ただこの分野では特に変化が早いというだけです。
Clawdbot はclawd.botGitHub 上でも見つけることができます。Claw は W 付きで C-L-A-W-D-B-O-T と読み、カニのつめのように聞こえます。
(注:ClawdBot は OpenClaw に名称変更されました)
Peter Yangは、自分も試してみるつもりだと話しました。コンピュータの前に座ってAIとチャットするのではなく、外で子供を連れて歩きながらもいつでもコマンドを出すことができるようにしたいと考えています。
「あなたが好きになるだろうと思います。」とピーター・シュタインバーグァは言いました。

ピーター・シュタインバーグァの主張の核心は、次の2つの文にまとめることができる:
- AIはすでに、あなたのスマートフォンにある80%のアプリを置き換えるほどの性能を持っています。
- しかし、人間の品位や判断がそのサイクルに入っていなければ、出力されるものはゴミになるだけです。
この2つの文は一見矛盾しているように見えますが、実際には同じ結論を指しています。AIはレバレッジであり、置き換えではないということです。AIによって拡大されるのは、もともとあなたが持っているものなのです。それはシステム思考、アーキテクチャ能力、そして優れた製品に対する直感です。もしあなたがこれらの能力を持っていないなら、どれだけのエージェントが24時間並列で動いても、それはただのslop(粗末な出来物)を大量生産しているに過ぎません。

彼の実践そのものが最も良い証拠です。20年間iOSのプログラミングをやってきたベテランが、数ヶ月の間にTypeScriptで30万行ものコードを含むプロジェクトを構築しました。これは新しい言語の文法を学んだからではなく、言語に依存しないスキルや知識があったからこそできたことです。
「プログラミング言語は重要ではなく、大切なのは私のエンジニアリング・マインドだ。」
