Fondateur d'OpenClaw : L'IA est une levier, pas un remplacement ; 80 % des applications seront remplacées

C'est un autre entretien de 40 minutes avec Peter Steinberger, auteur de ClawdBot/OpenClaw, animé par Peter Yang.

Peter est le fondateur de PSPDFKit et possède plus de 20 ans d'expérience en développement iOS. Après que l'entreprise ait été stratégiquement investie par Insight Partners pour un montant de 100 millions d'euros en 2021, il a choisi de prendre sa retraite. Aujourd'hui, Clawdbot (maintenant renommé OpenClaw), qu'il a développé, connaît un vif succès. Clawbot est un assistant IA capable de discuter avec vous via WhatsApp, Telegram et iMessage, et qui est connecté à diverses applications sur votre ordinateur.

Peter décrit ainsi Clawbot :

C'est comme un ami qui habiterait dans votre ordinateur, un peu bizarre, mais incroyablement intelligent.

Dans cet entretien, il partage plusieurs points de vue intéressants : pourquoi les systèmes complexes d'orchestration d'agents (Agent) sont des "générateurs de brouillard", pourquoi "faire fonctionner l'IA 24 heures sur 24" est un indicateur de vanité, et pourquoi les langages de programmation ne sont plus importants.

Un prototype en une heure, 300 000 lignes de code

Peter Yang se demande ce qu'est exactement Clawbot et pourquoi le logo est un homard.

Peter Steinberger n'a pas répondu directement à la question sur les homards, mais a raconté une histoire. Après son retour d'une "retraite", il s'est entièrement consacré au "vibe coding" (programmation par intuition) - une méthode de travail consistant à laisser un agent d'IA écrire du code à votre place. Le problème, c'est que l'agent peut tourner pendant une demi-heure, ou s'arrêter au bout de deux minutes pour vous poser des questions. Vous allez manger un morceau et en revenant, vous découvrez qu'il est déjà bloqué, ce qui est très irritant.

Il voulait quelque chose qui lui permette de vérifier l'état de son ordinateur depuis son téléphone à tout moment. Mais il n'a rien fait, car il pensait que cela était trop évident et que les grandes entreprises s'en chargeraient certainement.

« Comme personne ne l'avait fait jusqu'en novembre dernier, j'ai pensé, eh bien, autant le faire moi-même. »

La version initiale était extrêmement simple : connecter WhatsApp à Claude Code. On envoyait un message, cela appelait l'IA, et elle renvoyait le résultat. On l'a construite en une heure.

Puis il s'est "mis à vivre". Aujourd'hui, Clawbot compte environ 300 000 lignes de code et fonctionne sur presque toutes les plateformes de messagerie principales.

« Je pense que c'est là que nous allons. Chacun aura un IA extrêmement puissant, qui l'accompagnera tout au long de sa vie. »

Il a déclaré : « Dès que vous accordez à l'IA l'accès à votre ordinateur, elle peut en théorie faire tout ce que vous êtes capable de faire. »

Cette matinée au Maroc

Peter Yang dit que maintenant, vous n'avez plus besoin de rester assis devant l'ordinateur à le fixer, il suffit de lui donner des instructions.

Peter Steinberger a hoché la tête, mais il voulait parler d'une autre chose.

À un moment donné, en assistant à l'anniversaire d'un ami au Maroc, il s'est rendu compte qu'il utilisait constamment Clawbot. Demander son chemin, chercher des recommandations de restaurants, ce sont là des choses banales. Ce qui l'a vraiment surpris, c'est le matin même : quelqu'un avait tweeté sur Twitter pour lui signaler un bug dans l'une de ses bibliothèques open source.

J'ai pris une photo du tweet et je l'ai envoyée sur WhatsApp.

L'IA a lu le contenu du tweet et a compris qu'il s'agissait d'un rapport de bug. Elle a fait un checkout du dépôt Git correspondant, corrigé le problème, soumis le code, puis a répondu à la personne sur Twitter en lui indiquant que le problème était résolu.

À ce moment-là, j'ai pensé : est-ce que ça marche aussi ?

Encore plus incroyable : il marchait dans la rue et, paresseux pour taper, il a envoyé un message vocal. Le problème, c'est qu'il n'avait absolument pas programmé Clawbot pour supporter les messages vocaux.

« J'ai vu qu'il affichait "en train de taper", et j'ai pensé que c'était fichu. Résultat, il m'a répondu normalement. »

Plus tard, il a demandé à l'IA comment elle avait fait. L'IA a répondu : J'ai reçu un fichier sans extension, donc j'ai regardé son en-tête et j'ai découvert qu'il s'agissait d'un format Ogg Opus. Comme tu avais ffmpeg sur ton ordinateur, j'ai utilisé ce dernier pour le convertir en WAV. Ensuite, j'ai cherché whisper.cpp, mais tu ne l'avais pas installé. Cependant, j'ai trouvé ta clé API OpenAI, j'ai donc utilisé curl pour envoyer l'audio et l'ai transcrit.

Après avoir écouté, Peter Yang dit : « Ces choses-là sont vraiment efficaces, même si un peu effrayantes. »

C'est bien supérieur à la version web de ChatGPT, c'est comme un ChatGPT débloqué. Beaucoup de gens ne réalisent pas que des outils comme Claude Code sont bons non seulement pour la programmation, mais aussi pour résoudre tous types de problèmes.

L'armée des outils en ligne de commande (CLI)

Peter Yang lui a demandé comment il avait construit ces outils d'automatisation, s'il les avait écrits lui-même ou s'il avait fait écrire par l'IA.

Peter Steinberger a souri.

Ces derniers mois, il a constamment élargi son « armée CLI ». En quoi les agents sont-ils les plus doués ? Appeler des outils en ligne de commande, car ses données d'entraînement n'en contiennent que cela.

Il a créé une interface en ligne de commande (CLI) permettant d'accéder à l'ensemble des services Google, y compris l'API Places. Il a également développé un outil dédié à la recherche de mèmes et de GIF, afin que les réponses générées par l'IA puissent inclure des mèmes. Il a même conçu un outil permettant de visualiser le son, dans le but de permettre à l'IA de « ressentir » la musique.

« J'ai piraté l'API d'une plateforme locale de livraison à domicile, et maintenant l'IA peut me dire combien de temps il reste avant l'arrivée de la nourriture. J'ai aussi inversé l'API d'Eight Sleep, ce qui me permet de contrôler la température de mon lit. »

[Remarque : Eight Sleep est un matelas intelligent capable d'ajuster la température du lit, et son API n'est pas officiellement ouverte.]

Peter Yang demande : Tout cela a été construit par l'IA à ta demande ?

« La chose la plus intéressante, c'est que j'ai fait 20 ans de développement sur l'écosystème Apple chez PSPDFKit, en Swift et Objective-C, avec une expertise très pointue. Mais en revenant, j'ai décidé de changer de domaine, car j'en avais assez que Apple veuille tout contrôler, et en plus, le public des applications Mac est trop restreint. »

Le problème, c'est que passer d'une pile technologique maîtrisée à une autre est très douloureux. Tu connais tous les concepts, mais tu ignores la syntaxe. Qu'est-ce qu'une prop ? Comment décomposer un tableau ? Pour chaque petite question, il faut chercher, et tu te sens comme un idiot.

Puis est venue l'IA, et tout cela a disparu. Votre pensée systémique, votre capacité d'architecture, votre sens du goût, votre jugement concernant les dépendances, tout cela constituait en réalité de la valeur, et maintenant, il est facile de le transférer dans n'importe quel domaine.

Il marqua une pause :

Soudain, j'ai eu l'impression de pouvoir construire n'importe quoi. La langue n'avait plus d'importance, ce qui comptait c'était ma pensée d'ingénieur.

Contrôler le monde réel

Peter Steinberger commence à présenter sa configuration. La liste des autorisations accordées à l'IA est impressionnante :

Courriel, calendrier, tous les fichiers, lumières Philips Hue, enceintes Sonos. L'IA peut le réveiller le matin en augmentant progressivement le volume. Elle peut également accéder aux caméras de sécurité.

« Une fois, je lui ai demandé de surveiller s'il y avait des personnes étrangères. Le lendemain matin, il m'a dit : "Peter, il y a quelqu'un." J'ai regardé l'enregistrement, et il avait pris des captures d'écran toute la nuit de mon canapé. À cause de la mauvaise qualité de l'image de la caméra, le canapé ressemblait à une personne assise. »

Dans un appartement à Vienne, l'IA peut également contrôler un système domotique KNX.

« Ça m'empêcherait vraiment d'entrer. »

Peter Yang demande : Comment sont-ils connectés ?

« Il suffit de lui dire directement. Ces outils sont très efficaces, ils trouvent eux-mêmes les API, utilisent Google et cherchent les clés sur votre système. »

Les utilisateurs jouent de plus en plus follement :

Quelqu'un l'a fait commander en ligne sur Tesco
Quelqu'un l'a fait commander sur Amazon
Quelqu'un l'a programmé pour répondre automatiquement à tous les messages.
Quelqu'un l'a ajouté dans le groupe familial en tant que « membre de la famille »

« Je lui ai demandé de m’aider à enregistrer mes bagages sur le site de British Airways. C’est presque un test de Turing, à manipuler un navigateur sur le site d’une compagnie aérienne, tu sais à quel point ces interfaces sont anti-utilisateur. »

Le premier essai a pris près de 20 minutes, car tout le système était encore très approximatif. L'IA devait trouver le passeport dans son Dropbox, en extraire les informations, remplir les formulaires et passer la vérification humaine.

« Maintenant, cela ne prend que quelques minutes. Il peut cliquer sur le bouton de vérification « Je suis un humain » car il contrôle un vrai navigateur, son modèle de comportement n'étant pas différent d'un humain. »

80 % des applications disparaîtront.

Peter Yang demande : Quelles sont les méthodes d'utilisation sûres pour les nouveaux utilisateurs qui viennent de télécharger l'application ?

Peter Steinberger dit que le parcours de chaque personne est différent. Certaines personnes commencent immédiatement à l'utiliser pour écrire des applications iOS après l'installation, d'autres se lancent tout de suite dans la gestion de Cloudflare. Un utilisateur l'a installé pour lui-même la première semaine, pour sa famille la deuxième semaine, et a commencé à en faire une version d'entreprise pour son entreprise la troisième semaine.

Après lui avoir installé, un ami non technique a commencé à m'envoyer des pull request. C'était la première fois de sa vie qu'il envoyait une pull request.

Mais ce qu'il voulait vraiment dire, c'est la plus grande image d'ensemble :

« Si vous y réfléchissez, cela pourrait remplacer 80 % des applications sur votre téléphone. »

Pourquoi devriez-vous utiliser MyFitnessPal pour tenir un registre de vos repas ?

J'ai un assistant infiniment ressourceur, qui sait déjà que j'ai fait un mauvais choix au Kentucky Fried Chicken. Je prends une photo, il la stocke dans une base de données, calcule les calories et me rappelle qu'il est temps d'aller à la salle de sport.

Pourquoi utiliser une application pour régler la température de votre matelas Eight Sleep ? L'IA dispose des autorisations API et peut le faire à votre place. Pourquoi utiliser une application de liste de tâches ? L'IA peut s'en souvenir à votre place. Pourquoi utiliser une application pour vérifier votre vol ? L'IA peut le faire pour vous. Pourquoi utiliser une application de shopping ? L'IA peut recommander, commander et suivre vos commandes.

« Une entière couche d'applications disparaîtra progressivement, car si elles possèdent une API, ce ne sont que des services que ton IA appellerait. »

Il prédit que 2026 sera l'année où beaucoup de personnes commenceront à explorer les assistants personnels basés sur l'IA, et où les grandes entreprises entreront également sur ce marché.

Le Clawbot n'est pas nécessairement le gagnant final, mais cette direction est la bonne.

Parlez-lui simplement

Changeons de sujet et abordons la méthodologie de programmation par l'IA. Peter Yang dit avoir écrit un article très populaire intitulé « Just Talk to It » (« Parlez-lui simplement »). Nous aimerions l'entendre s'étendre davantage là-dessus.

L'idée centrale de Peter Steinberger est de ne pas tomber dans le "piège agissant" (agentic trap).

« Sur Twitter, je vois trop de gens découvrir que les agents sont performants, puis souhaiter les rendre encore plus performants, et tomber dans le trou de lapin. Ils créent divers outils complexes pour accélérer leurs flux de travail, mais finissent par ne construire que des outils, sans vraiment créer quelque chose de réellement utile. »

Il est lui-même tombé dedans. Au début, il a passé deux mois à créer un tunnel VPN juste pour accéder à un terminal depuis son téléphone. C'était tellement bien fait qu'une fois, en mangeant dans un restaurant avec un ami, il a passé tout le repas à coder sur son téléphone au lieu de participer à la conversation.

Je dois m'arrêter, principalement pour des raisons de santé mentale.

Ville de détritus

Récemment, ce qui l'a rendu fou, c'est un système d'orchestration appelé Gastown.

Un orchestrateur extrêmement complexe, capable de faire fonctionner en même temps une dizaine, voire une vingtaine d'agents intelligents, qui communiquent entre eux et se répartissent les tâches. Il y a des observateurs (watcher), des surveillants (overseer), des maires (mayor), des pcats (qui pourraient désigner des "civils", des "chats" ou d'autres rôles accessoires), et je ne sais même pas encore tout ce qu'il y a d'autre.

Peter Yang : Attendez, il y a aussi le maire ?

« Oui, il y a un maire dans le projet Gastown. J'appelle ce projet « Slop Town » (Ville de la bouillie). »

Il y a aussi le mode RALPH (un mode de boucle unique à usage unique, qui consiste à donner à l'IA une petite tâche, puis à jeter tous les souvenirs du contexte une fois la tâche accomplie, à tout remettre à zéro et à recommencer indéfiniment dans une boucle infinie)…

C'est littéralement la machine à brûler des jetons ultime. Tu la laisses tourner toute la nuit, et le lendemain matin, tu obtiens de la purée de déchets (slop) ultime.

Le problème fondamental est que ces agents n'ont pas encore de goût. Ils sont effrayamment intelligents dans certains domaines, mais si vous ne les guidez pas, ne leur dites pas ce que vous voulez, ce que vous obtenez est de la mauvaise qualité.

« Je ne sais pas comment les autres travaillent, mais quand je commence un projet, j'ai seulement une idée floue. Au fur et à mesure que je construis, que j'expérimente, que je sens, ma vision devient progressivement plus claire. J'essaie certaines choses, certaines ne fonctionnent pas, puis mes idées évoluent vers leur forme finale. Mon prochain mot-clé (prompt) dépend de mon état actuel, de ce que je vois, ressens et pense. »

Si vous essayez d'inclure tout dans la spécification initiale, vous manquez alors cette boucle d'interaction entre l'humain et la machine.

« Je ne comprends pas comment on pourrait créer quelque chose de bien sans sentiments, sans qu’un goût y participe. »

Quelqu'un a vanté sur Twitter une application de notes "entièrement générée par RALPH". Peter a répondu : Oui, ça a l'air clairement généré par RALPH, aucun humain normal ne concevrait ça comme ça.

Résumé de Peter Yang : Beaucoup de gens font tourner l'IA pendant 24 heures, non pas pour créer une application, mais pour prouver qu'ils sont capables de faire fonctionner l'IA pendant 24 heures.

C'est comme une compétition de comparaison sans point de référence. Moi aussi, j'ai laissé le programme tourner en boucle pendant 26 heures, et j'étais très fier à l'époque. Mais c'est un indicateur vaniteux, sans aucun sens. Pouvoir construire n'importe quoi ne signifie pas que vous deviez tout construire, ni que ce que vous construisez sera bon.

Le Mode Plan est un truc bidouillé (un "Hack")

Peter Yang se demande comment gérer le contexte. Lorsque la conversation devient longue, l'IA peut devenir confuse. Faut-il compresser ou résumer manuellement ?

Peter Steinberger qualifie cela de « problème du modèle ancien ».

Claude Code a toujours ce problème, mais Codex est bien meilleur. Sur le papier, il n'offre peut-être que 30 % de contexte supplémentaire, mais en pratique, cela donne l'impression d'être 2 à 3 fois plus grand. Je pense que cela a à voir avec son mécanisme de réflexion interne. Aujourd'hui, la plupart de mes développements de fonctionnalités peuvent être réalisés dans une seule fenêtre de contexte, les discussions et la construction se déroulant simultanément.

Il n'utilise pas les worktrees, car ce serait une "complexité inutile". Il checkout simplement plusieurs copies du dépôt : clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5. Il utilise celui qui est libre, effectue les tests, pousse sur la branche principale (main), puis synchronise.

Un peu comme une usine, si toutes sont occupées. Mais si vous n'en ouvrez qu'une, le temps d'attente est trop long et vous ne pouvez pas entrer dans l'état de flow.

Peter Yang dit que c'est comme un jeu de stratégie en temps réel, où vous avez une équipe qui mène l'attaque et que vous devez gérer et surveiller.

Concernant le mode de planification, Peter Steinberger a une opinion controversée :

« Le mode Plan est une solution de contournement que Anthropic a dû ajouter car le modèle est trop impulsif et commence directement par écrire du code. Si vous utilisez le modèle le plus récent, comme le GPT 5.2, vous dialoguez avec lui. 'Je veux créer cette fonctionnalité, je pense qu'il faudrait faire ceci ou cela, j'aime ce style de conception, proposez-moi quelques options, discutons d'abord.' Puis il propose des idées, vous discutez, vous trouvez un accord avant de commencer à agir. »

Il ne tape pas, il parle.

La plupart du temps, je lui parle.

Développement de drivers pour Discord

Peter Yang demande quelle est sa méthode de développement des nouvelles fonctionnalités. Commence-t-il par explorer le problème ? Ou commence-t-il par établir un plan ?

Peter Steinberger a déclaré avoir fait « probablement la chose la plus folle que j'aie jamais faite » : il a connecté sa Clawbot à un serveur Discord public, permettant à tout le monde de dialoguer avec son IA privée, dotée de ses souvenirs personnels, en public.

« Ce projet est difficile à décrire en mots. C'est un mélange entre Jarvis (l'assistant IA d'Iron Man) et le film "Her". Chaque personne que j'ai démontrée en personne a été extrêmement enthousiaste, mais les images et textes que j'ai publiés sur Twitter n'ont pas suscité grand intérêt. Je me suis donc dit, autant laisser les gens l'expérimenter par eux-mêmes. »

Les utilisateurs posent des questions, signalent des bugs et proposent des idées sur Discord. Son processus de développement actuel consiste à prendre une capture d'écran d'une conversation sur Discord, à la faire glisser dans le terminal, et à dire à l'IA : « Parlons-en ».

« Je suis paresseux pour taper. Quand quelqu'un me demande "Est-ce que vous supportez ceci ou cela ?", je laisse l'IA lire le code puis rédiger une réponse dans la FAQ. »

Il a également écrit un script d'exploration qui balaye le canal d'aide de Discord au moins une fois par jour, permettant à l'IA de résumer les problèmes les plus importants, puis ils les corrigent.

Pas de MCP, pas d'orchestration complexe

Peter Yang demande : Utilisez-vous ces gadgets sophistiqués ? Des agents multiples, des compétences complexes, le MCP (Model Context Protocol), etc. ?

La plupart de mes compétences sont des compétences de la vie quotidienne : tenir un registre alimentaire, faire les courses, ce genre de choses. Très peu de programmation, car ce n'est pas nécessaire. Je n'utilise pas MCP, ni aucune de ces choses.

Il ne fait pas confiance aux systèmes de programmation complexes.

Je suis en train de boucler, je peux produire des produits qui se sentent mieux. Il y a peut-être des méthodes plus rapides, mais je suis presque au point de blocage, pas à cause de l'IA, mais principalement limité par ma propre vitesse de réflexion, parfois par le temps d'attente pour Codex.

Son ancien co-fondateur de PSPDFKit, un ancien avocat, lui soumet également des PR (pull request).

« C'est incroyable de voir que l'IA permet aux personnes sans formation technique de créer des choses. Je sais qu'il y a des gens qui s'y opposent, affirmant que ces codes ne sont pas parfaits. Mais je considère les pull request comme des "prompt request" (requêtes de prompts), ils expriment une intention. La plupart des gens n'ont pas la même compréhension du système et ne peuvent pas guider le modèle vers le meilleur résultat. Je préfère donc obtenir l'intention, et faire le travail moi-même, ou la réécrire à partir de leur PR. »

Il les créditera en tant qu'auteurs, mais il intègre rarement directement le code des autres.

Trouve ton propre chemin.

Peter Yang résume : le point central est donc de ne pas utiliser de générateur d'approximation, de garder l'humain dans la boucle, car le cerveau humain et son sens du goût sont irremplaçables.

Peter Steinberger a ajouté :

« Ou peut-être, trouvez votre propre chemin. Beaucoup de gens me demandent "comment as-tu fait ?". La réponse est : vous devez explorer par vous-même. Apprendre ces choses prend du temps, cela implique de faire vos propres erreurs. Cela ressemble à l'apprentissage de n'importe quelle compétence, sauf que ce domaine évolue particulièrement rapidement. »

Clawdbot est en ligneclawd.botOn peut les trouver sur Discord et GitHub. Clad avec un W, C-L-A-W-D-B-O-T, comme les pinces d'un crabe.

(Nd : ClawdBot a été renommé en OpenClaw

Peter Yang dit qu'il allait aussi essayer. Il ne veut plus rester assis devant son ordinateur à discuter avec l'IA, mais donner des ordres à tout moment en étant dehors avec ses enfants.

« Je pense que tu vas aimer », a déclaré Peter Steinberger.

Les idées principales de Peter Steinberger peuvent se résumer en deux phrases :

L'IA est désormais si puissante qu'elle peut remplacer 80 % des applications sur votre téléphone.
Mais sans l'appréciation et le jugement humains dans la boucle, la sortie n'est que de la mauvaise qualité.

Ces deux phrases semblent contradictoires, mais elles mènent en réalité à la même conclusion : l'IA est une levier, pas une substitution. Ce que vous amplifiez, c'est ce que vous aviez déjà : la pensée systémique, la capacité d'architecture, l'intuition d'un bon produit. Si vous ne possédez pas ces éléments, même en exécutant en parallèle un nombre plus important d'agents intelligents 24 heures sur 24, vous ne produirez qu'une quantité plus grande de brouet.

Sa pratique elle-même constitue la meilleure preuve : un développeur chevronné d'iOS avec 20 ans d'expérience a construit, en quelques mois, un projet de 300 000 lignes de code en TypeScript. Ce n'est pas en apprenant la syntaxe du nouveau langage qu'il y est parvenu, mais grâce à des compétences indépendantes du langage.

« Le langage de programmation n'a plus d'importance, ce qui compte c'est ma pensée ingénieure. »