Source : a16z
Compilé par : Felix, PANews
L'ère du commerce agentic est arrivée.
Le protocole de commerce électronique par agent IA d'OpenAI (ACP) et le protocole universel de commerce électronique de Google (UCP) promettent d'implémenter la fonction de paiement dans ChatGPT et Gemini. Bientôt, des centaines de millions de consommateurs à travers le monde trouveront de meilleurs produits, les taux de conversion des commerçants s'amélioreront, et les plateformes pourront prélever une commission de 5 à 10 %.
Cependant, la fonction de paiement de ChatGPT n'est qu'une amélioration progressive. Elle ne transformera pas la société comme l'a fait Internet au début du XXIe siècle, tandis que les agents ouverts commerciaux le peuvent.
Nous devons remonter aux années 1990 pour comprendre la raison.
Deux versions concurrentes d’« Internet » coexistaient à l’époque.
Version AOL : prix uniformisé, courrier électronique, prévisions météorologiques, contenu supplémentaire vérifié, et enfin l'ensemble de la bibliothèque de Time Warner.
Protocoles ouverts : HTTP, DNS, HTML et un navigateur nommé Mosaic.
Par rapport à la version d’AOL, Mosaic semblait absurde. Il y avait si peu de sites sur Mosaic qu’il n’était même pas nécessaire d’avoir une fonction de recherche ; un index alphabétique suffisait. Huit ans plus tard, AOL a conclu un accord de fusion équitable avec Time Warner pour 350 milliards de dollars. Le marché avait déjà choisi : les contenus sélectionnés semblaient être l’avenir.
Mais peu de temps après, Mosaic et les protocoles ouverts ont triomphé, et la civilisation humaine a officiellement entré dans l'ère numérique. Pourquoi ? Imaginez ce qui se passerait si les écosystèmes fermés avaient fini par l'emporter.
En 2004, Zuckerberg voulait créer Facebook et devait négocier un accord de distribution avec AOL. Deux étudiants de Stanford voulaient créer un index web et devaient obtenir l'autorisation de CompuServe. Une personne voulait vendre des livres en ligne dans son garage et devait soumettre une proposition à l'équipe contenu de MSN.
Ils diraient : « Retournez à l’école, les petits ». Aucun de ces événements ne se produirait. L’ensemble de l’économie numérique à laquelle nous sommes habitués n’existerait tout simplement pas.
Les protocoles ouverts signifient l'absence de « gardiens ». Toute personne possédant un serveur et un domaine peut accéder à l'ensemble d'Internet. Les régions périphériques innoveront en continu, tandis que les centres ne parviendront pas à suivre, aboutissant ainsi à l'un des plus grands événements de création de richesse de l'histoire humaine. C'est un principe fondamental du capitalisme : l'innovation naît des périphéries.
En 1997 : Tim Berners-Lee, Marc Andreessen et d'autres étudiaient des protocoles et des navigateurs. À l'époque, faire fonctionner un serveur coûtaient des centaines de milliers de dollars. Il n'était pas clair pourquoi un serveur de contenu devrait répondre aux demandes d'utilisateurs inconnus : cela était coûteux et ne présentait aucun incitatif économique connu.
Ils ont créé un code d'état de message appelé « 402 » que le serveur pouvait envoyer à l'utilisateur : « Payez une petite somme pour accéder à ce contenu. » Mais à l'époque, il n'existait aucun moyen approprié de effectuer des paiements numériques. PayPal n'existait pas encore, et les frais fixes des cartes de crédit s'élevaient à plusieurs dizaines de cents, ce qui était excessif pour une transaction de 1 cent.
Cependant, Internet a tout de même pris son envol.
Google a trouvé un modèle économique unique pour l'Internet : la publicité. Dans les médias traditionnels, la relation économique principale existe entre le producteur de contenu et le consommateur. Google a adopté le modèle économique de la radio en introduisant un tiers : les annonceurs. Ce sont eux qui financent la relation entre le producteur de contenu et le consommateur.
C'est une stratégie très astucieuse. Aujourd'hui, les producteurs peuvent monétiser l'attention du public. Ils n'ont pas besoin d'établir préalablement une relation avec les consommateurs. Google se positionne au cœur du flux de revenus, entre les annonceurs et les créateurs de contenu, et prélève la part qu'il souhaite.
Ainsi, la demande de micro-paiements a été évitée. Les logiciels open source ont commencé à se développer, la révolution du cloud computing a explosé, et les coûts d'hébergement ont chuté de cent fois. Google est devenu le plus grand défenseur d'un internet libre et ouvert. Plus les consommateurs recherchaient, plus Google gagnait d'argent. Ils ont donc investi des centaines de milliards de dollars pour rendre l'internet rapide, peu coûteux et omniprésent.
Ensuite, les années 2010 sont arrivées, et tout semblait inchangé.
Les taux d'intérêt sont bas, le développement technologique est lent et les écosystèmes fermés continuent de s'agrandir.
En 2022, ChatGPT a été lancé, et le monde était sur le point de connaître une nouvelle transformation. Les grands modèles linguistiques (LLMs) ne se contentent pas de fournir des résultats ; ils peuvent également générer et regrouper de nombreux résultats en un résumé clair et concis, souvent sans même toucher au contenu lui-même.
Lors de l'apparition de GPT-4, la situation était déjà claire : les agents constituent la prochaine étape ; les LLM sont excellents pour utiliser des ordinateurs comme des humains, et ce, à moindre coût et avec une efficacité supérieure.
Ainsi, le paysage économique de l'Internet a changé.
De 1997 à 2024, le modèle économique reposait sur le « marketing de la distraction ». Les humains, en lisant des pages web, sont facilement distraits par les publicités, que les annonceurs exploitent pour tirer profit de leur attention limitée. Les agents de faible intelligence / agents, eux, ne se laissent pas distraire.
Il y a une ironie fascinante là-dedans : les publicités ont créé Internet libre et ouvert, qui à son tour a généré un ensemble de données massif de 10 billions de tokens, favorisant l'émergence des LLM, et conduisant finalement au déclin de la publicité.
Depuis l'apparition de GPT-4, le trafic de Stack Overflow a diminué de 75 % et celui des actualités technologiques de 60 %. Les utilisateurs technologiques sont des pionniers, mais cette tendance finira par toucher toutes les informations sur Internet.
La fonction de paiement dans ChatGPT n'est pas importante. Internet est devenu la place publique de la civilisation, et les contrats économiques traditionnels sont désormais obsolètes.
Sur Internet, certaines zones ont réussi à résister à l’« érosion » de Google ; ce sont des « jardins clos » possédant un contenu véritablement unique : Facebook, TikTok et LinkedIn. Ces zones ont pu résister à l’arrachage automatisé par des robots grâce à des milliers d’ingénieurs hautement rémunérés qui travaillent jour et nuit.
Mais les fortifications du jardin clos ont été percées. Des agents capables d'utiliser un ordinateur peuvent simuler parfaitement le trafic d'utilisateurs humains réels. Des charlatans vendront au cours des 10 prochaines années diverses « solutions miracles », et les capitaux de Sand Hill Road (PAnews : centre de capital-risque de la Silicon Valley) suivront la tendance. En réalité, il n'existe aucune solution miracle. Les murs de la forteresse ont été détruits par des avions de combat.
What's next?
Open Agent Commerce.
La fonction de paiement dans ChatGPT est comme AOL à l'ère des agents commerciaux. C'est un répertoire sélectionné, un jardin clos offrant une meilleure expérience utilisateur. Pour vendre à travers, les entreprises doivent passer des mois en développement commercial, remplir des documents juridiques stricts, présenter un plan quinquennal précis, démontrer des revenus substantiels, disposer d'une base d'utilisateurs solide, et avoir une histoire capable de satisfaire les actionnaires lorsqu'elle fait la une du New York Times.
Les agents ouverts commerciaux sont comme le HTTP d'aujourd'hui. Ce sont des protocoles simples qui permettent aux agents de payer pour tout ce dont ils ont besoin : données, hébergement cloud, communication, et bien d'autres choses que nous n'avons pas encore imaginées.
Les MPP de Coinbase, x402 et Tempo, en partenariat avec Stripe, sont les deux leaders. Vingt-huit ans après l'invention du code d'état "402", nous avons enfin une implémentation viable. Les transactions en stablecoins sur les blockchains modernes coûtent moins d'un cent, résolvant ainsi le problème des frais fixes qui avaient causé l'échec des micro-paiements en 1997.
Un agent qui ne peut acheter que chez des commerçants préapprouvés est comme un employé disposant d'une carte d'entreprise limitée à trois fournisseurs. Un agent doté d'un protocole ouvert, en revanche, est comme un entrepreneur possédant un compte bancaire.
Ici, pas de BD, pas de liste blanche, seulement des critères simples sans autorisation.
Ces protocoles ne se concentrent que sur deux choses :
Comment puis-je effectuer le paiement ?
Comment puis-je m'assurer que l'agent a effectué le paiement ?
Les LLM sont capables d'appeler des outils qu'ils n'ont jamais vus. À partir des modèles Claude 4.5+ et Codex 5.2+, les agents peuvent découvrir des API, en lire le schéma et les utiliser correctement sans entraînement préalable.
La discussion actuelle se concentre principalement sur les « compétences (skills) ». Vous pouvez les imaginer comme des programmes en langage naturel, pouvant être assemblés comme des blocs de construction. Un fondateur sans formation technique peut rédiger un message Slack et le faire exécuter comme un logiciel :
Commandez une pizza auprès d'une pizzeria bien notée à proximité et suivez l'état de livraison toutes les 10 minutes.
Allumez la lumière du porche lorsque le livreur est à 5 minutes d'arrivée.
Give the delivery person a $5 tip if it arrives within 30 minutes.
Aucun codage requis, aucun diplôme en informatique nécessaire. L'agent lit l'intention, écrit en temps réel un programme natif, l'exécute, puis le supprime. La programmation n'est plus nécessaire en tant que discipline : maîtriser sa langue maternelle suffit.
Les compétences sont effectivement efficaces. Mais elles ne sont qu’un produit transitoire, le premier moyen que nous avons imaginé après avoir découvert que les agents pouvaient appeler des outils qu’ils ne connaissaient pas. Elles nécessitent qu’une personne les écrive, les publie, les vérifie sur le plan de la sécurité et les mette à jour. De plus, les agents doivent les charger à l’avance. C’est fastidieux.
Les discussions sur les compétences masquent une percée plus profonde : les agents peuvent combiner des capacités de manière sans précédent.
Acheter une pizza n’est qu’un exemple simple. Voici un cas plus réaliste : un agent gérant la chaîne d’approvisionnement d’une petite entreprise a remarqué que les prix du fournisseur d’emballages avaient augmenté de 15 % en raison de droits de douane. Il a identifié trois alternatives locales, demandé des échantillons à chaque fournisseur, négocié des prix en gros et effectué le changement final, tout cela avant que l’entrepreneur ne fasse son jogging du matin.
Aucune collaboration API, équipe d'achat ou processus d'appel d'offres nécessaire. Seul un agent avec un solde sur son compte et utilisant un protocole ouvert est requis.
Discover
Les agents peuvent effectuer des paiements et combiner des capacités, mais ne peuvent pas encore trouver le contenu recherché.
La question restante est « la découverte ». Pour les agents : « Comment puis-je trouver ce que je veux acheter ? » Pour les commerçants : « Comment puis-je présenter mes services aux agents ? »
AgentCash est né. C'est un compte unifié qui permet d'accéder à tous les API sur Internet. Lorsqu'un agent est bloqué, il peut accéder à des milliers d'API et continuer à fonctionner avec des frais minimes.
L'essentiel est qu'AgentCash intègre les fonctionnalités de paiement et de découverte des commerçants. Les commerçants peuvent s'inscrire sur x402scan.com ou mppscan.com et présenter immédiatement leurs services à plus de 2000 agents AgentCash.
En 1997, Internet n'avait pas de modèle économique, personne ne comprenait pourquoi les serveurs devaient communiquer avec des inconnus. Les protocoles ouverts et une stratégie appelée « publicité » ont élégamment résolu ce problème, permettant à la civilisation d'entrer dans l'ère numérique. En 2026, cette stratégie élégante est en train de disparaître. Les protocoles ouverts et un code d'état âgé de 28 ans sont sur le point de les remplacer.
Bienvenue à l'ère ouverte des agents intelligents commerciaux.
À lire également : Comprendre x402 et MPP : deux approches pour les paiements Agent
