Source:a16z
Compilado por: Felix, PANews
La era del comercio agente ha llegado.
El protocolo de comercio electrónico de agentes de IA de OpenAI (ACP) y el protocolo universal de comercio electrónico de Google (UCP) prometen implementar funciones de pago en ChatGPT y Gemini. Pronto, cientos de millones de consumidores en todo el mundo encontrarán mejores productos, las tasas de conversión de los comerciantes aumentarán y las plataformas podrán obtener una comisión del 5 al 10%.
Sin embargo, la función de pago de ChatGPT es solo una mejora progresiva. No transformará la sociedad como lo hizo Internet a principios del siglo XXI, pero el comercio de agentes abiertos sí lo hará.
Debemos retroceder hasta los años 90 para entender la razón.
En ese momento existían dos versiones competidoras de "Internet".
Versión de AOL: precio unificado, correo, pronóstico del tiempo, contenido adicional de revisión, y finalmente toda la biblioteca de Time Warner.
Protocolos abiertos: HTTP, DNS, HTML y un navegador llamado Mosaic.
En comparación con la versión de AOL, Mosaic parecía absurda. En Mosaic había tan pocos sitios web que no se necesitaba una función de búsqueda; un índice ordenado alfabéticamente era suficiente. Ocho años después, AOL y Time Warner firmaron un acuerdo de fusión igualitaria por 350 mil millones de dólares. El mercado ya había tomado una decisión: el contenido seleccionado parecía ser el futuro.
Pero no pasó mucho tiempo antes de que Mosaic y los protocolos abiertos triunfaran, y la civilización humana entró oficialmente en la era digital. ¿Por qué? Imagina qué pasaría si los ecosistemas cerrados hubieran terminado venciendo.
En 2004, Zuckerberg quería crear Facebook y necesitaba un acuerdo de distribución con AOL. Dos estudiantes de Stanford querían construir un índice web y necesitaban obtener permiso de CompuServe. Una persona quería vender libros en línea en su garaje y necesitaba presentar una propuesta al equipo de contenido de MSN.
Dirán: "Vuelvan a la escuela, chicos". Nada de esto sucederá. La economía digital que damos por sentada simplemente no existiría.
Los protocolos abiertos significan la ausencia de “porteros”. Cualquiera con un servidor y un dominio puede acceder a todo Internet. Las periferias innovan constantemente, mientras que los centros no logran seguir el ritmo, lo que最终 da lugar a uno de los eventos de creación de riqueza más grandes de la historia humana. Este es un principio fundamental del capitalismo: la innovación surge de las periferias.
En 1997: Tim Berners-Lee, Marc Andreessen y otros estaban investigando protocolos y navegadores. En ese momento, ejecutar un servidor costaba decenas de miles de dólares. No estaba claro por qué un servidor de contenido debería responder a solicitudes de usuarios desconocidos. Hacerlo era costoso y no existía ningún incentivo económico conocido.
Crearon un código de estado de mensaje llamado "402", que el servidor podía enviar al usuario: "Pague una pequeña tarifa para obtener este contenido". Sin embargo, en ese momento no existía una forma viable de realizar pagos digitales. PayPal aún no existía, y las tarifas fijas de las tarjetas de crédito eran de decenas de centavos, demasiado altas para una transacción de un centavo.
Sin embargo, Internet aún así despegó.
Google encontró un modelo de negocio único para Internet: la publicidad. En los medios tradicionales, la relación económica principal existe entre el productor de contenido y el consumidor. Google adoptó el modelo económico de la radio, introduciendo un tercero: los anunciantes. Ellos pagan por la relación entre el productor de contenido y el consumidor.
Este movimiento es muy astuto. Hoy en día, los productores pueden monetizar la atención del público. No necesitan establecer previamente ninguna relación con los consumidores. Google se mantiene en el centro del flujo de fondos, entre los anunciantes y los creadores de contenido, cobrando cualquier porcentaje que deseen.
Por lo tanto, la necesidad de micropagos se evitó. El software de código abierto comenzó a desarrollarse, estalló la revolución de la nube y los costos de alojamiento disminuyeron cien veces. Google se convirtió en el mayor defensor de internet libre y abierto. Cuanto más buscaban los consumidores, más dinero ganaba Google. Así que invirtieron miles de millones de dólares para hacer que internet fuera rápido, económico y omnipresente.
Luego llegó la década de 2010, y todo parecía no haber cambiado.
Las tasas de interés permanecen bajas, el desarrollo tecnológico avanza lentamente y los ecosistemas cerrados continúan creciendo.
En 2022, ChatGPT se lanzó, y el mundo estaba a punto de experimentar otro cambio radical. Los modelos de lenguaje grande (LLMs) no solo pueden proporcionar resultados; también pueden generar y compilar muchos de estos resultados en un resumen conciso y claro, a menudo sin necesidad de tocar el contenido mismo.
Cuando apareció GPT-4, ya estaba claro: los agentes son el siguiente paso; los LLM son excelentes para usar computadoras como lo haría un humano, y lo hacen con menor costo y mayor eficiencia.
Así es, el panorama económico de Internet ha cambiado.
De 1997 a 2024, el núcleo del modelo de negocio fue el "marketing de distracción". Los humanos son fáciles de distraer con anuncios mientras leen páginas web, y los anunciantes aprovechan su atención limitada para obtener ganancias. Sin embargo, los agentes de baja inteligencia/agentes no se distraen.
Hay una ironía fascinante aquí: los anuncios crearon internet abierto y libre, y el internet a su vez generó conjuntos de datos masivos de 10 billones de tokens, que dieron lugar a los LLM, provocando finalmente el declive de los anuncios.
Desde el lanzamiento de GPT-4, el tráfico de Stack Overflow ha disminuido un 75% y el tráfico de noticias tecnológicas un 60%. Los usuarios tecnológicos son adoptadores tempranos, pero esta tendencia finalmente alcanzará toda la información en la web.
La función de pago en ChatGPT no es importante. Internet se ha convertido en la plaza de la civilización, y los contratos económicos tradicionales ya están obsoletos.
En internet existen algunas áreas pequeñas que han logrado resistir la "erosión" de Google: son como "jardines amurallados" con contenido verdaderamente único: Facebook, TikTok y LinkedIn. Gracias a miles de ingenieros altamente remunerados que trabajan día y noche, estas áreas han logrado resistir el rastreo de robots automatizados.
Sin embargo, la barrera del jardín amurallado también ha sido vulnerada. Los agentes con capacidad informática pueden simular perfectamente el tráfico de usuarios humanos reales. Los charlatanes venderán durante los próximos 10 años todo tipo de “soluciones milagrosas”, y el capital de Sand Hill Road (nota de PAnews: centro de capital de riesgo de Silicon Valley) seguirá la tendencia e invertirá. Pero en realidad, no existe ninguna solución milagrosa. Las murallas del fuerte han sido destruidas por aviones de combate.
¿Qué sigue?
Open Agent Commerce.
La función de pago en ChatGPT es como AOL en la era de los agentes comerciales. Es un directorio seleccionado, un jardín cerrado con una mejor experiencia de usuario. Para vender a través de él, los comerciantes necesitan meses de desarrollo de negocios, documentos legales estrictos, planes específicos de cinco años, ingresos sustanciales, una base de usuarios sólida y una historia capaz de complacer a los accionistas cuando aparezca en la portada del New York Times.
El comercio de agentes abiertos es como el HTTP de hoy. Es un conjunto de protocolos simples que permiten a los agentes pagar por cualquier cosa que necesiten: datos, alojamiento en la nube, comunicación, y muchas otras cosas que aún no hemos imaginado.
El MPP de Coinbase con x402 y Tempo en colaboración con Stripe son los dos líderes. Tras 28 años desde la invención del código de estado "402", finalmente tenemos una implementación viable. Las transacciones con stablecoins en blockchains modernas tienen costos inferiores a un centavo, resolviendo el problema de tarifas fijas que provocó el fracaso de los micropagos en 1997.
Un agente que solo puede comprar de comerciantes previamente aprobados es como un empleado con una tarjeta corporativa que solo se puede usar en tres proveedores. Un agente con un protocolo abierto es como un empresario con una cuenta bancaria.
Aquí no hay BD, no hay lista blanca, solo simples estándares sin permiso.
Estos protocolos solo se enfocan en dos cosas:
¿Cómo puedo pagar?
¿Cómo puedo asegurarme de que el agente ha pagado?
Los LLM son capaces de llamar herramientas que nunca han visto. A partir de los modelos Claude 4.5+ y Codex 5.2+, los agentes pueden descubrir API, leer sus esquemas y utilizarlos correctamente sin entrenamiento previo.
La discusión actual se centra principalmente en las “habilidades (skills)”. Puedes pensar en ellas como programas de lenguaje natural que se pueden combinar como bloques de construcción. Un fundador sin experiencia técnica puede escribir un mensaje en Slack y hacer que se ejecute como un software:
Ordena una pizza de una pizzería cercana con buenas reseñas y rastrea el estado de la entrega cada 10 minutos.
Cuando el repartidor esté a 5 minutos de llegar, enciende la luz del porche.
Si la entrega se realiza en 30 minutos, dé una propina de 5 dólares al repartidor.
No se requiere escribir código ni tener un título en informática. El agente lee la intención, escribe oportunamente un programa nativo de computadora, lo ejecuta y luego lo descarta. Programar ya no necesita ser una disciplina; bastará con dominar el idioma materno humano.
Las habilidades realmente funcionan. Pero son solo un producto transitorio, el primer enfoque que se nos ocurrió después de descubrir que los agentes pueden invocar herramientas desconocidas. Requieren que alguien las escriba, publique, realice revisiones de seguridad y las actualice. Además, los agentes necesitan cargarlas previamente. Es molesto.
La discusión sobre habilidades oculta un avance más profundo: los agentes pueden combinar capacidades de maneras sin precedentes.
Comprar una pizza es solo un ejemplo sencillo. Aquí hay un caso más realista: un agente que gestiona la cadena de suministro de una pequeña empresa notó que los precios del proveedor de embalaje aumentaron un 15% debido a aranceles. Encontró tres alternativas locales, solicitó muestras a cada proveedor, negoció precios por volumen y finalmente completó el cambio. Todo esto se realizó antes de que el propietario de la empresa hiciera su ejercicio matutino.
No se requiere colaboración con API, equipo de adquisiciones ni proceso de licitación. Solo se necesita un agente con saldo en una cuenta y que utilice un protocolo abierto.
Discover
Los agentes pueden realizar pagos y combinar capacidades, pero aún no pueden encontrar el contenido necesario.
La pregunta restante es "descubrir". Para los agentes: "¿Cómo puedo encontrar lo que quiero comprar?". Para los comerciantes: "¿Cómo presento mi servicio a los agentes?".
AgentCash surge para llenar ese vacío. Es una cuenta unificada que accede a todos los API en internet. Cuando los agentes están bloqueados, puede acceder a miles de API y continuar operando con costos mínimos.
Lo esencial es que AgentCash integra las funciones de pago y descubrimiento de comerciantes. Los comerciantes pueden registrarse en x402scan.com o mppscan.com y mostrar inmediatamente sus servicios a más de 2000 agentes de AgentCash.
En 1997, Internet no tenía un modelo de negocio; nadie sabía por qué los servidores debían comunicarse con extraños. Los protocolos abiertos y una estrategia llamada "publicidad" resolvieron elegantemente este problema, llevando a la civilización a la era digital. Para 2026, esta estrategia elegante está desapareciendo, y los protocolos abiertos y un código de estado de 28 años de antigüedad están a punto de reemplazarla.
Bienvenido a la era abierta de los agentes inteligentes comerciales.
Lectura relacionada: Una guía completa sobre x402 y MPP: dos caminos para pagos con Agent
