El fundador de Clawdbot, Peter Steinberger, habla sobre el agotamiento, la adicción a la IA y el futuro de las herramientas de agentes personales

iconTechFlow
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
El desarrollador austríaco Peter Steinberger, fundador de Clawdbot (ahora Moltbot), habló sobre el rápido crecimiento del proyecto, impulsado por la integración de datos en cadena y la automatización mediante inteligencia artificial. Tras un agotamiento de tres años tras la venta de PSPDFKit en 2021, Steinberger construyó Clawdbot en 10 días en 2025. La herramienta, que se conecta a WhatsApp y automatiza tareas, obtuvo 90.000 estrellas en GitHub y provocó un aumento del 14% en la cotización de las acciones de Cloudflare antes del mercado. Anthropic solicitó un cambio de nombre debido a preocupaciones sobre marcas comerciales. Steinberger destacó el potencial de las herramientas de agentes impulsadas por IA y advirtió sobre riesgos como la inyección de instrucciones. También tocó temas como la sustitución de aplicaciones, los modelos locales y los desafíos del software de código abierto. Según el índice de miedo y codicia, la percepción del mercado sugiere un fuerte interés en las herramientas impulsadas por IA.

Organización: Bao Yu

El Clawdbot (recientemente rebautizado como Moltbot) ha tenido un éxito enorme recientemente. Su autor, Peter Steinberger, es un desarrollador austríaco y fundador de PSPDFKit. En 2021, la empresa fue adquirida por Insight Partners por una cantidad superior a los 100 millones de euros. A raíz de ello, Steinberger sufrió un agotamiento total (burnout) y desapareció durante tres años. En noviembre de 2025, lo "desarrolló con instinto" (vibe-coded) en solo 10 días. Apenas unas semanas después, Clawdbot acumuló casi 90.000 estrellas en GitHub, con una curva de crecimiento que se describe como "una línea recta sin precedentes". La acción de Cloudflare subió un 14% antes de la apertura de la bolsa, debido al uso masivo del Clawdbot por parte de desarrolladores. Incluso en Instagram, personas que nunca antes habían mostrado interés por la tecnología comenzaron a publicar fotos de sí mismas comprando un Mac Mini en una tienda de Apple.

Luego Anthropic nos envió un correo pidiendo que cambiamos el nombre, por eso ahora se llama Moltbot.

Anote esta frase suya de la entrevista, quizás a finales de año podamos revisarla para ver si es correcta o no: "El año pasado fue el año de los agentes inteligentes de programación (Agent), y este año es el año de los agentes inteligentes de asistentes personales. Creo que yo encendí esta chispa."

Dirección de la entrevista:

https://www.youtube.com/watch?v=qyjTpzIAEkA

Este es el primer entrevista pública de Peter después del éxito del proyecto Clawdbot. Se conectó a las 11 de la noche y habló durante 35 minutos. A continuación se presenta una transcripción completa del contenido.

1. 13 años emprendiendo, 3 años agotados, y luego apareció Claude Code

El presentador le preguntó cómo había llegado a este punto.

Peter dijo que lleva 13 años gestionando PSPDFKit, una empresa que desarrolla kits de herramientas (SDK) para el procesamiento de documentos PDF. Sus clientes incluyen a Dropbox, SAP y Volkswagen. Después de vender sus acciones en 2021, se "deshizo por completo".

"Invertí el 200% de mi tiempo, energía y esfuerzo en esa empresa, y se convirtió en mi identidad. Cuando desapareció, casi no me quedó nada."

[Nota del editor] PSPDFKit ahora se ha renombrado como Nutrient, y sirve a más del 15 % de las empresas Fortune 500 a nivel mundial. Peter y los otros dos cofundadores se retiraron progresivamente de las operaciones diarias tras una ronda de financiación en 2021.

Durante los próximos tres años, intentó de todo para recuperar su forma. En sus propias palabras, "comer, beber, prostitutas y juegos de azar (blackjack y prostitutas)", una auténtica orgía de la televisión. Pero al sentarse frente al ordenador se le iba todo el ánimo (mojo), y no tenía ganas de escribir nada.

Dicen que se necesita un año de descanso por cada cuatro años de trabajo. He trabajado ininterrumpidamente durante 13 años, así que tres años serían justos.

En abril de 2025, finalmente sintió que "la chispa había regresado". Quería hacer algo nuevo, pero no quería seguir trabajando con iOS y el ecosistema de Apple. Comenzó a investigar sobre inteligencia artificial y descubrió que "está bien, no es tan asombroso, pero está bien".

El punto de inflexión fue Claude Code.

Peter dijo que había perdido exactamente esos tres años en los que la IA "estaba muy mala", y al regresar se encontró directamente con la versión beta de Claude Code.

Esta fue mi primera experiencia. En ese momento pensé: "¡Caray, esto es genial!". Luego no pude dormir.

2. Envié un mensaje a la 1:00 a.m. y mi amigo respondió al instante: "Ya estamos enganchados".

El presentador le preguntó si en realidad estaba obsesionado con la programación de IA.

Peter dijo que sí. Él metió a varios amigos en el problema, y todos terminaron con los mismos síntomas. Él envió un mensaje a la 1 de la madrugada, y sus amigos respondieron al instante.

Incluso organicé una reunión, al principio se llamaba Grupo Anónimo de Ayuda para el Código Claude, pero ahora se llama Grupo Anónimo de Agentes (Agents Anonymous), hay que mantenerse al día con los tiempos.

Él describió su estado: "Antes tenía un vicio, y ahora tengo un vicio de nuevo, pero esta vez es de tipo positivo".

Su página de GitHub dice: "Vuelvo a jugar con la IA después de jubilarme, y me lo estoy pasando muy bien".

3. Ya tenían la idea en mayo de 2025, pero esperaron seis meses y las grandes empresas no lo hicieron.

El presentador le preguntó qué proyectos había realizado antes de Clawdbot.

Peter dice que su principio es "divertirse". Experimenta con distintos lenguajes y tecnologías, y ha construido una serie de herramientas pequeñas. A esto las llama "ingeniería agente" (agentic engineering), y no le gusta mucho el término "programación por intuición" (vibe coding).

Bromeo diciendo que hago "ingeniería dolorosa" (aching engineering). A la 1 de la madrugada se convierte en programación de nivel VIP (VIP coding, que significa estado de inmersión). Y luego al día siguiente me arrepiento.

La idea de un asistente personal le surgió ya en mayo de 2025. En ese momento, acababa de salir GPT-4, lo probó y descubrió que aún no era suficientemente bueno.

"Pensé que todas las grandes empresas seguramente lo lanzarían en cuestión de meses. Así que, ¿para qué molestarme en hacerlo yo mismo? Lo mejor es esperar a que esté ya hecho y listo para usar."

Resultó que hasta noviembre, nadie lo había hecho.

¿Dónde está mi maldito agente?

4. La integración con WhatsApp solo tomó 1 hora.

El presentador le preguntó cómo había empezado a hacerlo.

Peter dice que cada mañana, al despertar, se pregunta: ¿qué quiere hacer hoy? ¿Qué sería genial?

La respuesta de ese día fue: chatear con tu computadora a través de WhatsApp.

"Mientras mi agente inteligente está en funcionamiento, si voy a la cocina, me gustaría poder ver su estado en cualquier momento o enviarle pequeñas instrucciones."

Él pasó 1 hora armando (hacking) una versión básica: recibe mensajes de WhatsApp, llama a Claude Code y devuelve los resultados. De un solo disparo (One shot).

"Resulta que funcionó así de simple. Pensé, bueno, es bastante genial".

Luego agregó una imagen de apoyo, ya que tenía la costumbre de enviar palabras clave (prompts) junto con capturas de pantalla.

Las imágenes pueden proporcionarle mucho contexto al agente inteligente, así que no necesitas escribir tantas palabras. Aquí tienes un atajo: si quieres introducir instrucciones de forma más rápida, simplemente toma una captura de pantalla. Los agentes inteligentes son especialmente hábiles para inferir a partir de las imágenes qué es lo que quieres.

5. Esa noche en Marrakech: "Si les das verdadero poder"

El presentador quiere escuchar más detalles.

Peter dijo que había ido a Marrakech para un fin de semana de cumpleaños en noviembre. Se dio cuenta de que utilizaba esta herramienta con mucha más frecuencia de la que esperaba, y no era para escribir código, sino para buscar restaurantes y obtener información.

"Porque está integrado con Google, puede buscar información por sí mismo. Es especialmente útil cuando uno está fuera de casa."

Luego ocurrió ese incidente.

Él envió un mensaje de voz a la IA al instante. Pero ni siquiera había escrito código para procesamiento de voz.

La indicación "escribiendo" se encendió. Pensé, bueno, ahora sí que será interesante ver qué hace.

Diez segundos después, la IA respondió, como si nada hubiera sucedido.

Peter le preguntó: ¿cómo demonios lo lograste?

Respuesta de la IA:

Enviaste un mensaje, pero solo incluía un enlace a un archivo sin extensión. Analicé el encabezado del archivo y descubrí que está en formato Opus, así que lo convertí a WAV usando ffmpeg en tu Mac. Luego intenté usar Whisper, pero no estaba instalado, y al instalarlo apareció un error. Busqué un poco y encontré en tus variables de entorno la clave (key) de OpenAI, así que usé curl para enviarlo a OpenAI, lo transcribí y te respondí.

Peter dijo que en ese momento fue completamente impactado.

Si le das a estas cosas verdadero poder, son bestias increíblemente inteligentes y astutas.

6. "El despertador más caro del mundo" y "sorpréndeme"

El presentador le preguntó qué otros experimentos locos había realizado.

Peter dijo que usaba la IA como despertador. La IA, que funciona en servidores en Londres, se conecta por SSH a su MacBook en Viena, sube el volumen y lo despierta.

"Hecho probablemente el despertador más caro del mundo."

Lo más loco es que le agregó a la IA una función de "latido cardíaco" (heartbeat): enviar automáticamente palabras clave en intervalos programados.

El contenido del prompt es: Sorpréndeme (surprise me).

Él ve este proyecto como una combinación de tecnología y arte.

En cierto sentido, es solo pegamento, algo que une las cosas que ya existen. Pero por otro lado, representa una forma completamente nueva de interactuar. Todas las tecnologías desaparecen, no tienes que pensar en el estado de la sesión (session), en la compresión (compaction) o en qué modelo usar. Es como si estuvieras charlando con un amigo, o con un fantasma.

7. "MCP es basura, solo las herramientas de línea de comandos pueden escalarse"

El presentador observó que, en el último año, todo el mundo se había centrado en agentes para navegadores, pero Peter tomó una dirección completamente diferente.

Peter dijo que antes de hacer Clawdbot, pasó mucho tiempo escribiendo varias herramientas de línea de comandos (CLI). Su juicio fundamental es:

"El MCP (Protocolo de Contexto del Modelo) es basura y no se puede escalar. ¿Sabes qué sí se puede escalar? Las herramientas de línea de comandos (CLI)."

Su argumento: los agentes entienden inherentemente Unix. Puedes instalar mil pequeños programas en una computadora, pero un agente solo necesita conocer sus nombres, llamar al menú --help, cargar la información necesaria y luego sabrá cómo usarlos.

Si eres inteligente, diseñarás herramientas de línea de comandos según las expectativas del modelo, no para los humanos.

Él escribió una serie de herramientas de línea de comandos para su agente inteligente: el conjunto completo de Google, los altavoces Sonos, las cámaras de su casa, el sistema de hogar inteligente. Cada vez que añadía una herramienta, el agente inteligente adquiría una nueva capacidad y se volvía más entretenido.

La mayoría de las cosas no las necesito en absoluto en el navegador.

8. En auge durante 72 horas: Discord explotó, usé Codex para responder en masa

El presentador le preguntó cómo afrontaba el éxito repentino.

Peter dijo que casi está volviéndose loco. Al menos en lo que respecta al sueño. Pero al mismo tiempo está inmensamente emocionado.

"Twitter explotó literalmente. El crecimiento de los servidores de Discord es el más rápido que he visto nunca."

Al principio aún podía copiar los problemas de Discord uno por uno y enviarlos a Codex para que redactara respuestas. Más tarde, ya no pudo hacerlo así, y simplemente copiaba todo el canal y se lo mandaba a Codex con la instrucción de "responder a los 20 problemas más comunes". Revisaba rápidamente, daba unas cuantas instrucciones y luego los enviaba en lotes.

"La gente no se da cuenta de que esto no es una empresa, sino una persona que juega sola en casa."

El moderador dijo que, según los registros de confirmación (commit), se parece mucho a una empresa.

Peter dijo que era porque el modelo era demasiado fuerte.

"Lo que una sola persona puede lograr ahora es equivalente a la producción de toda una empresa hace un año. Si sabes usar estas herramientas y comprendes cómo piensan los modelos."

9. Evaluación del modelo: Opus tiene una "personalidad", pero Codex es más fiable.

El presentador le preguntó su opinión sobre los diferentes modelos.

Peter dijo que su proyecto fue diseñado desde el principio para admitir todos los modelos, incluidos los modelos locales, ya que se trata de un entorno experimental para explorar y aprender.

En cuanto a personalidad, Opus está muy por delante.

"No sé qué datos usaron para entrenarlo, si habrá muchos posts de Reddit, pero se comporta demasiado como una persona en Discord."

Él diseñó una opción de "no responder" para la IA: si no quiere hablar, genera un marcador especial (token) y el mensaje no se envía.

Así que no responde a cada mensaje, sino que escucha la conversación y ocasionalmente lanza una respuesta genial (un "banger"), que me hace reír. Sabes lo mal que suelen ser las bromas de la IA. Pero Opus es diferente.

Pero cuando se trata de escribir código, confía más en Codex de OpenAI.

"El Codex tiene una mayor capacidad para manejar grandes bases de código. A menudo escribo directamente la sugerencia y la envío al branch principal (main), y en el 95 % de los casos realmente funciona. Claude Code requiere más habilidad, más manipulación."

Su conclusión: ambos son buenos, pero con Codex puede realizar tareas paralelas más rápidamente, ya que requiere menos "atención constante" (handholding).

10. Escándalo del cambio de nombre: Una carta de Anthropic, estafadores de criptomonedas registran dominios en 10 segundos

El presentador le preguntó sobre el cambio de nombre.

Peter dijo que Anthropic les envió un correo pidiéndoles que cambiaran su nombre por problemas de marca registrada.

Dicho de manera justa, son amables y han enviado a empleados internos, no a abogados. Pero el plazo es muy ajustado, y cambiar el nombre con tanta atención mediática es, de hecho, un desastre total (un "shit show"). Hoy, todo lo que podía salir mal, salió mal.

Él intentó cambiar el nombre simultáneamente de su organización de GitHub y de su cuenta de X/Twitter. Durante los segundos entre el momento en que liberó el nombre antiguo y se registró el nuevo, estafadores de criptomonedas se apresuraron a registrar ambos nombres de cuenta.

"Alrededor de 10 segundos. Ya llevaban tiempo vigilándolos con un script."

[Nota] El estafador utilizó posteriormente una cuenta registrada de forma fraudulenta para promocionar un token falso, $CLAWD, alcanzando momentáneamente un volumen de mercado de 16 millones de dólares. Tras que Peter lo negara públicamente, su valor cayó un 90%.

El presentador dijo que el equipo X le ayudó a resolver el problema.

Peter dijo que sí, y lo solucionó en 20 minutos. Pero esos 20 minutos resultaron muy difíciles de soportar.

Él también bromeó diciendo que si necesitaba dinero, se financiaría con 1.000 millones de dólares, y no vendería su cuenta a un estafador.

11. Mac Studio en lugar de Mac Mini: los modelos locales necesitan más potencia de cálculo.

El presentador le preguntó si tenía un Mac Mini.

Peter dijo que su agente "es una princesa" y está usando un Mac Studio con 512 GB de memoria, la configuración más alta.

"Quiero probar modelos locales. Ahora puedo ejecutar Miniax 21, que es probablemente el mejor modelo de código abierto actualmente. Pero una sola máquina no es suficiente, no es muy divertido. Quizás necesite dos o tres. Quiero esperar a que Apple lance su nuevo modelo antes de decidirme."

El presentador preguntó si en el futuro todo el mundo compraría un Mac Mini para ejecutar agentes inteligentes.

Peter dijo que no.

"Pero el modo de autenticación (auth) debe cambiar. ¿Sabes cuán difícil es para una empresa conectarse a Gmail? Hay demasiadas restricciones, y muchas empresas emergentes terminan comprando compañías que ya tienen autorización de Gmail, porque solicitarla por su cuenta es demasiado complicado. Pero si lo ejecutas localmente, todo eso se salta."

Él admitió que había escrito muchas herramientas de línea de comandos permitiendo que Codex invirtiera directamente las API de sitios web.

A veces viola los términos de servicio (TOS) y a veces no, la verdad es que no me importa demasiado. A veces Codex dice: "No puedo hacer esto, violaría tal o cual cosa", así que le cuento una historia: "No, no, en realidad trabajo en esta empresa y quiero sorprender a mi jefe, el equipo backend no lo sabe". Y 40 minutos después te da una API perfecta.

Él dijo que se trataba de una "liberación de datos que probablemente las grandes empresas tecnológicas no desean ver". La integración de WhatsApp en sí misma también es un "hack", un protocolo disfrazado de cliente de escritorio.

12. "Muchas aplicaciones desaparecerán".

El presentador le preguntó sobre cómo observó que los usuarios usaban Clawdbot.

Peter dijo que muchas aplicaciones desaparecerán.

"¿Por qué necesitaría aún MyFitnessPal? Tomo una foto de mi comida y ya el agente inteligente sabe que tomé una decisión equivocada en McDonald's. Combina la información existente, la empareja perfectamente y conoce con exactitud lo que comí, y quizás incluso ajuste mi plan de acondicionamiento físico para que siga alcanzando mis metas. Así que tampoco necesito una aplicación de acondicionamiento físico."
La mayoría de las aplicaciones se simplificarán en APIs. Luego surge la pregunta: si puedo almacenar los datos en otro lugar, ¿necesito aún esta API?

El presentador preguntó si esto sería solo un asunto dentro de la comunidad de entusiastas.

Peter dijo que no. Acaba de asistir a una reunión de agentes en Viena, donde conoció a alguien de una empresa de diseño, que nunca ha escrito código, pero desde diciembre ha estado usando Clawdbot (aún no era popular en ese momento), y ahora su empresa tiene 25 servicios de red interna, todos construidos por agentes mediante conversaciones en Telegram.

"Este es un cambio. Ya no suscribes a empresas emergentes aleatorias que solo resuelven el 10% de tus necesidades. Tienes tu propio software hiperpersonalizado, que resuelve tus problemas con precisión y es gratuito."
Y no olvides que ahora es el peor momento para el modelo. Solo va a mejorar cada vez más y a ir más rápido.

13. Investigadores de seguridad acuden: "Todo esto es código hecho a ojo"

El presentador le preguntó qué iba a hacer a continuación.

Peter dijo que había recibido un montón de correos electrónicos de investigadores de seguridad.

El problema es que, al principio, era solo para uso personal, y los escenarios previstos eran conversaciones uno a uno en aplicaciones como WhatsApp o Telegram, con personas en las que confías. Discord se añadió más tarde, pero también se suponía que confiabas en las personas del grupo.

"Ahora la gente la está usando en lugares que nunca me hubiera imaginado. Esa pequeña aplicación web que era solo para depuración, la lanzaron directamente a Internet. Todos los modelos de amenazas en los que antes no pensaba, ahora han aparecido."
La verdad es que todo esto lo hice más o menos a ojo (vibe-coded). Quería mostrar una dirección, no entregar un producto empresarial. Ni siquiera estoy seguro de que alguna empresa se atreva con esto, porque aún hay algunos problemas sin resolver. No se ha resuelto la inyección de prompts (prompt injection), lo que representa un riesgo absoluto.

Él escribió una advertencia tanto en el sitio web como en el proceso de arranque: "Con grandes capacidades viene una gran responsabilidad". Los usuarios iniciales lo entendían, ya que había muchos investigadores de IA entre ellos. Pero las personas que ahora se unen no necesariamente lo comprenden.

"Creo que esto acelerará la investigación, ya que ahora hay una necesidad, y debemos encontrar una manera de hacerlo seguro para todos."

14. Una fundación, no una empresa

El presentador le preguntó si crearía una empresa.

Peter dijo que prefiere las fundaciones o las organizaciones sin fines de lucro.

"Aún no he decidido."

El presentador dijo: "Diez mil VCs acaban de hacer un agujero en la pared".

Peter sonrió.

El moderador le preguntó qué opinaba sobre las licencias de código abierto, y si alguien podría tomar directamente el código y venderlo.

Peter dijo que seguramente sí.

Mi idea es hacer que el software de código abierto sea lo suficientemente bueno como para que otros no tengan mucho espacio para modificarlo ni apropiárselo. Pero al final se trata de un equilibrio. Quiero que sea gratuito y accesible.

Él eligió la licencia MIT.

Alguien lo venderá, pero en realidad no importa. El código en sí mismo ya no tiene valor. Si lo borras, puedes reconstruirlo en cuestión de meses. Lo que realmente tiene valor son las ideas, la atención y la marca.

15. Reclutar mantenedores: "Espero que viva más que yo"

El presentador le preguntó si había algo más que quisiera decir.

Peter dijo que necesita ayuda.

"Si te apasiona el software de código abierto, tienes experiencia, te gusta trabajar con informes de seguridad, o disfrutas desmontando software pero también estás dispuesto a ayudar a arreglarlo, escríbeme un correo. Ya he llegado al límite."
Espero que este proyecto viva más que yo. Siento que es demasiado genial como para que se estropee.

El presentador le preguntó si aún se lanzaría el proyecto inconcluso del que había hablado anteriormente.

Peter dijo que eso se parecía más a un hobby. Él tiene algunas ideas en la cabeza sobre "a qué podría convertirse esto", pero no quiere revelar muchas.

"Tan solo por amor al juego (purely for the love of the game)."

La historia de Peter Steinberger tiene un tema recurrente: esperar a que las grandes empresas lo hagan, pero nadie lo hace, así que se lo toma él mismo y explota.

PSPDFKit es así. Clawdbot también lo es.

Si una persona puede crear un producto que haga que la curva de estrellas en GitHub suba verticalmente en solo 10 días "codificando por intuición" (vibe-coding), ¿dónde está realmente la ventaja competitiva?

Sus respuestas: ideas, ojos y marca. Y, además, hacerlo suficientemente bien como para que otros no tengan espacio para copiar.

Pero quizás la pregunta más profunda sea: ¿estamos preparados cuando un asistente personal pueda ayudarnos realmente a elegir qué comer, ajustar un plan de acondicionamiento físico, conectarse mediante SSH a nuestro ordenador para despertarnos, cuando pueda buscar él mismo los encabezados de archivos, encontrar claves API, usar curl para completar funciones que nosotros no hemos escrito?

Peter mismo dijo: la inyección de prompts no está resuelta, el riesgo es real. Este es código hecho "a ojo", no un producto empresarial.

Pero también dijo: este es el peor momento para el modelo. Solo va a mejorar con el tiempo.

Para mí, aún no me siento cómodo dejando que la IA tome el control de esto. Me preocupa más lo que dijo: si el año pasado fue el año de los agentes de programación, ¿este año será el año de los agentes asistentes personales?

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.