Fundador da OpenClaw: IA é uma alavanca, não um substituto; 80% das aplicações serão substituídas

Este é outro entrevista de 40 minutos com Peter Steinberger, autor do ClawdBot/OpenClaw, conduzida por Peter Yang.

Peter é fundador da PSPDFKit e tem mais de 20 anos de experiência em desenvolvimento para iOS. Após a empresa ser adquirida estrategicamente pela Insight Partners por 100 milhões de euros em 2021, ele optou por "aposentar-se". Atualmente, o Clawdbot (que já foi renomeado para OpenClaw), que ele desenvolveu, tornou-se um sucesso. O Clawbot é um assistente de inteligência artificial que consegue conversar consigo por meio do WhatsApp, Telegram e iMessage, e está ligado a várias aplicações no seu computador.

Peter descreveu a Clawbot da seguinte forma:

É como um amigo que vive no seu computador, um pouco estranho, mas assustadoramente inteligente.

Nesta entrevista, ele partilha muitas ideias interessantes: por que sistemas complexos de orquestração de agentes são "geradores de lixo", por que "deixar a IA funcionar 24 horas" é um indicador vaidoso, e por que as linguagens de programação já não são importantes.

Um protótipo em uma hora, 300 mil linhas de código

Peter Yang perguntou o que exatamente era o Clawbot e por que o logotipo era um caranguejo.

Peter Steinberger não respondeu directamente à pergunta sobre caranguejos, mas contou uma história. Depois de regressar da "aposentadoria", ele mergulhou de cabeça no vibe coding (programação por vibe) — um estilo de trabalho em que um agente de IA escreve código por si. O problema é que o agente pode correr durante meia hora ou parar em dois minutos para lhe fazer perguntas. Pode ir almoçar e voltar a encontrar-se bloqueado, o que é muito irritante.

Ele queria algo que lhe permitisse ver o estado do computador a partir do telemóvel a qualquer momento. Mas não começou a trabalhar nisso, porque achava que era demasiado óbvio e que as grandes empresas certamente o fariam.

"Como em novembro do ano passado ninguém ainda tinha feito, pensei: está bem, eu mesmo vou fazer."

A versão inicial era extremamente simples: ligar o WhatsApp ao Claude Code. Enviava-se uma mensagem, ele chamava a IA e devolvia os resultados. Demorou apenas uma hora a montar.

E então "viveu". Agora o Clawbot tem cerca de 300 000 linhas de código e suporta quase todas as plataformas de mensagens principais.

"Penso que esta é a direção do futuro. Cada pessoa terá uma IA extremamente poderosa, que a acompanhará durante toda a vida."

Ele disse: "Assim que dás ao IA permissão para aceder ao teu computador, basicamente pode fazer qualquer coisa que tu consegues fazer."

Aquele dia de manhã em Marrocos

Peter Yang diz que agora você não precisa sentar-se diante do computador a olhar para ele, apenas lhe dê instruções.

Peter Steinberger acenou com a cabeça, mas havia outra coisa que queria dizer.

Uma vez, enquanto celebrava o aniversário de um amigo no Marrocos, descobriu que vinha a usar Clawbot. Pedir direcções, procurar recomendações de restaurantes, eram coisas pequenas. O que realmente o surpreendeu foi de manhã: alguém tinha publicado um tweet no Twitter a dizer que havia um erro num dos seus repositórios open-source.

"Eu tirei uma fotografia da publicação e enviei para o WhatsApp."

A I. L. compreendeu o conteúdo do tweet e reconheceu que se tratava de um relatório de erro. Ela verificou o repositório Git correspondente, corrigiu o problema, submeteu o código e, em seguida, respondeu àquela pessoa no Twitter dizendo que o problema já estava resolvido.

Na altura, pensei consigo: também é possível isto?

Ainda mais incrível foi uma vez em que ele caminhava na rua e, preguiçoso para digitar, enviou uma mensagem de voz. O problema é que ele nem sequer tinha programado o Clawbot para suportar mensagens de voz.

"Vi que aparecia 'a escrever' e pensei que estava perdido. No fim respondeu-me normalmente."

Mais tarde, ele perguntou ao IA como isso foi feito. IA respondeu: "Recebi um ficheiro sem extensão, por isso olhei para o cabeçalho do ficheiro e descobri que era no formato Ogg Opus. Como tens ffmpeg no teu computador, utilizei-o para converter para WAV. Depois procurei pelo whisper.cpp, mas não estava instalado. No entanto, encontrei a tua chave da API da OpenAI e utilizei o curl para enviar o áudio e fazer a transcrição."

Peter Yang disse depois: essas coisas realmente têm jeito, apesar de um pouco assustadoras.

É muito mais poderoso do que o ChatGPT no site, é como um ChatGPT sem restrições. Muitas pessoas não percebem que ferramentas como o Claude Code não são apenas boas para programação, elas são capazes de resolver qualquer tipo de problema.

Ferramenta de Linha de Comando (CLI)

Peter Yang perguntou como ele construiu aquelas ferramentas de automação, se as escreveu sozinho ou se fez a IA escrever.

Peter Steinberger sorriu.

Nestes meses, ele tem vindo a expandir a sua "legião CLI". O que os agentes são mais especializados? Chamar ferramentas da linha de comandos, porque os dados de treino são todos sobre isso.

Ele criou uma interface de linha de comandos (CLI) que permite aceder a todo o serviço Google, incluindo a API Places. Criou também uma ferramenta especializada para procurar memes e GIFs, de modo que a resposta do IA possa incluir imagens engraçadas. Inclusivamente desenvolveu uma ferramenta que visualiza sons, com o objetivo de permitir que a IA "experimente" música.

"Eu também hackeie o API da plataforma local de entrega a domicílio, de modo que a inteligência artificial pode-me dizer quanto tempo falta para a comida chegar. Existe também um inverso do API da Eight Sleep, que me permite controlar a temperatura da minha cama."

Nota: Eight Sleep é um colchão inteligente que pode regular a temperatura da cama, e a API oficial não está disponível.

Peter Yang pergunta: Todos estes foram criados pelo AI a pedido teu?

"O mais interessante é que, anteriormente, no PSPDFKit, desenvolvi durante 20 anos na ecologia da Apple, em Swift, Objective-C, e sou muito especializado. Mas, ao voltar, decidi mudar de rumo, porque fiquei farto de a Apple querer controlar tudo, e também porque a base de utilizadores de aplicações para Mac é muito reduzida."

O problema é que mudar de um conjunto de tecnologias em que és fluente para outro é doloroso. Entendes todos os conceitos, mas não sabes a sintaxe. O que é um "prop"? Como se destrutura um array? Tens de pesquisar cada pequeno problema e comes a sentir-te um idiota.

"Depois surgiu a IA, e tudo isto desapareceu. O seu pensamento a nível de sistema, a sua capacidade de arquitetura, o seu gosto, o seu julgamento sobre dependências — estas são as coisas que realmente têm valor, e agora podem ser facilmente transferidas para qualquer domínio."

Ele hesitou por um momento:

De repente, senti que conseguia construir qualquer coisa. A língua já não importava, o que importava era o meu pensamento de engenheiro.

Controlar o mundo real

Peter Steinberger começa a demonstrar a sua configuração. A lista de permissões concedidas à IA é impressionante:

E-mail, calendário, todos os ficheiros, lâmpadas Philips Hue, colunas Sonos. Ele pode programar a inteligência artificial para o acordar de manhã, aumentando gradualmente o volume. A inteligência artificial também tem acesso às câmaras de vigilância dele.

"Uma vez, deixei-o vigiar para ver se havia estranhos. No dia seguinte de manhã, ele disse-me: 'Peter, há alguém cá.' Olhei para a gravação e descobri que durante toda a noite ele tirava capturas de ecrã do meu sofá. Como a qualidade da imagem da câmara era má, o sofá parecia ter alguém sentado."

Na residência em Viena, a IA também pode controlar o sistema KNX de automação residencial.

"Ele realmente me trancou fora."

Peter Yang pergunta: Como é que isto tudo se liga?

"É só dizer diretamente a ele. Essas coisas são muito capazes, ele consegue encontrar sozinho a API, faz uma pesquisa no Google e procura por chaves no seu sistema."

Os jogadores ficaram ainda mais loucos:

Alguém fez com que fosse comprar online na Tesco
Alguém fez um encomenda no Amazon
Alguém programou-o para responder automaticamente a todas as mensagens.
Alguém adicionou-o ao grupo familiar como "membro da família"

"Deixei que ele me ajudasse a fazer o check-in no site da British Airways. Isto é simplesmente o teste de Turing, a operar um navegador num site de uma companhia aérea, sabes como aquele interface é anti-intuitivo."

Demorou quase 20 minutos na primeira tentativa, porque todo o sistema ainda era bastante tosco. O IA tinha de encontrar o passaporte dele no Dropbox, extrair as informações, preencher os formulários e passar no teste de verificação humana.

Agora é apenas uma questão de minutos. Pode clicar no botão de verificação "Sou humano", porque está a controlar um navegador real e o seu padrão de comportamento não é diferente do de uma pessoa.

80% das aplicações desaparecerão

Peter Yang pergunta: Para utilizadores normais que acabam de descarregar a aplicação, qual é um modo de utilização seguro para começar?

Peter Steinberger diz que o caminho de cada pessoa é diferente. Alguns começam a utilizá-lo imediatamente para escrever aplicações iOS, outros correm logo para gerir o Cloudflare. Um utilizador instalou-o na primeira semana para si próprio, na segunda para a família e, na terceira, começou a fazê-lo para uma versão empresarial da sua empresa.

"Depois de eu instalar para um amigo não técnico, ele começou a me enviar pedidos de pull. Ele nunca tinha feito um pull request na vida."

Mas o que ele realmente quer dizer é o quadro mais amplo:

"Se pensares bem, esta coisa pode substituir 80% dos apps no teu telemóvel."

Por que devo ainda registar a minha alimentação com o MyFitnessPal?

Tenho um assistente infinitamente útil que já sabe que tomei uma decisão errada no KFC. Tiro uma fotografia e ele armazena-a na base de dados, calcula as calorias e lembra-me que devo ir à academia.

Por que continuar a utilizar uma aplicação para definir a temperatura do Eight Sleep? A inteligência artificial tem permissões de API e pode ajustar por si. Por que continuar a utilizar uma aplicação de tarefas pendentes? A inteligência artificial pode lembrar-se por si. Por que continuar a utilizar uma aplicação para confirmar a marcação do voo? A inteligência artificial pode fazê-lo por si. Por que continuar a utilizar uma aplicação de compras? A inteligência artificial pode recomendar, pode efetuar a encomenda e pode acompanhar.

"Haverá uma camada inteira de aplicações que desaparecerá gradualmente, porque, se tiverem uma API, serão apenas serviços que vais utilizar e que o teu IA irá invocar."

Ele prevê que 2026 será o ano em que muitas pessoas começarão a explorar assistentes de IA pessoais, e também as grandes empresas entrarão nesse mercado.

O Clawbot nem sempre é o vencedor final, mas esta direção está certa.

Apenas fale com ele

Mudando o assunto para a metodologia de programação com IA. Peter Yang disse que escreveu um artigo muito popular chamado "Just Talk to It" (Apenas converse com ela), e gostaríamos de ouvir mais detalhes sobre isso.

A ideia central de Peter Steinberger é: não caia na "armadilha do agente" (agentic trap).

"Vejo muita gente no Twitter a descobrir que os agentes são muito bons, depois querem que eles sejam ainda melhores e caem no buraco do coelho. Eles criam várias ferramentas complexas para acelerar os fluxos de trabalho, mas no fim do dia estão apenas a construir ferramentas, e não coisas verdadeiramente valiosas."

Ele próprio também caiu nessa. No início, ele passou dois meses a construir um túnel VPN só para aceder ao terminal no telemóvel. Foi tão bem-sucedido que, numa ocasião, enquanto jantava com um amigo num restaurante, passou o tempo todo a programar no telemóvel em vez de participar na conversa.

Tive de parar, principalmente por razões de saúde mental.

Cidade dos Restos

Recentemente, o que o deixou furioso foi um sistema de orquestração chamado Gastown.

"Um orquestrador super complexo, capaz de executar ao mesmo tempo dezenas de agentes inteligentes, que se comunicam entre si e dividem tarefas. Existem observadores (watchers), supervisores (overseers), prefeitos (mayors), pcats (que podem ser 'cidadãos comuns' ou 'gatos de estimação', ou até papéis meramente decorativos), e nem sei dizer o que mais há."

Peter Yang: Espere, ainda há o prefeito?

"Sim, o projeto Gastown tem um prefeito. Eu chamo este projeto de 'Cidade do Lixo' (Slop Town)."

Também existe o modo RALPH (um ciclo de tarefas únicas "use e jogue fora", em que se dá uma pequena tarefa à IA, e depois, ao terminá-la, apaga-se toda a memória contextual, reiniciando tudo do zero, num ciclo contínuo)...

"Esta é simplesmente a máquina final para queimar tokens. Deixa-a funcionar durante toda a noite e, de manhã, obténs o lixo final (slop)."

O problema fundamental é: esses agentes ainda não têm senso estético. Eles são assustadoramente inteligentes em certos aspectos, mas, se não os guiar e não lhes disser o que pretende, o que sai é lixo.

"Não sei como os outros trabalham, mas quando começo um projeto, tenho apenas uma ideia vaga. À medida que construo, brinco e sinto, a minha visão vai-se tornando gradualmente mais clara. Experimento algumas coisas, algumas não funcionam, e as minhas ideias evoluem até atingirem a sua forma final. A minha próxima palavra-chave (prompt) depende do estado actual do que vejo, sinto e penso."

Se tentares incluir tudo na especificação inicial, vais perder esta interação homem-máquina.

"Não sei como se pode fazer algo bom sem sentimentos e sem o envolvimento do paladar."

Alguém mostrou na Twitter uma aplicação de notas "gerada inteiramente pelo RALPH". Peter respondeu: Sim, parece mesmo ter sido gerada pelo RALPH. Nenhum ser humano normal iria desenhar algo assim.

Peter Yang resume: muitas pessoas correm o AI 24 horas não para criar aplicações, mas para provar que elas próprias conseguem manter o AI a funcionar durante 24 horas.

É como uma competição de tamanhos sem referência. Também deixei o ciclo rodar durante 26 horas, e na altura senti-me muito satisfeito. Mas é uma medida vaidosa e sem significado. Construir tudo o que é possível não significa que devas construir tudo, nem que será bom.

O modo de planeamento é uma adaptação (hack).

Peter Yang perguntou como gerir o contexto. Com diálogos longos, a IA pode ficar confusa, sendo necessário comprimir ou resumir manualmente?

Peter Steinberger chama isto de "um problema do modelo antigo".

O "Claude Code" ainda tem este problema, mas o Codex é muito melhor. Na teoria, pode ter apenas 30% a mais de contexto, mas na prática parece ser duas a três vezes mais. Acho que isso tem a ver com o mecanismo interno de pensamento. Atualmente, a maioria das minhas funcionalidades pode ser desenvolvida dentro de uma única janela de contexto, onde discussão e construção ocorrem simultaneamente.

Ele não usa worktrees, porque são "complexidade desnecessária". Em vez disso, ele apenas faz checkout de várias cópias do repositório: clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5. Usa aquele que estiver livre, faz os testes, empurra para a branch principal (main) e sincroniza.

"Um pouco como uma fábrica, se todas estiverem ocupadas. Mas se só abrir uma, o tempo de espera é demasiado longo e não consegue entrar no estado de fluxo."

Peter Yang diz que isto é como um jogo de estratégia em tempo real, em que tens uma equipa a atacar e tens de a gerir e supervisionar.

Quanto ao modo de planeamento, Peter Steinberger tem uma opinião controversa:

"O modo de planeamento é uma solução improvisada que a Anthropic teve de implementar, porque o modelo é muito impulsivo e vai direto para a escrita de código. Se utilizares o modelo mais recente, como o GPT 5.2, estás a ter uma conversa com ele. 'Quero construir esta funcionalidade, acho que devia ser assim e assado, gosto deste estilo de design, dá-me algumas opções, vamos primeiro conversar.' Depois ele propõe ideias, discutem, chegam a um acordo e só depois começam a trabalhar."

Ele não digita, ele fala.

Muitas vezes falo com ela.

Desenvolvimento de Drivers para Discord

Peter Yang perguntou qual era o seu processo para desenvolver novas funcionalidades. Começa por explorar o problema? Começa por fazer um plano?

Peter Steinberger disse que fez "provavelmente a coisa mais louca que já fiz": ligou o Clawbot dele a um servidor público do Discord, permitindo que todos pudessem conversar com a sua inteligência artificial privada, com as suas memórias pessoais, em público.

"Este projecto é difícil de descrever com palavras. É como uma mistura entre o Jarvis (o assistente de IA do Homem de Ferro) e o filme 'Ela'. Cada pessoa a quem mostrei pessoalmente ficou super empolgada, mas não consigo fazer com que as imagens e legendas no Twitter deslanchem. Então, pensei: deixemos as pessoas experimentarem por si mesmas."

Os utilizadores fazem perguntas, relatam bugs e sugerem funcionalidades no Discord. O seu fluxo de trabalho de desenvolvimento é o seguinte: tira uma captura de ecrã da conversa no Discord, arrasta-a para o terminal e diz ao IA: "vamos falar sobre isto".

"Estou preguiçoso para digitar. Quando alguém pergunta 'vocês suportam isto ou aquilo?', deixo que a IA leia o código e escreva uma Pergunta Frequentemente Feita (FAQ)."

Ele também escreveu um rastreador que escaneia o canal de ajuda do Discord pelo menos uma vez por dia, permitindo que a IA resuma os principais problemas, e então eles corrigem esses problemas.

Sem MCP, sem orquestração complexa

Peter Yang pergunta: Utilizas essas coisas "chiques"? Agentes múltiplos, competências complexas, MCP (Model Context Protocol), etc.?

A maioria das minhas competências são habilidades quotidianas: anotar a alimentação, comprar ingredientes, essas coisas. Programação é rara, porque não é necessário. Não utilizo MCP, nem qualquer dessas coisas.

Ele não acredita em sistemas de programação complexos.

Estou num ciclo em que consigo criar produtos que me fazem sentir melhor. Talvez haja métodos mais rápidos, mas já estou perto do limite, não é o IA que me limita, estou principalmente limitado pela velocidade do meu próprio pensamento, por vezes pelo tempo que demoro a esperar pelo Codex.

O seu antigo sócio fundador do PSPDFKit, que era advogado, também lhe está a enviar pedidos de incorporação de código (pull requests).

"É maravilhoso que a IA permita que pessoas sem formação técnica construam coisas. Eu sei que há quem se oponha, dizendo que o código não é perfeito. Mas vejo os pedidos de pull request como pedidos de prompt (sugestões), que transmitem a intenção. A maioria das pessoas não tem a mesma compreensão do sistema, pelo que não consegue orientar o modelo para o resultado ideal. Por isso, prefiro obter a intenção e fazer o trabalho eu próprio, ou reescrever com base no seu PR."

Ele vai marcá-los como co-autores, mas raramente integra directamente o código de outras pessoas.

Encontre o seu próprio caminho.

Peter Yang resume: portanto, o ponto principal é: não use o gerador de preguiça, mantenha as pessoas no ciclo, porque o cérebro e o gosto humano são irreplaceáveis.

Peter Steinberger acrescentou:

"Ou talvez, encontre o seu próprio caminho. Muitas pessoas me perguntam 'como você faz isso', e a resposta é: você tem de explorar por si próprio. Leva tempo aprender essas coisas, cometer os seus próprios erros. Isto é como aprender qualquer coisa, exceto que este campo muda particularmente rapidamente."

Clawdbot está emclawd.botAmbos estão disponíveis no GitHub. Clad com W, C-L-A-W-D-B-O-T, como uma pinça de caranguejo.

Nota: ClawdBot foi renomeado para OpenClaw

Peter Yang disse que também tinha de experimentar. Não queria sentar-se diante do computador a conversar com a IA, mas sim dar ordens a qualquer momento enquanto estava fora com as crianças.

"Penso que vais gostar", disse Peter Steinberger.

As ideias principais de Peter Steinberger podem ser resumidas em duas frases:

A inteligência artificial já é tão poderosa que pode substituir 80% dos aplicações no seu telemóvel.
Mas, se não houver gosto e julgamento humanos no ciclo, a saída será apenas lixo.

Estas duas frases parecem contraditórias, mas apontam para a mesma conclusão: a IA é uma alavanca, não um substituto. O que é ampliado são as tuas capacidades inerentes: pensamento sistémico, capacidade de arquitetura e intuição sobre bons produtos. Se não as tiveres, mesmo que múltiplos agentes inteligentes funcionem em paralelo durante 24 horas, estarás apenas a produzir em massa "lixo".

A sua prática é em si mesma a melhor prova: um programador com 20 anos de experiência em iOS construiu um projeto com 300 000 linhas de código em apenas alguns meses com TypeScript. Isso não se deveu ao facto de ter aprendido a sintaxe da nova linguagem, mas sim a essas coisas que são independentes da linguagem.

"A linguagem de programação não é importante, o importante é o meu pensamento em engenharia."