Editor's note: When AI begins writing code, handling support tickets, and reviewing legal documents, a more fundamental question is emerging: What are companies truly purchasing—tokens, GPU hours, or completed work?

Este artigo propõe um framework digno de atenção: a comercialização da IA não deve ser compreendida apenas como um «mercado de poder de computação» ou «mercado de chamada de modelos», mas sim como um novo «mercado de força de trabalho machine». Nesse mercado, os tokens são apenas unidades de medição, as GPU são insumos, os modelos são ferramentas de produção, e o que realmente é precificado e negociado é o trabalho econômico realizado diretamente por software.

A avaliação central do artigo é que o mecanismo de precificação de IA passará por uma evolução desde tokens originais, capacidades de modelos padronizados, até força de trabalho setorial e, por fim, mercados de resultados programáveis. Ou seja, no futuro, as empresas podem não se importar mais com qual modelo ou qual GPU realizou uma tarefa específica, mas sim se o resultado entregue atendeu aos padrões de latência, precisão, confiabilidade e custo estabelecidos.

Isso também significa que o impacto da IA no mercado de trabalho humano não é necessariamente apenas uma substituição simples. À medida que máquinas assumem mais tarefas padronizáveis e verificáveis, o papel humano pode se deslocar para revisão, responsabilidade, gerenciamento de contexto e julgamento final. Em certos cenários, os últimos 1% de julgamento humano podem até se tornar mais valiosos, pois permitem liberar 99% da automação em larga escala.

Do ponto de vista deste ângulo, a próxima fase da competição no mercado de IA talvez não seja mais uma disputa apenas de capacidade de modelos nem uma simples guerra de preços de poder de computação, mas sim quem conseguirá primeiro padronizar, verificar e precificar o «trabalho», transformando finalmente a força de trabalho machine em um novo fator de produção que possa ser adquirido, liquidado e negociado.

The following is the original text:

As ondas de produtividade sempre vieram de ferramentas e softwares criados para humanos otimizarem a forma como o trabalho é realizado. Planilhas ajudaram contadores e analistas, esteiras transportadoras aumentaram a capacidade de produção e martelos amplificaram a alavanca humana. Mas o verdadeiro trabalho sempre veio dos seres humanos.

Agora, a IA está produzindo resultados de trabalho de ponta a ponta, executando diretamente o trabalho em si. Ela pode escrever código, processar chamados de atendimento ao cliente e revisar documentos jurídicos. O final da pilha tecnológica está passando por compressão: a pilha tecnológica antiga suportava o trabalho, enquanto a nova pilha tecnológica começa a produzir trabalho.

Se você ouviu recentemente discussões sobre a financialização da IA, provavelmente ouviu pessoas como Jensen dizerem que tokens de LLM e/ou horas de GPU estão se tornando novas commodities. Essa intuição é compreensível, pois os tokens são mensuráveis, cobráveis e fáceis de graficar; atrás das horas de GPU há bilhões de dólares em investimentos. Mas os tokens ainda são apenas medidores, e as horas de GPU são apenas insumos — ninguém as compra por querer possuí-las em si mesmas. O que as pessoas realmente querem é concluir o trabalho. A IA está transformando a própria pilha tecnológica em uma fonte de trabalho.

Preço de resultado

Força de trabalho automatizada: trabalho executado por software, com utilidade econômica e vendido para a cadeia produtiva.

O mercado já está se movendo nessa direção. Sarah Tavel, da Benchmark, tende a entender essa oportunidade por meio do mercado de trabalho terceirizado, em vez de categorias de software. Se uma tarefa repetitiva já é realizada por equipes offshore especializadas ou empresas de serviços profissionais, geralmente também é adequada para ser entregue por IA. Alex Rampell, da a16z, chama isso de “software devorando o trabalho”: a próxima cena do software é realizar o trabalho pessoalmente. Julien Bek, da Sequoia, descreve a mesma mudança sob outro ângulo: os serviços estão se tornando software; o copilot vende ferramentas, enquanto o autopilot vende trabalho.

Preço de resultado

O mercado ausente por trás da precificação dos resultados

Os preços de assento são cobrados com base no acesso; os preços de token são cobrados com base no uso. Os preços de resultado são cobrados quando o trabalho é concluído. Os preços de resultado representam um passo à frente, mas ainda não respondem a uma pergunta: quem define o preço?

Se a força de trabalho machine puder ser comprada diretamente, os preços deveriam surgir da competição entre fornecedores. Esses fornecedores devem ser capazes de atender aos mesmos padrões de tarefas ou conclusão de trabalho, o que exige a padronização dentro de diferentes setores e tarefas.

A abordagem atual utiliza tokens LLM, mas os tokens originais são apenas a unidade básica. Um barril de petróleo é apenas uma unidade de medição; o que realmente é negociado é um barril de petróleo de um determinado grau, com qualidade, termos de entrega e preço de mercado claramente definidos. Um barril de petróleo Brent e um barril de petróleo pesado de alto teor de enxofre não são o mesmo produto. O mesmo vale para os tokens LLM. Os tokens são apenas unidades de medição; o que realmente importa é a inteligência por trás deles: qualidade do modelo, limite de benchmark, latência, janela de contexto, confiabilidade e garantia de entrega. Um milhão de tokens de um modelo de código de ponta não é o mesmo produto que um milhão de tokens de um modelo genérico barato. O mercado precisa de graus padronizados de inferência, assim como o mercado de energia precisa de graus padronizados de petróleo.

Anjali Shriva apontou diretamente isso: um token não é uma unidade de custo fixa. Sua economia varia conforme o comprimento do contexto, a estrutura da tarefa, a proporção entrada/saída, o número de tentativas, chamadas de ferramentas e fluxos de trabalho do Agent. Um token em uma prompt curta não é o mesmo objeto econômico que um token enterrado em um longo ciclo de Agent.

Já fazemos isso há muito tempo no mercado de trabalho humano. Ninguém contrata um radiologista como um "hora humana" genérica. As pessoas analisam a formação, certificações de licença, especialização, anos de experiência, disponibilidade, reputação e responsabilidade. Diferentes especificações de contratos humanos correspondem a diferentes padrões mínimos e expectativas de nível.

O mercado de trabalho humano sempre funcionou com base nesses critérios, apenas que esses critérios costumam ser misturados, qualitativos e cheios de indicadores proxies. A força de trabalho machine tornará esses critérios mais explícitos e mais mensuráveis.

Para LLMs ou Agentes, métricas como habilidades, experiência, velocidade e confiabilidade podem ser diretamente incluídas em contratos: pontuações de benchmark, latência, throughput, janela de contexto, comprimento máximo de saída, precisão no uso de ferramentas, tempo de atividade e taxa de erro. Podemos adquirir mão de obra com base em expectativas e resultados mensuráveis.

As especificações do contrato da TheGrid.ai são, essencialmente, um filtro de elegibilidade, mais uma competição de preços para saídas de LLM. Os fornecedores que atendem às especificações podem participar da competição:

Benchmark inteligente ≥ limite mínimo

Latência ≤ limite

Throughput ≥ lower limit

Uptime ≥ limite mínimo

Taxa de erro ≤ limite

Quando todos os fornecedores atingem o mesmo limite mínimo, eles começam a competir em preço. O comprador pergunta: qual fornecedor pode entregar a mão de obra necessária ao melhor preço?

A contratação de radiologistas tornou-se, no contexto dos LLM, um problema mensurável: quais LLM conseguem ler radiografias com alto nível de habilidade e concluir a tarefa dentro de prazos, janelas de contexto e outras especificações contratuais baseadas em resultados.

O resultado é a forma pela qual os compradores medem o sucesso; o trabalho é a atividade econômica fornecida; e o token é o combustível consumido pela máquina durante a execução do trabalho.

The Grid é o mercado de força de trabalho automatizada.

Do token ao mercado de mão de obra machine

O mercado pode precificar o investimento em pilha tecnológica, mas para precificar a saída, é necessário um mercado de trabalho de máquinas. Os compradores não se importam com horas de GPU. Os endpoints do modelo também não são estáveis: eles são renomeados, descontinuados, empacotados ou diretamente aposentados.

Usuários e liquidez odeiam mudanças frequentes. GPU e modelos evoluirão continuamente, mas a unidade estável é o próprio trabalho.

Acredito que o mercado evoluirá ao longo do seguinte caminho. Cada degrau acima, o que é comprado torna-se mais abstrato, mais valioso, mas também mais difícil de verificar. A Grid deve subir gradualmente por esta escada:

Token original → Mercado de capacidades de LLM comercializáveis → Mercado de mão de obra comercializável → Mercado de resultados programáveis

Fase 1: Token original

Claude 4.7, GPT 5.5, Kimi 2.6, DeepSeek V4, GLM 5, entre outros.

Hoje, os compradores adquirem saídas de modelos originais de fornecedores de inferência. Eles enviam seus próprios prompts, recebem os resultados da inferência e pagam conforme o uso. Isso é fácil de verificar, mas ainda é apenas matéria-prima. O que os compradores realmente desejam não são tokens, mas inteligência útil obtida ao melhor preço.

Fase dois: Mercado de capacidades de LLM comercializáveis

Por exemplo, text/usd, code/usd, agent/usd, etc.

Os compradores não escolhem mais um modelo específico, mas sim a categoria inteligente que atende às suas necessidades. Os compradores ainda mantêm o fluxo de trabalho, os prompts, os dados e a lógica de aplicação. O Grid apenas encaminha cada solicitação para o modelo qualificado que atende às especificações do contrato e tem o menor preço.

Nota: Este é o primeiro nível de abstração real acima do token original e o nível em que o TheGrid.ai atualmente se encontra.

Fase três: mercado de trabalho mercantilizado

Por exemplo, accounting/usd, support_agent/usd, legal/usd, healthcare/usd, radiology/usd, etc.

À medida que os modelos se tornam mais especializados, o mercado de capacidades pode evoluir ainda mais para mercados específicos por setor. Isso é semelhante à especialização laboral dos seres humanos em diferentes mercados de trabalho.

Neste nível, vendemos capacidades de inferência adequadas aos fluxos de trabalho de verticais específicos de força de trabalho. À medida que modelos segmentados por setor se tornam mais comuns, esse mercado crescerá rapidamente. Exemplos relevantes incluem o Composer do Cursor, o Harvey voltado para trabalhos jurídicos e o EvidenceOpen voltado para saúde.

Fase 4: RFQ programável voltada para Agentes e mercado de resultados

Por exemplo, support_ticket_resolved/usd, pr_merged/usd, claim_processed/usd, etc.

A última camada é onde The Grid passa do mercado de inferência para o mercado de força de trabalho machine.

Esta camada requer mecanismos como RFQ (solicitação de cotação), conta de custódia, liquidação diferida, confirmação do comprador, reputação do fornecedor e mecanismos de retenção e resolução de disputas. É provável que comece com RFQ, em vez de adotar diretamente o livro de ordens. O comprador define o escopo do trabalho, as restrições, os critérios de aceitação e os termos de liquidação, enquanto os agentes fazem lances para completar a tarefa. O Grid ajuda a rotear, precificar, validar e liquidar esse trabalho.

Esta é a camada mais valiosa, mas também a mais difícil de verificar, pois os resultados podem ser atrasados, subjetivos e fáceis de manipular. Um ticket de atendimento ao cliente pode ser reaberto; um PR pode passar nos testes, mas ainda assim causar uma arquitetura ruim.

Custo total = Custo do trabalho concluído + Custo do risco assumido

Um fluxo de trabalho não se torna automaticamente um mercado apenas porque a inteligência se tornou comercializável ou mais barata. Alguns trabalhos dependem fortemente de contextos privados, como histórico de clientes ou políticas internas. Quanto mais um trabalho depender de contexto, menos provável será que possa ser liquidado limpa e facilmente em um mercado aberto. [@hypersoren https://hypersoren.xyz/posts/cybernetic-arbitrage/]

O mercado precisa revelar quais categorias de mão de obra se expandirão e quais se contrairão.

«Força de trabalho machine vs força de trabalho humana», ou «Força de trabalho machine & força de trabalho humana»

Anjali Shriva observa em seu rascunho de design de mecanismo que as narrativas de IA são frequentemente descritas como substituição. Na realidade, são mais como um problema de coordenação: quando humanos e máquinas participam da produção, como o trabalho, a atribuição, os incentivos e o valor são reorganizados?

Hoje, muitos usos de IA dentro das empresas ainda estão presos, pois os funcionários usam IA de forma privada, os fluxos de trabalho permanecem isolados em indivíduos, e as empresas não conseguem precificar esses aumentos de produtividade nem escalar esses benefícios.

A maioria dos trabalhos que podem ser automatizados provavelmente será transferida para máquinas. Parte do trabalho se tornará revisão humana, responsabilidade, treinamento e gerenciamento de contexto. Em alguns casos, os últimos 1% de julgamento humano se tornarão mais valiosos, pois podem desbloquear em larga escala os 99% de trabalho automatizado.

Rachel Su Park, em "Brave New World of AI Markets", afirma que o TAM da IA não deve ser modelado simplesmente como uma substituição das despesas atuais com mão de obra humana, pois ela altera simultaneamente preço e quantidade. Com a redução dos custos de trabalho, o preço por unidade pode diminuir, mas a quantidade consumida pode expandir, pois trabalhos existentes serão consumidos com maior frequência e novos trabalhos anteriormente inviáveis economicamente tornar-se-ão possíveis. O artigo resume isso como:

P × Q: Tamanho do mercado = Preço por unidade de trabalho × Quantidade de trabalho consumida

Se a IA tornar as interações de atendimento ao cliente mais baratas, as empresas poderão oferecer serviço disponível 24/7. Este mercado não será apenas uma versão mais barata do mercado tradicional de mão de obra de atendimento ao cliente, mas pode se tornar um mercado de interação com o cliente de maior escala.

AI é um mercado expansivo, pois quando o custo do trabalho diminui, a demanda não permanece constante.

Camada de força de trabalho

O mercado de força de trabalho machine deve começar com trabalhos cujas especificações possam ser claramente definidas. As horas de GPU contêm muitas informações de entrada e só lhe dizem o que sustentou o trabalho; já precificar o resultado completo é muito complexo e depende excessivamente do contexto. À medida que a verificação, a reputação e a precificação de risco/seguro forem gradualmente assumidas por máquinas, o mercado evoluirá para uma camada puramente de resultados.

A força de trabalho machine pode se tornar negociável, pois os compradores se importarão cada vez menos com qual modelo ou qual GPU produziu o trabalho, e mais com se o trabalho em si atingiu o padrão mínimo e a classificação especificados no contrato ao preço correto. Os Agentes sequer se importarão com essas fontes subjacentes.

As máquinas já podem executar diretamente trabalhos com utilidade econômica, que podem ser definidos, medidos, precificados, adquiridos e, finalmente, negociados. A eletricidade, o poder de processamento, os modelos e os tokens ainda são importantes, mas todos permanecem na cadeia de suprimentos upstream.

O local onde o trabalho realmente é concluído é a cadeia de suprimentos, e o mercado está se movendo em direção a um objeto mais simples: mão de obra automatizada.