BitTorrent lança o BTTInferGrid, uma rede descentralizada de computação de inferência de IA

À medida que os AI Agents são implementados em diversos cenários complexos, como fluxos de trabalho empresariais, produção automatizada e execução autônoma, a indústria global de IA entra oficialmente em uma nova fase, passando da “resposta passiva” para a “execução autônoma”. O núcleo da competição setorial já deixou de ser meramente a comparação de parâmetros de grandes modelos e passou a ser a disputa pela capacidade de implementação e execução prática, sendo a poderosa capacidade de raciocínio lógico a base fundamental que sustenta essa transformação.

A mudança de paradigma nos cenários de aplicação também impulsionou uma transformação fundamental na demanda por infraestrutura de computação upstream: o foco no consumo de computação está continuamente se deslocando do treinamento de modelos para a inferência operacional, uma tendência irreversível. No entanto, o atual sistema centralizado de computação, diante de solicitações de inferência em grande volume, alta frequência e fortes flutuações de pico e vale, revela problemas como altos custos operacionais, escala elástica limitada e insuficiente estabilidade de serviço, colocando toda a indústria de IA diante de um gargalo no fornecimento de computação.

Em 17 de junho, a antiga ecosistema descentralizado de transmissão BitTorrent lançou oficialmente seu produto estratégico — BTTInferGrid, focado no segmento de inferência de IA, criando uma rede descentralizada de poder computacional. A plataforma, baseada em uma arquitetura descentralizada e distribuída, agrega eficientemente recursos dispersos de GPU ociosas em todo o mundo, eliminando as barreiras entre a oferta de recursos e os desenvolvedores de IA, oferecendo serviços de poder computacional para inferência de IA abertos, de fácil integração, com resultados verificáveis na blockchain e cobrança flexível conforme o uso.

Aproveitando as vantagens da tecnologia descentralizada, o BTTInferGrid não apenas corrige as limitações da computação centralizada tradicional em cenários de alta concorrência e flutuações de carga, mas também alcança uma ruptura significativa no lado da oferta de computação, reestruturando completamente a lógica de alocação e fluxo de recursos no ecossistema de computação.

Ao mesmo tempo, o BTTInferGrid é um produto estratégico desenvolvido pelo BitTorrent a partir da atualização do serviço BTFS existente, representando não apenas a extensão-chave da capacidade de agendamento de recursos descentralizados, aprimorada ao longo de muitos anos pelo BitTorrent, da área de armazenamento para o domínio de computação, mas também um movimento crucial na sua estratégia para o setor de IA descentralizada.

A estrutura da demanda por poder de processamento muda da “treinamento” para a “inferência”: BTTInferGrid reestrutura a oferta de poder de processamento para inferência de IA de forma descentralizada

BTTInferGrid busca reestruturar o sistema de fornecimento de poder de computação por meio de um modelo descentralizado, resolvendo problemas como custos excessivos e escassez de capacidade de inferência de IA, ao mesmo tempo em que reduz custos, aumenta a eficiência e melhora a eficiência da inferência de modelos grandes, oferecendo à indústria uma infraestrutura de computação de alto desempenho, alta resiliência e alto custo-benefício.

Se 2024 a 2025 foi o período da "guerra dos mil modelos" e da corrida armamentista de parâmetros dominada por clusters de milhares de GPUs na indústria de IA, então em 2026, com a implementação em larga escala de AI Agents, a IA entra oficialmente na era de explosão de aplicações em larga escala: a "era da inferência". A inferência da IA é o elo crucial para a materialização do valor do modelo, transformando "modelos treinados" em aplicações práticas, valor comercial e serviços cotidianos. Em resumo, o treinamento é "ensinar a IA a aprender", enquanto a inferência é "fazer a IA ser usada na prática" — por exemplo, um carro autônomo identificando uma placa de pare em uma estrada que nunca percorreu antes é um exemplo típico de inferência. A capacidade de inferência determina diretamente a experiência do usuário, os custos operacionais e o valor comercial dos produtos de IA.

Há um consenso geral na indústria de que mais de 70% dos recursos de computação no futuro serão utilizados para cenários de inferência. Oracle previu anteriormente que o mercado de computação para inferência acabará superando o mercado de computação para treinamento. O acadêmico da Academia Chinesa de Engenharia, Zheng Weimin, também destacou que a maior parte da computação atual é consumida nas interações diárias entre usuários e grandes modelos. Em termos de composição de custos, na inferência de grandes modelos, mão de obra representa apenas 3%, dados representam 2%, enquanto a computação representa 95%; os custos de computação para aplicações líderes são muito significativos: o custo diário de inferência do ChatGPT é de aproximadamente 700 mil dólares americanos, e o DeepSeek V3 também atinge 87 mil dólares americanos.

Quando a demanda por capacidade de IA passou da treinamento centralizado de poucos gigantes tecnológicos para milhões de cenários de inferência comercial de desenvolvedores em diversos setores, os critérios de avaliação da infraestrutura subjacente também mudaram. Na era do treinamento, os desenvolvedores se concentravam principalmente na escala e eficiência da capacidade centralizada; na era da inferência, os serviços de IA são direcionados diretamente a bilhões de usuários finais, gerando bilhões de interações diárias e um consumo massivo de capacidade. Nesse contexto, o foco dos desenvolvedores passou para o custo por chamada, a velocidade de resposta e a estabilidade do serviço. Hoje, a oferta de capacidade, o custo de chamada e a disponibilidade do serviço tornaram-se os critérios centrais para avaliar a infraestrutura de IA e são determinantes para o sucesso da implementação de aplicações de IA.

No entanto, diante da demanda por inferência em crescimento exponencial, as limitações dos sistemas centralizados de poder de computação tornam-se cada vez mais evidentes: os aluguéis de GPU continuam a subir, os serviços da plataforma sofrem interrupções frequentes e muitos aplicativos de IA foram forçados a encerrar devido aos custos de computação. Esses problemas se manifestam claramente nos três aspectos a seguir:

Em primeiro lugar, a elasticidade de escalonamento de capacidade de processamento é insuficiente para lidar com as flutuações de tráfego, levando a um desequilíbrio entre custo e estabilidade: embora as principais empresas de IA e provedores de nuvem continuem aumentando seus investimentos em infraestrutura de processamento, a demanda por inferência cresce rapidamente e apresenta características claras de picos e vales — durante o dia, em horários de trabalho ou pico de marketing, as requisições podem aumentar dezenas de vezes; à noite, caem drasticamente. Os data centers centralizados, sem capacidade de escalonamento elástico, não conseguem se adaptar a essas mudanças dinâmicas: se dimensionados para o pico, os custos de depreciação nos períodos de baixa são elevados; se dimensionados para a média, ocorrem interrupções de serviço nos picos, resultando em um dilema entre “alto custo” e “baixa estabilidade”. Ao mesmo tempo, a capacidade de processamento centralizada ainda incorre em múltiplas camadas de custos adicionais — construção de data centers, energia elétrica, manutenção e lucro comercial — resultando em custos finais elevados de processamento, que comprimem drasticamente o espaço para experimentação das pequenas e médias equipes inovadoras. O mercado exige urgentemente uma nova solução que combine vantagem de custo e capacidade de escalonamento elástico.

Em segundo lugar, os preços de locação de GPUs continuam a subir, e os custos elevados impedem a implementação de inovações por pequenas e médias empresas e desenvolvedores: embora modelos de código aberto (como Qwen, DeepSeek, etc.) tenham reduzido a barreira de entrada para a área de IA, a implantação e execução desses modelos ainda dependem de poder de inferência estável, acessível e facilmente acessível. No entanto, na realidade, os custos de locação de GPUs continuam aumentando; por exemplo, o preço por hora para a GPU H100 mais comum subiu de US$ 1,70 em outubro de 2025 para US$ 2,35 em março de 2026, um aumento de quase 40% em seis meses. Os custos elevados desencorajam muitos desenvolvedores individuais e pequenas e médias empresas com soluções de qualidade, colocando-os em uma situação de “ter modelo, mas sem poder computacional”, o que inibe severamente a vitalidade inovadora e o crescimento em escala da indústria de IA.

Em terceiro lugar, uma grande quantidade de recursos GPU ociosos em todo o mundo não está sendo utilizada de forma eficaz, resultando em um grave desequilíbrio entre oferta e demanda: em contraste marcante com a "escassez de poder de computação" no mercado, existe uma enorme quantidade de capacidade GPU de alto desempenho ociosa, dispersa em dispositivos pessoais, laboratórios universitários, pequenos data centers e instalações deixadas para trás pela transição de criptomoedas. Devido à falta de canais padronizados de acesso e motores de agendamento eficientes, esses recursos de computação não conseguem entrar no mercado principal de inferência, criando uma situação contraditória em que há "dificuldade em obter uma única GPU" na demanda e "capacidade de computação adormecida" na oferta. Existe um grande potencial de melhoria na utilização dos recursos, e o desequilíbrio entre oferta e demanda exige solução urgente.

Em resumo, o mercado atual de capacidade de inferência de IA enfrenta três problemas estruturais: por um lado, a oferta centralizada não consegue equilibrar custo e elasticidade; por outro, os aluguéis de capacidade de processamento continuam a subir, sufocando a inovação em IA; e, ainda, há uma grande quantidade de recursos GPU ociosos que permanecem inativos por longos períodos. Diante desses desafios setoriais, o BTTInferGrid, com base em tecnologia descentralizada, oferece uma nova solução para resolver o descompasso entre oferta e demanda de capacidade de processamento.

O BTTInferGrid visa conectar de forma descentralizada os recursos de GPU ociosos espalhados globalmente com uma grande quantidade de desenvolvedores de IA, rompendo fundamentalmente o monopólio e os gargalos da capacidade de processamento centralizada. Por um lado, a plataforma integra a capacidade de GPU ociosa dispersa, construindo uma infraestrutura de processamento aberta e compartilhada; por outro, estabelece canais de conexão entre oferta e demanda, eliminando as barreiras de entrada e os mecanismos ocultos de precificação do modelo centralizado tradicional. Ao mesmo tempo, com base nos mecanismos de incentivo e coordenação do DePIN, o BTT InferGrid é capaz de fornecer continuamente capacidade de inferência de alto custo-benefício, resolvendo desde a raiz os principais desafios de alto custo e escassez de capacidade de processamento, liberando verdadeiramente o desempenho e o valor comercial da inferência de grandes modelos.

BTTInferGrid: Construindo uma rede descentralizada de poder de computação voltada para cenários de inferência de IA, com três vantagens que redefinem o mecanismo de alocação de poder de computação

BTTInferGrid tem um posicionamento claro e específico, focado na construção de uma rede descentralizada de poder de computação voltada para cenários de inferência de IA, conectando a oferta global de GPU ociosa à demanda por serviços de inferência de IA, oferecendo um serviço global de poder de computação para IA com acesso aberto, resultados verificáveis e cobrança conforme o uso.

Especificamente, o BTTInferGrid, baseado no mecanismo de rede subjacente DePIN, alinha com precisão a oferta de capacidade de processamento à demanda explosiva por inferência de IA, proporcionando赋能 de valor em ambas as extremidades da oferta e da demanda:

· No lado da oferta de poder de computação, agregamos eficientemente recursos de GPU ociosos e fragmentados globalmente para construir uma base de poder de computação aberta e compartilhada. Ao mesmo tempo, utilizando os mecanismos de incentivo e agendamento inteligente do DePIN, abrimos um canal de renda de baixa barreira e sustentável para detentores de poder de computação, transformando verdadeiramente as "GPU ociosas" em "ativos líquidos"; além disso, garantimos estabilidade do poder de computação e expansão elástica, criando um serviço global de inferência de alto custo-benefício, alta escalabilidade e segurança confiável.

· Na demanda de poder de computação, voltado para desenvolvedores de IA globais, oferece um serviço de inferência global com fácil integração, resultados verificáveis na blockchain e cobrança por uso. Em comparação com os altos prêmios de preços dos fornecedores de nuvem centralizados, o BTTInferGrid possui vantagem de custo extrema e capacidade de escalabilidade elástica, ajudando equipes de inovação pequenas e médias e desenvolvedores independentes a reduzir os custos de teste e validação de produtos, concluindo eficientemente a validação e iteração de negócios, enquanto impulsiona reversamente o ecossistema de oferta de poder de computação.

Assim, o BTTInferGrid resolve efetivamente a urgente necessidade de desenvolvedores de IA por poder de computação de baixo custo e alta elasticidade na fase de "competição de aplicações", além de abrir um canal sustentável para a monetização de vastos recursos de hardware ociosos em todo o mundo.

Mais importante ainda, a plataforma BTTInferGrid construirá com sucesso um ciclo de crescimento positivo autossustentável: nós GPU ociosos continuarão a se expandir, reduzindo continuamente o custo da capacidade de inferência e atraindo mais desenvolvedores para a plataforma; a demanda de mercado aumentará constantemente, incentivando ainda mais fornecedores globais de capacidade computacional a se juntarem ao ecossistema. A BTTInferGrid reestrutura a oferta de capacidade computacional por meio de um modelo descentralizado, transformando a capacidade AI especializada, escassa e cara, em uma nova infraestrutura pública AI acessível e sob demanda.

Em termos de vantagens de desempenho do produto, a maioria das plataformas descentralizadas de GPU no mercado atual enfrenta problemas como alto limiar de acesso à capacidade de processamento, baixa confiabilidade dos serviços e modelos econômicos insustentáveis a longo prazo. O BTTInferGrid, por sua vez, otimiza desde a arquitetura de base, alcançando avanços abrangentes em três dimensões: agregação de capacidade de processamento, verificação de serviços e sustentabilidade do sistema econômico, formando assim uma competitividade central única, com as seguintes vantagens específicas:

1. Rede de fornecimento de poder de computação de acesso aberto, reunindo rapidamente recursos GPU ociosos globais: os umbrais de entrada para poder de computação em nuvem tradicional são altos (exigindo data centers regulamentados, IP público fixo, switches caros etc.), enquanto o BTTInferGrid constrói uma rede verdadeiramente aberta de fornecimento de poder de computação, permitindo que qualquer entidade ou indivíduo com recursos ociosos de GPU ou outros recursos de computação se conecte seamlessmente, desde que atenda aos parâmetros básicos de desempenho (como capacidade de memória VRAM e desempenho de referência) e requisitos de estabilidade de rede. Esse design reduz drasticamente o umbra de entrada para o lado da oferta de recursos de computação, permitindo que o poder de computação GPU ocioso global seja reunido em rede e em matriz com velocidade extremamente alta.

2. Qualidade de serviço verificável e comportamento de nós: resolvendo o desafio da confiança descentralizada — o maior ponto dor do cálculo descentralizado é a confiabilidade — como impedir que mineradores usem placas de vídeo de baixo desempenho para se passar por placas de alto desempenho? Como garantir que os resultados de inferência sejam autênticos e confiáveis? O BTTInferGrid constrói um ciclo fechado de validação cruzada por meio de agendamento de tarefas (distribuição inteligente), verificação desafiadora (amostragem criptográfica), pontuação de consenso (reputação dinâmica) e coordenação na cadeia (contratos inteligentes com recompensas e punições), aumentando efetivamente a confiabilidade dos serviços de inferência.

3. Modelo econômico impulsionado pela demanda, construindo um ecossistema sustentável: Projetos iniciais de DePIN frequentemente caem em um espiral de morte — onde a emissão elevada de tokens atrai nós para mineração cega, mas, por falta de demanda real, levam à inflação de tokens, queda de preço e saída dos nós. O BTTInferGrid estabeleceu desde o início a meta de criar um ecossistema econômico impulsionado por demanda real — utilizando chamadas reais de inferência e desempenho dos nós como base central para incentivos. Apenas quando desenvolvedores de IA pagarem realmente para chamar modelos, os provedores de capacidade de processamento receberão sua parte principal dos rendimentos e bônus de reputação. Este design promoverá fortemente o crescimento equilibrado entre a oferta e a demanda de mercado, garantindo o desenvolvimento saudável e sustentável a longo prazo da rede.

Em resumo, da grade de oferta aberta que permite a integração perfeita de GPUs ociosas em qualquer parte do mundo que atendam aos padrões de desempenho, até a linha de defesa de confiança totalmente verificável construída por quatro ciclos fechados — agendamento de tarefas, verificação de desafios, pontuação de consenso e recompensas/punições na cadeia — e, finalmente, ao abandono completo das bolhas especulativas, ancorando o modelo econômico impulsionado por demanda real em chamadas de inferência de IA, o BTTInferGrid está redefinindo o mecanismo de alocação de recursos de computação em três dimensões: agregação de recursos, confiabilidade de serviços e distribuição de valor.

BTTInferGrid construirá gradualmente um novo ecossistema de poder de computação impulsionado por demandas reais

BTTInferGrid não é simplesmente uma "agregação de poder de computação", mas sim uma rede de computação descentralizada sofisticada que integra agendamento e execução de tarefas de inferência de IA, correspondência e conexão inteligente de oferta e demanda de poder de computação, coordenação e liquidação de recursos na cadeia, entre outras funcionalidades.

No ecossistema descentralizado de poder de computação do BTTInferGrid, todos os participantes formam três papéis centrais em torno da “oferta, uso e validação” do poder de computação:

Fornecedores de poder de processamento (mineiros): fornecem recursos GPU ociosos para receber e executar tarefas de inferência de IA. O sistema atribui automaticamente recompensas correspondentes com base no trabalho real verificado, na qualidade da conclusão das tarefas e na pontuação dinâmica de desempenho.

· Demand side de poder de processamento (desenvolvedores de IA): O BTTInferGrid oferece uma interface API padrão e unificada, permitindo que desenvolvedores acessem recursos GPU distribuídos globalmente.

· Guardiões da Rede (validadores): Participam do sistema descentralizado de validação e avaliação, auditando e desafiando aleatoriamente o desempenho computacional dos nós mineradores, identificando comportamentos anômalos e mantendo a qualidade do serviço da rede. Ao mesmo tempo, os validadores recebem recompensas por manter a integridade da rede, garantindo coletivamente a justiça e a confiabilidade da rede.

Em resumo, para desenvolvedores de IA, o BTTInferGrid oferece serviços de inferência de IA mais rentáveis, altamente escaláveis e seguros, aliviando eficazmente interrupções de produto e perda de clientes causadas pela falta de capacidade de processamento. Para fornecedores de GPU, ativa recursos de hardware marginais e ociosos em todo o mundo, criando um canal sustentável de receita para fornecedores de recursos de GPU, garantindo que cada unidade de poder de processamento desempenhe seu valor adequado na era da inferência.

Na implementação de produtos específicos, diferentemente do modelo de ativos pesados das tradicionais empresas de nuvem centralizada, que “acumulam hardware primeiro e aguardam a demanda”, o DePIN enfrenta naturalmente desafios de coordenação bilateral desde o início: excesso de oferta leva à ociosidade dos nós e ao colapso da economia de tokens, enquanto oferta insuficiente prejudica a experiência dos desenvolvedores e a eficiência do sistema. Para isso, o BTTInferGrid adotou uma estratégia de lançamento em fases clara, sólida e orientada pela demanda, rejeitando o crescimento desordenado e descontrolado, e priorizando a utilização de recursos, a sustentabilidade econômica e a expansão estável da arquitetura técnica.

· Objetivo de curto prazo (2026): Iniciar a rede a frio, concluir a integração dos nós centrais de base e a validação dos serviços de inferência distribuída, expandindo gradualmente a escala dos nós GPU.

· Objetivo de médio prazo (2027): Diversificação do ecossistema, aprimoramento da estabilidade e da segurança de privacidade dos serviços de rede, além de compatibilidade com mais formatos de modelos e frameworks de inferência, expandindo gradualmente para aplicações como fine-tuning de modelos.

· Objetivo de longo prazo (2028 e além): tornar-se a infraestrutura básica nativa de IA, construindo a camada de poder de computação preferida para agentes de IA e aplicações automatizadas, fornecendo suporte de poder de computação elástico para aplicações de IA em grande escala, e finalmente permitindo que o poder de computação, o armazenamento distribuído e os contratos inteligentes na cadeia operem em sinergia dentro de uma arquitetura unificada.

Na implementação prática, o BTTInferGrid também adota uma estratégia de evolução em fases. No início da operação, a rede será composta principalmente por placas de vídeo profissionais, com acesso de fornecedores de capacidade de cálculo (mineiros) sujeito a aprovação, enquanto os usuários do lado da demanda poderão utilizar serviços de inferência pela plataforma. Futuramente, ele evoluirá para uma grade de supercomputação totalmente aberta: suportará diversos tipos de GPU, incluindo níveis consumidor, profissional e de data center, com acesso e precificação baseados em desempenho; os mineiros terão acesso aberto, com a introdução de um mecanismo de staking para garantir a qualidade do serviço; do lado da demanda, será disponibilizada uma API unificada, compatível com múltiplos formatos de modelos de IA e frameworks de inferência, oferecendo opções de implantação flexíveis.

Atualmente, o BTTInferGrid já foi integrado com várias principais modelos de linguagem grandes de código aberto, incluindo o Qwen3.6 27B e o Qwen2.5 7B Instruct da série Qwen da Alibaba Cloud, bem como o Llama 3.1 8B Instruct da Meta. Desenvolvedores de IA podem invocar os modelos de forma flexível conforme as necessidades de seus cenários de negócios. Futuramente, a plataforma continuará expandindo seu ecossistema de modelos, oferecendo suporte a mais modelos avançados para desenvolvedores.

Mais importante ainda, o BTTInferGrid conta com um sólido suporte baseado no longo histórico do BitTorrent e do BTFS, possuindo vantagens de desenvolvimento naturais. O BitTorrent e seu BTFS vêm atuando há anos no campo do armazenamento descentralizado, com o BitTorrent alcançando mais de 100 milhões de usuários ativos e 2 bilhões de instalações, validando com sucesso a viabilidade do modelo DePIN e acumulando capacidades maduras em integração de recursos, incentivos por tokens, liquidação na cadeia e operação de comunidade. Como produto estratégico do BitTorrent para a área de IA, o BTTInferGrid foi aprimorado a partir dos serviços existentes do BTFS, permitindo a migração perfeita dessas experiências maduras para o campo de poder de computação para inferência de IA, acelerando rapidamente o crescimento do ecossistema.

Baseado em tecnologia descentralizada, o BTTInferGrid resolve com precisão o dilema industrial de coexistência entre capacidade de processamento ociosa e escassez de capacidade de processamento. Seus princípios de acesso aberto, colaboração descentralizada, contribuição verificável e construção comunitária não apenas representam uma poderosa ruptura contra o monopólio centralizado de capacidade de processamento, mas também desenham, por meio de uma definição clara de produto e uma base técnica sólida, um novo e imaginativo panorama global descentralizado de capacidade de processamento. Aqui, cada unidade de capacidade ociosa será ativada, e cada desenvolvedor poderá acessar o futuro inteligente com custos acessíveis.