Revendedores de tokens na era da IA geram milhões em receita mensal

iconMetaEra
Compartilhar
AI summary iconResumo
O intermediário de tokens é um produto especial da era da IA, atuando como camada intermediária entre usuários e grandes modelos, agregando a chamada de cerca de 20 grandes modelos nacionais e internacionais, como ChatGPT e Claude, ajudando os usuários a contornar restrições regionais e utilizar serviços de IA a preços inferiores aos oficiais.

Autor do artigo: Zhan Fangge

Fonte: Baobian

Revenda de “moedas digitais” na era da IA: Estação de transferência de tokens em disparada, mas destinada a ser de curta duração?

Quando você pede a um AI para escrever um relatório semanal, o "grande modelo" por trás recebe sua solicitação, responde às suas informações e compreende o contexto, tudo isso é dividido em unidades de cálculo individuais, chamadas Token, traduzidas para o chinês como "termos".

Cada interação das pessoas com a IA é cobrada e calculada em Token. Como a "moeda fiduciária" da era da IA, o fluxo de Token também alterou a narrativa da distribuição de riqueza.

Alguém não produz tokens, apenas os transporta, atuando como intermediário e lucrando com a diferença. Esse negócio é o centro de transferência de tokens.

Algumas empresas que alcançam um volume mensal de dezenas de milhões podem ter apenas menos de 20 pessoas na equipe. “Enquanto alguns setores tradicionais ainda pensam em como gerar lucro e cortar despesas, eles pensam todos os dias em como evadir impostos.” Assim descreveu um recém-chegado ao setor, administrador de um hub de transferência de tokens.

Inicialmente, as estações de transbordo de tokens existiam principalmente para contornar as restrições regionais de grandes modelos externos, integrando-os de diversas maneiras ao mercado interno para uso pelos usuários locais. No entanto, com o desenvolvimento desse negócio, muitas estações de transbordo também estão “exportando” grandes modelos internos eficazes para atender ao mercado externo.

Atrás do hub de tokens, não há apenas mitos de enriquecimento, mas também uma história sobre a demanda que precede as regras.

01 Negócio no centro das atenções

Como entender o hub de tokens?

Por exemplo, para assistir a certos programas de variedades ou filmes, você pode precisar assinar assinaturas em diferentes plataformas, como Tencent, iQiyi, Youku e Bilibili. Assinar todas elas resulta em baixa utilização real e é muito desperdício de dinheiro — nesse momento, você certamente desejará uma plataforma de compartilhamento de assinaturas de vídeo, onde, pagando apenas uma assinatura, você poderá acessar livremente todos esses recursos.

O Token Midway realiza exatamente esse tipo de trabalho de "agregação de grandes modelos", e também utiliza várias estratégias para obter tokens de diversos grandes modelos a baixo custo, permitindo que os usuários utilizem ChatGPT, Claude, Gemini e outros, tanto nacionais quanto internacionais com restrições regionais, gastando menos.

“Se o seu uso de tokens for baixo, os custos gerados pelo uso de um intermediário serão menores — e até muito menores — do que assinar diretamente uma conta”, disse um administrador de intermediário ao Bao Bian. Alguns usuários não utilizam intermediários apenas para contornar restrições geográficas impostas pelas empresas de modelos grandes, mas também porque esse método é mais barato e permite experimentar diversos modelos grandes.

Na interface da estação de transferência de tokens, é possível invocar até cerca de 20 modelos grandes; modelos diferentes possuem diferentes métodos de cobrança e taxas relativas. Os mais baratos permitem adquirir milhões de tokens por apenas alguns reais; em comparação, assinar o ChatGPT Plus custa 20 dólares por mês.

A baixa barreira técnica e as práticas cinzentas constantes na cadeia de suprimentos fizeram com que cada vez mais pessoas tentassem entrar nesse setor para ganhar uma fatia, fazendo o preço do token cair.

Anteriormente, o 21st Century Business Herald relatou que o preço de saída da API oficial do Claude-Opus-4-6 é de aproximadamente 170 yuan por milhão de tokens; algum intermediário nacional já reduziu o preço à metade do valor oficial, e sites menores conseguem oferecer entre 20% e 30%.

Na verdade, o negócio do Token Hub remonta a 2024 ou antes. “Em 2023, já havia pessoas desmontando o modelo do ChatGPT 3.5. O lançamento do Claude 3.5 marcou uma salto qualitativo no nível de vibe coding (programação em linguagem natural), e desde então, os programadores já tinham uma grande demanda por Tokens.”, disse o blogueiro de conteúdo sobre IA, McDonald, à Bao Bian.

Atualmente, a tecnologia de IA está se tornando cada vez mais presente no cotidiano e no trabalho, revolucionando diversos setores, e a demanda por tokens continua a aumentar drasticamente.

Anteriormente, a CCTV relatou que, no início de 2025, o volume diário médio de chamadas de tokens no país era de apenas 7 trilhões, aumentando para 30 trilhões no meio do ano e ultrapassando a marca de 100 trilhões até o final de 2025. No início de 2026, o volume diário médio de chamadas de tokens já chegou a 140 trilhões.

Isso ainda é apenas o volume de chamadas conforme declarado oficialmente; se somarmos a demanda por chamadas de modelos no exterior, o consumo de tokens será ainda maior. Assim, nos dias de hoje, em que até estudantes universitários que revisam trabalhos acadêmicos querem usar modelos de ponta, centrais de tokens surgiram como cogumelos após a chuva.

Surpreendentemente, a barreira técnica para o próprio Token Relay não é alta. Ma indica que o vibe coding reduziu significativamente a barreira para a construção do relay; os administradores precisam apenas ter um conhecimento básico de tecnologia para implantar o site.

“Agora existem dois conjuntos claros de soluções de código aberto disponíveis: um chamado sub2 API e outro chamado New API,” disse McDonald. “Você só precisa comprar um servidor e dizer a ele: ‘Este projeto é bom, me ajude a implantá-lo em qual servidor.’ O AI pode fazer isso por você.”

Com o exemplo da Nova API, trata-se de uma solução completa que integra conversão de protocolo, gerenciamento de canais, cobrança e administração de back-end de usuários, que pode ser chamada livremente pelos usuários.

A barreira técnica não é alta, mas o negócio de intermediário de tokens é atraente e perigoso.

02 Corrente cinza

Para se tornar um ponto de transbordo de tokens, é necessário investir na parte superior da cadeia de valor, ou seja, “como chamar modelos externos grandes com custos mais baixos”.

O modelo tradicional é o padrão atacado/varejo de tokens. Geralmente, as plataformas principais oferecem pacotes de assinatura para desenvolvedores (Coding Plan), que normalmente incluem um número fixo de chamadas gratuitas, com preços escalonados para uso além desse limite. O intermediário pode comprar em grande quantidade vários pacotes Coding Plan, consolidar os créditos em um pool de contas e revendê-los a um preço ligeiramente inferior ao da API oficial.

Por exemplo, a API oficial vende a 1 yuan por 10 mil tokens; o custo alocado pelo Coding Plan é de apenas 0,2 yuan por 10 mil tokens, e o preço de revenda do intermediário é de 0,5 yuan, com margem bruta de 60%.

Este método tem forte conformidade regulatória, mas depende de alto volume para gerar lucro.

O chefe da estação de transbordo mencionada disse ao "Bao Bian" que por volta de 2024, as fabricantes estrangeiras de grandes modelos ainda estavam na fase de expansão do mercado e ofereciam gratuitamente quotas de uso de grandes modelos a algumas pequenas startups de produtos de IA, com o objetivo de garantir que seus produtos futuros na camada de aplicação continuassem a colaborar com as fabricantes de grandes modelos.

“Então, há um grupo de pessoas que, sob o pretexto de empreendedorismo em IA, registram em massa esse tipo de startup em alguma cidade dos Estados Unidos, apenas para obter os créditos gratuitos desses fornecedores e, em seguida, usar algumas técnicas para transferi-los gratuitamente para dentro do país,” disse o administrador do ponto de transbordo. Isso pode ser a forma inicial dos pontos de transbordo de tokens no país e também uma das maneiras mais econômicas de acessar grandes modelos externos.

O modelo de negócios do intermediário de tokens tem operado até hoje, com práticas cinzentas surgindo em abundância, sendo a mais típica o "inverso".

Por exemplo, softwares como Windsurf e Cursor têm permissão integrada para chamar grandes modelos como o Claude, e alguns intermediários realizam engenharia reversa para conectar grandes modelos aos seus próprios intermediários, disponibilizando-os aos usuários. “É como roubar água e eletricidade: conectar um tubo próprio à rede pública para usar água e eletricidade legais gratuitamente”, afirmou o administrador do intermediário acima.

Além disso, devido aos planos de assinatura pessoal lançados por empresas como GPT e Claude, alguns intermediários adquirem em grande quantidade contas de assinatura pessoal e, por meio de engenharia reversa, dividem a capacidade de chamada dessas contas para vendê-las a mais usuários.

Nesse processo, a obtenção de lotes de números pode estar fortemente relacionada a indústrias cinzentas, como o uso fraudulento de cartões de crédito e Apple ID. Além disso, o redirecionamento pode levar à limitação de contas e deteriorar a experiência do usuário.

Para os usuários, embora o ponto de transferência de tokens pareça conveniente e econômico, os riscos envolvidos podem ser bastante altos. Por exemplo, os usuários geralmente carregam fundos e são insensíveis ao consumo de tokens; o ponto de transferência pode secretamente cobrar taxas mais altas do que as acordadas. No entanto, Xiao Zhang, um profissional da indústria de IA, disse à "Bao Bian" que, se os usuários quiserem verificar, é fácil perceber essas práticas; portanto, apenas pontos de transferência que não se importam com sua reputação agem dessa forma.

Além disso, “vender carne de cachorro sob o rótulo de carne de cordeiro” também é bastante comum: “substituir um bom modelo por um modelo barato é chamado de diluição”, disse McDonald. O maior risco vem dos dados. McDonald afirmou que (inversão) é uma técnica que transfere as perguntas enviadas pelos usuários para grandes modelos e, em seguida, intercepta as respostas desses grandes modelos para enviá-las de volta aos usuários.

Durante todo o processo, os dados do usuário não apenas permanecem totalmente sob o controle do ponto de transbordo, mas também circulam na página web, abrindo espaço para hackers.

Xiao Zhang afirmou que a maioria dos pontos de transferência marcará se é "reverso" após poder chamar modelos grandes. Mas mesmo que seja marcado como "claude-officially", se realmente se trata de um serviço de API fornecido oficialmente pela fabricante do modelo grande depende principalmente da consciência do administrador do site.

Anteriormente, o 21st Century Business Herald relatou que muitos administradores de pontos de transbordo foram questionados se poderiam vender números de usuários, e também revelou que várias grandes empresas do setor utilizam a compra de dados para treinar modelos.

Como profissional de IA, Xiao Zhang conhece esses riscos; ele usa a estação de transbordo apenas para uma pequena parte de seu trabalho, como modificar código ou documentos, e não revela dados ou senhas sensíveis. O restante de seu trabalho é realizado usando o grande modelo nacional fornecido pela empresa.

But for the vast majority of users in other industries, being aware of data risks themselves may already be a barrier.

03 Divergência do setor

Por um lado, esse negócio que há muito tempo opera na zona cinza já foi rotulado como de alto risco: em maio de 2026, um administrador de uma estação intermediária de IA no país foi detido criminalmente por 37 dias pela polícia por coletar e revender ilegalmente recursos de interfaces de IA a preços baixos.

Por outro lado, também em maio, a entrada sequencial de duas figuras de alto perfil trouxe o intermediário de tokens para o centro das atenções.

Em 1º de maio, o conhecido jogador do mundo das criptomoedas, Sun Zhen, anunciou oficialmente em redes sociais seu "maior estação de transferência de IA da história" — B.AI, enfatizando login em blockchain, pagamento totalmente anônimo, imutabilidade zero e os preços mais baixos da rede. No entanto, o B.AI exige pagamento em criptomoedas e intencionalmente contorna os processos de verificação de identidade, atraindo diversas questões de conformidade.

No mesmo dia, Fu Sheng, presidente e CEO da Cheetah Mobile, também anunciou oficialmente o lançamento do EasyRouter. Em seguida, a empresa publicou um comunicado em seu site oficial afirmando que não oferece serviços no território nacional e suporta reembolsos; a descrição de Fu Sheng sobre o EasyRouter passou de “ponto de transbordo” para “gateway de modelo empresarial/camada de roteamento”.

O site oficial indica que sua fonte de API é “aquisição direta de provedores de nuvem e plataformas de IA. Baseado em fornecedores de nuvem e plataformas de IA de primeiro nível, oferece serviço de distribuição de poder de computação de IA conforme regulamentação, estável e com certificação rastreável.”

Em outras palavras, o EasyRouter afirma que suas fontes de fornecimento upstream são totalmente regulares e não venderam seus produtos a usuários de outras regiões contra a vontade das empresas estrangeiras de modelos de grande porte.

Atualmente, os fornecedores de modelos de grande porte estão enfrentando regulamentações cada vez mais rigorosas. Em 12 de junho de 2026, localmente, a Anthropic anunciou que recebeu uma ordem do governo dos Estados Unidos e foi obrigada a impor restrições de acesso total aos seus dois modelos de IA mais avançados, Fable 5 e Mythos 5, abrangendo todas as instituições e indivíduos fora dos Estados Unidos.

Em um momento em que a conformidade está se tornando cada vez mais rigorosa, empresas nacionais, como a EasyRouter, também começam a tentar explorar a regularização desse negócio.

Na verdade, o negócio de tokens regulamentados não é complicado. Em 2023, a OpenRouter foi criada nos Estados Unidos como uma plataforma agregadora de vários fornecedores de grandes modelos, que aproveitam seu alto volume de chamadas de tokens para obter preços mais vantajosos da plataforma e revendê-los aos usuários. Em termos simples, trata-se de atacado e varejo de tokens.

Além de atuar como “atacadista”, há negócios B2B totalmente viáveis com menor risco de conformidade. O administrador da estação de transbordo mencionada disse ao “Bao Bian” que não lucra com o negócio de estação de transbordo B2C, mas sim com o serviço de ajudar outras pessoas a implantar estações de transbordo. Por exemplo, muitos empresários desejam que seus funcionários tenham acesso a modelos de IA melhores e estão dispostos a pagar para implantar uma estação de transbordo sem fins lucrativos dentro de suas empresas.

Alguém também está tentando oferecer serviços auxiliares para estações de transbordo, como serviços de gestão financeira, incluindo cobrança padronizada em criptomoedas e conciliação inteligente. Uma pessoa envolvida nesse tipo de negócio informou ao "Bao Bian" que, embora pequenas e médias estações de transbordo de tokens no país não tenham muita necessidade de liquidação em criptomoedas, muitas grandes estações de transbordo de tokens no exterior apresentam essa demanda. Segundo os padrões da indústria, a taxa de comissão fica em torno de 1%.

Ele também afirmou que esses grandes centros de transferência de tokens não se limitam a conectar modelos externos ao mercado interno, mas também atuam na exportação de modelos locais. “DeepSeek, DouBao e alguns modelos da Alibaba têm a principal vantagem de serem baratos; não os vendem aos EUA, mas para outros lugares, têm uma vantagem absoluta.”

Assim, o hub de tokens também se tornou uma fatia honesta na correnteza da IA, registrando fielmente como as necessidades reais fluem e mudam de direção.

“O próprio código não tem valor nesta era,” disse Xiao Zhang.

Da mesma forma, o que realmente determina até onde esse negócio de intermediário de tokens pode ir também não está escondido no código. Durante a fase de crescimento selvagem da indústria, quem controla a fonte de fornecimento domina o mercado; mas, à medida que os fabricantes upstream intensificam a repressão às operações ilegais, o espaço de lucro sustentado por pools de assinaturas reversas e fontes de cartões pretos inevitavelmente se tornará cada vez mais restrito.

Em última análise, o surgimento do intermediário de tokens provavelmente visa apenas preencher uma lacuna de mercado durante este período especial, sendo um produto transitório da onda de IA. Se um dia as barreiras tecnológicas da IA forem derrubadas, talvez seja o momento em que os intermediários começarem a desaparecer.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.