El centro de transferencia de tokens es un producto especial de la era de la IA, que actúa como capa intermedia entre los usuarios y los modelos grandes, aggregando el acceso a cerca de 20 modelos grandes nacionales e internacionales como ChatGPT y Claude, ayudando a los usuarios a evitar restricciones geográficas y utilizar servicios de IA a precios inferiores a los oficiales.Autor del artículo: Zhan Fangge
Fuente: Baobian
Revender “criptodivisas” de la era de la IA: Las estaciones de transferencia de tokens corren a toda velocidad, ¿pero están destinadas a ser efímeras?
Cuando le pides a una IA que escriba un informe semanal, el "modelo grande" detrás recibe tu solicitud, responde tu mensaje y comprende el contexto, todo lo cual se descompone en unidades de cálculo individuales, llamadas Token, que en chino se traducen como "词元".
Cada interacción de las personas con la IA se calcula y cobra en Token. Como la "moneda de curso legal" de la era de la IA, el flujo de Token ha transformado la narrativa sobre la distribución de la riqueza.
Algunas personas no producen tokens, solo los transportan, actuando como intermediarios y ganando diferencias de precio, logrando grandes beneficios. Este negocio es una estación de transferencia de tokens.
Algunas empresas que logran un volumen mensual de decenas de millones podrían tener menos de 20 personas en su equipo. “Mientras algunas industrias tradicionales aún piensan en cómo generar ganancias y reducir gastos, ellos solo piensan cada día en cómo evadir impuestos,” describió un recién llegado como administrador de un nodo de intermediación de tokens.
Inicialmente, las estaciones de transferencia de tokens existían principalmente para superar las restricciones geográficas de los grandes modelos extranjeros, utilizando diversos métodos para conectar estos modelos extranjeros con el mercado interno y permitir su uso por parte de usuarios locales. Sin embargo, con el tiempo, muchos de estos intermediarios también han comenzado a “exportar” grandes modelos locales eficaces para servir al mercado internacional.
Detrás del intermediario de tokens, no solo hay mitos de enriquecimiento, sino también una historia sobre la demanda que va antes que las reglas.
01 Negocio en la ola del momento
¿Cómo se entiende el centro de transferencia de tokens?
Por ejemplo, para ver ciertos programas de variedades o películas, es posible que necesites suscribirte a diferentes plataformas como Tencent, iQiyi, Youku, Bilibili, etc. Si te suscribes a todas, la tasa de uso real será baja y será un gasto innecesario; en ese momento, seguramente desearías tener una plataforma de suscripción compartida de videos, donde solo necesites pagar una suscripción para acceder libremente a todos estos recursos.
El centro de transferencia de tokens se encarga precisamente de este tipo de "agregación de modelos grandes", y también utiliza diversas formas para obtener tokens de los principales modelos a bajo costo, permitiendo a los usuarios utilizar ChatGPT, Claude, Gemini y otros, tanto nacionales como internacionales con restricciones regionales, con menos gastos.
“Si tu uso de tokens no es tan alto, los costos generados por usar una estación de transbordo serán más bajos que suscribirte directamente a una cuenta, e incluso mucho más bajos,” dijo un administrador de estación de transbordo a “Bao Bian”. Algunos usuarios no solo usan estaciones de transbordo para eludir las restricciones geográficas impuestas por los fabricantes de modelos grandes, sino también porque este método es relativamente más económico y les permite probar una mayor variedad de modelos grandes.
En la interfaz del intermediario de tokens, se pueden invocar hasta cerca de 20 modelos grandes; cada modelo tiene diferentes métodos de facturación y tarifas relativas. Algunos son tan económicos que se pueden comprar millones de tokens por solo unos pocos yuanes; en comparación, suscribirse a ChatGPT Plus cuesta 20 dólares mensuales.
La baja barrera técnica y las numerosas prácticas grises en la cadena de suministro han llevado a cada vez más personas a intentar entrar en este sector para obtener una parte del pastel, lo que ha hecho caer el precio del token.
Previamente, 21st Century Business Herald informó que el precio de salida de la API oficial de Claude-Opus-4-6 es de aproximadamente 170 yuanes por millón de tokens; algún intermediario nacional ya ha reducido el precio a la mitad del precio oficial, y algunos sitios más pequeños pueden ofrecerlo a un 20% o 30%.
De hecho, el negocio de la estación de transferencia de tokens se remonta a 2024 o incluso antes. "En 2023, ya había personas descomponiendo el modelo de ChatGPT 3.5. El lanzamiento de Claude 3.5 marcó un salto cualitativo en el nivel de vibe coding (programación en lenguaje natural), y desde entonces, los programadores han tenido una gran demanda de tokens", dijo el bloguero de pago por conocimiento de IA, McDonald, a Bao Bian.
Actualmente, la tecnología de IA se está integrando cada vez más en la vida diaria y el trabajo, transformando diversas industrias, y la demanda de tokens sigue aumentando constantemente.
Anteriormente, CCTV informó que a principios de 2025, el volumen diario promedio de llamadas a tokens en el país era de solo 7 billones, aumentando a 30 billones a mediados de año, y superando los 100 billones al final de 2025. A principios de 2026, el volumen diario promedio de llamadas a tokens ya había alcanzado los 140 billones.
Esto solo es el volumen de solicitudes según la versión oficial; si se suma la demanda de llamadas a modelos extranjeros, el consumo de tokens será aún mayor. Por lo tanto, en la actualidad, donde incluso los estudiantes universitarios que revisan sus tesis quieren usar modelos de élite, las estaciones de intermediación de tokens han surgido como hongos tras la lluvia.
Curiosamente, la barrera técnica para el propio token relay no es alta. Mac dijo que el vibe coding redujo significativamente la barrera para establecer un relay; los administradores solo necesitan tener un conocimiento básico de tecnología para implementar el sitio.
“Actualmente hay dos conjuntos claros de soluciones de código abierto disponibles: una se llama sub2 API y la otra New API,” dijo McDonald. “Solo necesitas comprar un servidor y decirle: ‘Este proyecto es bueno, ayúdame a desplegarlo en qué servidor’, y la IA lo hará por ti.”
Por ejemplo, con la nueva API, se trata de una solución completa que integra conversión de protocolos, gestión de canales, facturación y administración del panel de usuario, que los usuarios pueden invocar libremente.
La barrera técnica no es alta, pero el negocio de los intermediarios de tokens es atractivo y peligroso.
02 cadena gris
Para convertirse en un centro de transferencia de tokens, se debe trabajar en la parte superior de la cadena de suministro, es decir, "cómo llamar a modelos externos grandes con costos más bajos".
El modelo habitual es el de venta al por mayor y al por menor de tokens. Por lo general, las plataformas principales ofrecen planes de suscripción para desarrolladores (Coding Plan), que suelen incluir un número fijo de llamadas gratuitas, con precios escalonados para el exceso. Los intermediarios pueden comprar por lotes múltiples planes Coding Plan, combinar los cupos en un solo grupo de cuentas y revenderlos a un precio ligeramente inferior al de la API oficial.
Por ejemplo, la API oficial vende a 1 yuan por 10.000 tokens; el costo asignado al Plan de Codificación es de solo 0,2 yuan por 10.000 tokens, y el precio de reventa en el intermediario es de 0,5 yuan, con un margen bruto del 60%.
Este método tiene un alto cumplimiento normativo, pero se debe depender del volumen para obtener ganancias.
El jefe de la estación de transbordo mencionada le dijo a "Bao Bian" que alrededor de 2024, los fabricantes extranjeros de modelos grandes aún estaban en la etapa de ampliar su mercado y ofrecían gratuitamente cuotas de uso de modelos grandes a algunas pequeñas empresas emergentes de productos de IA, con el objetivo de que sus productos futuros en la capa de aplicación mantuvieran una colaboración continua con los fabricantes de modelos grandes.
“Entonces, un grupo de personas, bajo el pretexto de emprender en IA, registra en masa este tipo de startups en alguna ciudad de Estados Unidos, con el único fin de obtener cuotas gratuitas de estos proveedores y luego utilizar ciertas técnicas para transferirlas sin costo a China”, indicó el administrador del centro de tránsito. Esto podría ser la forma inicial de los centros de tránsito de tokens en China, y también uno de los métodos más económicos para acceder a modelos grandes en el extranjero.
El modelo de negocio del intermediario de tokens ha evolucionado hasta hoy, con numerosas prácticas grises, la más típica siendo el "inverso".
Por ejemplo, software como Windsurf y Cursor incluyen permisos integrados para llamar a grandes modelos como Claude, y algunos intermediarios realizan ingeniería inversa para conectar los grandes modelos a sus propios intermediarios y ofrecerlos a los usuarios. “Es como robar agua y electricidad: conectar tu propia tubería a la red pública para usar agua y electricidad de fuentes legítimas sin pagar”, dijo el administrador del intermediario.
Además, debido a los planes de suscripción personal ofrecidos por empresas como GPT y Claude, algunos intermediarios adquieren en gran cantidad cuentas de suscripción personal y, mediante ingeniería inversa, dividen las capacidades de llamada de estas cuentas para venderlas a más usuarios.
Durante este proceso, la obtención de lotes de números puede estar relacionada con industrias grises como el fraude con tarjetas de crédito, Apple ID, etc. Además, el reenvío puede provocar limitaciones en la cuenta y empeorar la experiencia del usuario.
Para los usuarios, aunque la estación de transferencia de tokens parece conveniente y económica, los riesgos asociados pueden ser bastante altos. Por ejemplo, los usuarios suelen cargar fondos de forma recurrente y no son sensibles al consumo de tokens, por lo que la estación podría deducir secretamente tarifas más altas de las acordadas. Sin embargo, Xiao Zhang, un profesional de la industria de la inteligencia artificial, le dijo a "Bao Bian" que si los usuarios deciden investigar, es muy fácil detectar estas prácticas; por lo tanto, solo las estaciones que no se preocupan por su reputación recurren a esto.
Además, “vender perro como cordero” también es bastante común: “reemplazar un buen modelo con uno barato se llama inflar”, dijo McDonald. El mayor riesgo proviene de los datos. McDonald indicó que (inversión) es un método técnico que transmite las preguntas enviadas por los usuarios al modelo grande, luego captura la respuesta del modelo grande y la envía de vuelta al usuario.
Durante todo el proceso, los datos del usuario no solo están completamente bajo el control del punto de transbordo, sino que también circulan por la página web, brindando oportunidades a los hackers.
Xiao Zhang indicó que la mayoría de los puntos de transbordo marcarán si son "inversos" después de poder llamar a modelos grandes, pero incluso si se marca como "claude-officially", si realmente se trata de un servicio API proporcionado oficialmente por el fabricante del modelo grande depende principalmente de la conciencia del administrador del sitio.
Previamente, 21st Century Business Herald informó que a muchos administradores de estaciones de tránsito se les preguntó si podían vender números de usuarios, y también se reveló que varias grandes empresas del sector utilizan la compra de datos para entrenar modelos.
Como profesional de IA, Xiao Zhang conoce este tipo de riesgos; solo utiliza el punto de transbordo para una pequeña parte de su trabajo, como modificar código o documentos, y no revela datos ni contraseñas clave. El resto de su trabajo lo realiza utilizando el gran modelo nacional proporcionado por la empresa.
But for the vast majority of users in other industries, being aware of data risks themselves may already be a barrier.
03 Diferenciación de la industria
Por un lado, este negocio que ha operado durante mucho tiempo en una zona gris ya ha sido etiquetado como de alto riesgo; en mayo de 2026, un administrador de una estación de intermediación de IA en el país fue detenido criminalmente por 37 días por recopilar y vender ilegalmente recursos de interfaces de IA a bajo precio mediante ingeniería inversa.
Por otro lado, también en mayo, la entrada sucesiva de dos figuras de alto perfil llevó al token intermediary al centro de la escena.
El 1 de mayo, el conocido jugador del mundo de las criptomonedas, Sun Zhen, anunció en redes sociales su lanzamiento del "estación de transbordo de IA más poderosa de la historia", B.AI, destacando el inicio de sesión mediante blockchain, pagos completamente anónimos, inmutabilidad y los precios más bajos de la red. Sin embargo, B.AI requiere pagos en criptomonedas y deliberadamente evita los procesos de verificación de identidad, lo que ha generado numerosas preguntas sobre el cumplimiento normativo.
Ese mismo día, Fu Sheng, presidente y CEO de Cheetah Mobile, también anunció oficialmente el lanzamiento de EasyRouter. Pronto, la empresa publicó una declaración en su sitio web indicando que no ofrece servicios en el país y que admite reembolsos; la descripción de Fu Sheng sobre EasyRouter pasó de “estación de tránsito” a “puerta de enlace de modelo empresarial/capa de enrutamiento”.
La página web indica que su API proviene de "adquisición directa de proveedores de nube y plataformas de IA. Con base en los principales proveedores de nube y plataformas de IA, se ofrece un servicio de distribución de capacidad de cómputo de IA conforme, estable y con certificación rastreable."
En otras palabras, EasyRouter afirma que sus fuentes de suministro superiores son completamente legales y no han vendido ni transferido a usuarios de otras regiones contra la voluntad de las empresas extranjeras de modelos grandes.
Actualmente, los proveedores de modelos de gran escala están enfrentando regulaciones cada vez más estrictas. El 12 de junio de 2026, Anthropic anunció que, tras recibir una orden del gobierno estadounidense, se vio obligada a imponer restricciones de acceso totales a sus dos modelos de IA más avanzados, Fable 5 y Mythos 5, aplicables a todas las instituciones y personas fuera de Estados Unidos.
En un contexto en el que la regulación se vuelve cada vez más estricta, empresas nacionales como EasyRouter también comenzaron a explorar la合规ización de este negocio.
De hecho, el negocio de tokens regulados no es complicado. En 2023, OpenRouter se fundó en Estados Unidos como una plataforma de agregación de múltiples proveedores de modelos grandes, que aprovechan un volumen suficientemente alto de solicitudes de tokens para obtener precios más ventajosos de la plataforma y luego revenderlos a los usuarios. En términos sencillos, es un modelo de mayoreo a menorista de tokens.
Además de actuar como "mayorista", hay negocios B2B completamente viables con menor riesgo de cumplimiento. El jefe del punto de transbordo mencionado le dijo a "Bao Bian" que no gana dinero principalmente con el servicio de transbordo B2C, sino más bien con el negocio de ayudar a otros a implementar puntos de transbordo. Por ejemplo, muchos empresarios desean que sus empleados puedan acceder a modelos de IA de mejor calidad y están dispuestos a pagar para que se instale un punto de transbordo sin fines de lucro dentro de sus empresas.
Algunos también están intentando ofrecer servicios complementarios para las estaciones de transbordo, como servicios de gestión de fondos que incluyen facturación estandarizada de criptomonedas y conciliación inteligente. Una persona involucrada en este tipo de negocios le dijo a "Bao Bian" que, aunque las pequeñas y medianas estaciones de transbordo de tokens en China no suelen tener necesidades de liquidación de criptomonedas, muchas grandes estaciones de transbordo de tokens en el extranjero sí las tienen; según los estándares de la industria, la comisión suele estar alrededor del 1%.
También indicó que estos grandes nodos de tokens no solo se dedican a conectar modelos extranjeros de gran escala con el mercado nacional, sino que también se encargan de la exportación de modelos nacionales de gran escala. “DeepSeek, DouBao y algunos modelos del grupo Alibaba tienen la ventaja principal de ser económicos; no los venden a Estados Unidos, sino a otros lugares, lo que les otorga una ventaja absoluta.”
Así, el intermediario de tokens se convierte en una rebanada honesta en la ola de IA, registrando fielmente cómo fluyen y cambian las necesidades reales.
“El código en sí mismo no tiene mucho valor en esta era,” dijo Xiao Zhang.
Del mismo modo, lo que realmente determina hasta dónde puede llegar este negocio de intermediación de tokens no está oculto en el código. Durante la etapa de crecimiento salvaje de la industria, quien controla la fuente de suministro controla el mercado; pero cuando los fabricantes upstream intensifican cada vez más la lucha contra las operaciones ilegales, el margen de beneficio sostenido por pozos de suscripción inversa y fuentes de tarjetas negras inevitablemente se reducirá.
En última instancia, la aparición del intermediario de tokens probablemente solo buscó llenar un vacío de mercado durante este período especial, siendo un producto transitorio de la ola de IA. Si algún día se derrumban las barreras tecnológicas de la IA, tal vez sea el momento en que comience a desaparecer el intermediario.
