Token Transit adalah produk khas era AI, berfungsi sebagai lapisan perantara yang menghubungkan pengguna dengan model besar, dengan mengagregasi panggilan ke sekitar 20 model besar domestik dan internasional seperti ChatGPT dan Claude, membantu pengguna melewati pembatasan wilayah serta menggunakan layanan AI dengan harga lebih rendah dari harga resmi.Penulis artikel: Zhan Fangge
Sumber artikel: Baobian
Menjual ulang "mata uang digital" di era AI: Stasiun perantara Token berlari kencang, tapi pasti singkat umurnya?
Ketika Anda meminta AI untuk menulis laporan mingguan, "model besar" di belakangnya menerima permintaan Anda, merespons informasi Anda, dan memahami konteksnya—semuanya sebenarnya dipecah menjadi unit-unit komputasi, yang disebut Token, diterjemahkan ke dalam bahasa Indonesia sebagai "kata unit".
Setiap kali orang berinteraksi dengan AI, penggunaan dihitung berdasarkan Token dan dibayar berdasarkan Token. Sebagai "barang berharga" di era AI, pergerakan Token juga mengubah narasi distribusi kekayaan.
Ada orang yang tidak memproduksi Token, hanya bertindak sebagai pengangkut Token, menjadi perantara untuk menghasilkan keuntungan dari selisih harga, dan mendapatkan keuntungan besar. Bisnis ini adalah stasiun perantara Token.
Beberapa perusahaan yang mencapai volume transaksi bulanan hingga puluhan juta mungkin hanya memiliki tim kurang dari 20 orang. “Sementara beberapa industri tradisional masih memikirkan cara mendapatkan keuntungan dan menghemat biaya, mereka setiap hari hanya memikirkan cara menghindari pajak,” demikian seorang站长 pusat transaksi Token yang baru saja memasuki industri ini menjelaskan bisnis rekan-rekannya.
Awalnya, stasiun transit token sebagian besar ada untuk mengatasi pembatasan wilayah pada model besar luar negeri, dengan berbagai cara menghubungkan model besar luar negeri ke dalam negeri agar dapat digunakan oleh pengguna domestik. Namun, seiring perkembangan bisnis ini, banyak stasiun transit juga mulai "mengekspor" model besar domestik yang efektif untuk melayani pasar luar negeri.
Di belakang stasiun transmisi token, bukan hanya ada mitos penciptaan kekayaan, tetapi juga sebuah kisah tentang "kebutuhan yang berjalan lebih cepat daripada aturan".
01 Bisnis di puncak tren
Bagaimana memahami stasiun pengalihan token?
Sebagai contoh, untuk menonton acara varietas atau film tertentu, Anda mungkin perlu berlangganan berbagai platform seperti Tencent, iQiyi, Youku, Bilibili, dll. Jika Anda berlangganan semuanya, tingkat penggunaan sebenarnya akan rendah dan sangat boros uang. Pada saat seperti ini, Anda pasti menginginkan platform berbagi langganan video, di mana Anda hanya perlu membayar satu biaya langganan untuk dapat mengakses semua sumber daya tersebut secara bebas.
Token Middleman melakukan tugas semacam ini “menggabungkan model besar”, dan juga menggunakan berbagai cara untuk memanfaatkan token dari berbagai model besar dengan biaya rendah, sehingga pengguna dapat menggunakan ChatGPT, Claude, Gemini, dan lainnya yang ada di dalam negeri bahkan luar negeri dengan batasan wilayah dengan biaya lebih murah.
“Jika penggunaan token Anda tidak terlalu besar, biaya yang dihasilkan dari penggunaan stasiun perantara akan lebih rendah daripada berlangganan akun langsung, bahkan jauh lebih rendah,” kata seorang administrator stasiun perantara kepada Bao Bian. Beberapa pengguna tidak hanya menggunakan stasiun perantara untuk menghindari pembatasan geografis oleh penyedia model besar, tetapi juga karena cara ini lebih murah dan memungkinkan mereka mencoba lebih banyak model besar yang berbeda.
Di antarmuka pusat transmisi token, hingga hampir 20 model besar dapat dipanggil; setiap model berbeda, metode pembayarannya berbeda, dan tarif relatifnya juga berbeda. Yang lebih murah bahkan bisa membeli jutaan token hanya dengan beberapa yuan, dibandingkan dengan berlangganan ChatGPT Plus yang biayanya 20 dolar AS per bulan.
Rendahnya hambatan teknis dan berbagai praktik abu-abu di hulu membuat semakin banyak orang mencoba memasuki ranah ini untuk mendapatkan bagian, sehingga harga Token turun.
Sebelumnya, 21st Century Business Herald melaporkan bahwa harga output API resmi Claude-Opus-4-6 sekitar 170 yuan per juta token, dan beberapa stasiun perantara domestik telah menurunkan harga hingga setengah dari harga resmi, sementara situs-situs kecil dan menengah bahkan dapat menawarkan harga 20% hingga 30%.
Faktanya, bisnis token transit dapat ditelusuri kembali ke tahun 2024 atau bahkan lebih awal. "Pada tahun 2023, sudah ada orang yang memecah model ChatGPT 3.5. Peluncuran Claude 3.5 menandai lompatan kualitatif dalam tingkat vibe coding (pemrograman berbasis bahasa alami), sejak saat itu, para programmer telah memiliki permintaan token yang besar," kata pakar konten berbayar AI, McDonald, kepada Bao Bian.
Saat ini, teknologi AI semakin meresap dalam kehidupan sehari-hari dan pekerjaan, mengguncang berbagai industri, dan permintaan terhadap Token terus melonjak.
Sebelumnya, CCTV pernah melaporkan bahwa pada awal 2025, jumlah panggilan token harian domestik hanya 7 triliun, naik menjadi 30 triliun pada pertengahan tahun, dan pada akhir 2025 telah melewati angka 100 triliun. Pada awal 2026, jumlah panggilan token harian telah mencapai 140 triliun.
Ini baru merupakan volume panggilan menurut pernyataan resmi; jika ditambahkan permintaan panggilan model luar negeri, konsumsi Token akan jauh lebih besar. Maka, di era saat ini di mana mahasiswa bahkan ingin menggunakan model terbaik untuk mengoreksi tugas akhir mereka, stasiun perantara Token pun bermunculan seperti jamur setelah hujan.
Secara mengejutkan, hambatan teknis untuk stasiun transmisi token sendiri tidak terlalu tinggi. Ma mengatakan bahwa vibe coding sangat menurunkan hambatan untuk membangun stasiun transmisi, sehingga admin hanya perlu memahami sedikit teknologi untuk dapat melakukan penyebaran situs.
“Saat ini ada dua solusi open source yang jelas dapat dipanggil, satu disebut sub2 API, dan satu lagi disebut New API,” kata McDonald. “Kamu hanya perlu membeli satu server, lalu beri tahu server tersebut, proyek ini bagus, bantu saya deploy di server mana, dan AI akan melakukannya untuk Anda.”
Dengan contoh New API, ini adalah solusi lengkap yang menggabungkan konversi protokol, manajemen saluran, pembayaran, dan manajemen backend pengguna, yang dapat dipanggil oleh pengguna sesuai kebutuhan.
Tingkat teknisnya tidak tinggi, tetapi bisnis pusat perantara token sangat menarik sekaligus berisiko.
02 Rantai abu-abu
Untuk menjadi pusat transisi token, perlu berfokus pada hulu rantai pasokan, yaitu "bagaimana memanggil model besar luar negeri dengan biaya lebih rendah".
Pola umum adalah model grosir dan eceran Token. Biasanya, platform utama menyediakan paket langganan pengembang (Coding Plan), yang umumnya mencakup jumlah panggilan gratis tetap, dengan harga bertingkat untuk penggunaan di atas kuota tersebut. Stasiun perantara dapat membeli banyak paket Coding Plan secara massal, menggabungkan kuota ke dalam satu kumpulan akun, lalu menjualnya kembali dengan harga sedikit lebih rendah daripada harga API resmi.
Misalnya, API resmi menjual seharga 1 yuan per 10.000 token, biaya yang dialokasikan dari Coding Plan hanya 0,2 yuan per 10.000 token, dan harga jual perantara adalah 0,5 yuan, dengan margin kotor 60%.
Cara ini memiliki kepatuhan tinggi, tetapi memerlukan volume tinggi untuk mendapatkan keuntungan.
Kepala stasiun transit tersebut memberi tahu "Bao Bian" bahwa sekitar tahun 2024, produsen model besar luar negeri masih berada dalam tahap memperluas pasar dan memberikan kuota penggunaan gratis untuk model besar kepada beberapa perusahaan rintisan produk AI kecil, dengan tujuan agar produk mereka di lapisan aplikasi terus bekerja sama dengan produsen model besar di masa depan.
“Jadi, akan ada sekelompok orang yang mengatasnamakan startup AI, mendaftarkan perusahaan startup semacam ini secara massal di sebuah kota di Amerika Serikat, hanya untuk mendapatkan kuota gratis dari pabrikan tersebut, lalu menggunakan beberapa teknik teknis untuk mentransfernya secara gratis ke dalam negeri,” kata站长 stasiun transmisi tersebut. Ini mungkin merupakan bentuk awal dari stasiun transmisi Token di dalam negeri, sekaligus salah satu cara termurah untuk memanggil model besar luar negeri.
Hingga hari ini, model bisnis pusat transisi token telah menghasilkan berbagai praktik abu-abu, yang paling khas adalah "reverse".
Misalnya, perangkat lunak seperti Windsurf dan Cursor telah menyediakan akses pemanggilan model besar seperti Claude. Beberapa stasiun perantara melakukan reverse engineering untuk menghubungkan model besar ke stasiun perantara mereka sendiri, sehingga pengguna dapat menggunakannya. “Ini seperti mencuri air dan listrik—memasang pipa pribadi ke pipa umum untuk menggunakan air dan listrik dari saluran resmi secara gratis,” kata pemilik stasiun perantara tersebut.
Selain itu, karena perusahaan seperti GPT dan Claude meluncurkan paket langganan pribadi, beberapa perantara terlebih dahulu memperoleh sejumlah besar akun langganan pribadi, lalu melalui rekayasa terbalik, memisahkan kemampuan panggilan akun tersebut dan menjualnya kepada lebih banyak pengguna.
Dalam proses ini, perolehan sumber batch number sangat mungkin terkait dengan industri abu-abu seperti penyalahgunaan kartu kredit, Apple ID, dll. Selain itu, pembagian lalu lintas juga dapat menyebabkan pembatasan akun dan menurunkan pengalaman pengguna.
Bagi pengguna, meskipun stasiun transmisi token tampak nyaman dan hemat biaya, risiko yang terkandung di dalamnya juga bisa sangat tinggi. Misalnya, pengguna biasanya membayar di muka dan tidak peka terhadap konsumsi token, sehingga stasiun transmisi mungkin secara diam-diam memotong biaya yang lebih tinggi dari yang disepakati. Namun, Zhang, seorang profesional di industri AI, memberi tahu "Bao Bian" bahwa jika pengguna ingin memeriksa, sangat mudah untuk melihat tanda-tanda tersebut, sehingga hanya stasiun transmisi yang tidak peduli pada reputasi yang akan melakukan hal ini.
Selain itu, “menjual daging anjing dengan label daging domba” juga cukup umum, “mengganti model yang baik dengan model yang murah, ini disebut penambahan air.” kata Ma Dang. Risiko yang lebih besar berasal dari data. Ma Dang menyatakan bahwa (reverse) adalah melalui teknik teknis, mengirimkan pertanyaan yang dikirim pengguna ke model besar, lalu mengambil balasan dari model besar tersebut dan mengirimkannya kembali ke pengguna.
Selama proses ini, data pengguna tidak hanya sepenuhnya berada di bawah kendali stasiun transit, tetapi juga beredar di situs web, memberi peluang bagi peretas.
Xiao Zhang menyatakan bahwa sebagian besar stasiun transit akan menandai apakah itu "reverse" setelah dapat memanggil model besar. Namun, bahkan jika ditandai sebagai "claude-officially", apakah benar-benar merupakan layanan API yang disediakan secara resmi oleh pabrikan model besar, terutama bergantung pada kejujuran admin situs.
Sebelumnya, 21st Century Business Herald melaporkan bahwa banyak kepala stasiun transit pernah ditanyai apakah mereka dapat menjual jumlah pengguna, serta mengungkapkan bahwa beberapa perusahaan besar di industri ini akan menggunakan cara membeli data untuk melatih model.
Sebagai seorang profesional AI, Xiao Zhang memahami risiko semacam ini; ia hanya menggunakan stasiun perantara untuk sebagian kecil pekerjaannya, seperti mengubah kode atau dokumen, dan tidak pernah mengungkapkan data atau kata sandi penting. Sisa pekerjaannya dilakukan menggunakan model besar buatan dalam negeri yang disediakan perusahaan.
Namun bagi sebagian besar pengguna di industri lain, kemampuan untuk memahami risiko data itu sendiri mungkin sudah menjadi hambatan.
03 Diferensiasi industri
Di satu sisi, bisnis yang telah lama beroperasi di zona abu-abu ini telah diberi label berisiko tinggi; pada Mei 2026, seorang administrator stasiun perantara AI domestik ditahan secara kriminal selama 37 hari oleh otoritas kepolisian karena secara ilegal melakukan reverse scraping dan menjual kembali sumber daya antarmuka AI dengan harga rendah.
Di sisi lain, pada bulan Mei yang sama, masuknya dua tokoh terkenal secara berturut-turut membawa Token Middleman ke panggung utama.
Pada 1 Mei, pemain terkenal di dunia kripto, Sun Yuchen, mengumumkan di media sosial bahwa ia meluncurkan "stasiun perantara AI terkuat sepanjang masa"—B.AI, dengan menekankan login blockchain, pembayaran anonim murni, ketidakmungkinan manipulasi, dan harga terendah di seluruh jaringan. Namun, B.AI memerlukan pembayaran dalam mata uang kripto dan sengaja menghindari jalur verifikasi identitas, sehingga mendapat banyak pertanyaan terkait kepatuhan.
Pada hari yang sama, Fu Sheng, Ketua sekaligus CEO Cheetah Mobile, juga mengumumkan peluncuran EasyRouter. Secepatnya, perusahaan merilis pernyataan di situs webnya bahwa tidak menyediakan layanan domestik dan mendukung pengembalian dana, serta pernyataan Fu Sheng mengenai EasyRouter berubah dari "stasiun transit" menjadi "model enterprise gateway/routing layer".
Situs web resmi menunjukkan bahwa sumber API-nya adalah "pengadaan langsung dari penyedia cloud dan platform AI. Berdasarkan penyedia cloud dan platform AI terkemuka, menyediakan layanan distribusi daya komputasi AI yang kompatibel, stabil, dan dapat dilacak sertifikasinya."
Dengan kata lain, EasyRouter menyatakan bahwa sumber pasokan hulu mereka sepenuhnya sesuai peraturan dan tidak menjual kembali ke pengguna di wilayah lain melawan keinginan perusahaan model besar luar negeri.
Saat ini, pabrikan model besar hulu sedang menghadapi regulasi yang semakin ketat. Pada 12 Juni 2026, waktu setempat, Anthropic mengumumkan bahwa mereka menerima perintah dari pemerintah AS, sehingga terpaksa memberlakukan pembatasan akses penuh terhadap dua model AI tercanggih mereka, Fable 5 dan Mythos 5, yang mencakup semua lembaga dan individu di luar AS.
Di tengah semakin ketatnya regulasi, perusahaan domestik seperti EasyRouter juga mulai mencoba mengeksplorasi komersialisasi yang sesuai regulasi.
Faktanya, bisnis Token yang patuh aturan tidaklah rumit. Pada 2023, OpenRouter didirikan di Amerika Serikat sebagai platform agregator untuk berbagai penyedia model besar, yang memanfaatkan volume permintaan Token yang cukup besar untuk mendapatkan harga lebih murah dari platform, lalu menjualnya kembali kepada pengguna. Secara sederhana, ini adalah grosir Token yang dijual eceran.
Selain menjadi "pedagang grosir", ada peluang bisnis B2B sepenuhnya dengan risiko kepatuhan yang lebih rendah. Kepala stasiun transit tersebut memberi tahu "Bao Bian" bahwa ia tidak memperoleh keuntungan dari bisnis stasiun transit B2C, melainkan lebih banyak dari layanan membantu orang memasang stasiun transit. Misalnya, banyak pengusaha bersedia membayar agar karyawan mereka dapat menggunakan model AI yang lebih baik, dengan membiayai pembangunan stasiun transit non-profit di dalam perusahaan mereka.
Ada pihak yang mencoba menyediakan layanan pendukung untuk stasiun transit, seperti layanan manajemen dana berupa penagihan standar kripto dan rekonsiliasi cerdas. Seorang pelaku bisnis semacam ini mengatakan kepada "Bao Bian" bahwa meskipun stasiun transit Token menengah dan kecil di dalam negeri tidak terlalu membutuhkan kebutuhan penyelesaian kripto, banyak stasiun transit Token besar di luar negeri memiliki permintaan semacam ini. Menurut standar industri, komisi sekitar 1%.
Ia juga menyatakan bahwa pusat transaksi token besar semacam ini tidak hanya berbisnis menghubungkan model besar luar negeri ke dalam negeri, tetapi juga berbisnis mengekspor model besar dalam negeri. “DeepSeek, DouBao, dan beberapa model dari Alibaba memiliki keunggulan utama dalam hal harga murah; tidak menjual ke Amerika Serikat, tetapi menjual ke tempat lain, memiliki keunggulan mutlak.”
Dengan demikian, stasiun perantara token juga menjadi irisan jujur di tengah arus AI, mencatat secara akurat bagaimana permintaan nyata mengalir dan berubah arah.
“Kode itu sendiri tidak memiliki nilai apa-apa di era ini,” kata Xiao Zhang.
Demikian pula, hal yang benar-benar menentukan sejauh mana bisnis pusat transmisi Token dapat berkembang, tidak tersembunyi dalam kode. Di masa pertumbuhan liar industri, yang memiliki sumber daya memiliki kekuasaan, tetapi ketika produsen hulu semakin ketat dalam memberantas operasi ilegal, ruang keuntungan yang didukung oleh kumpulan saluran terbalik dan sumber kartu hitam pasti akan semakin menyempit.
Pada akhirnya, kehadiran token transit kemungkinan besar hanya bertujuan untuk mengisi celah pasar selama periode khusus ini, sebagai produk sementara dalam gelombang AI. Jika suatu hari hambatan teknologi AI dihapus, mungkin saat itulah transit token mulai punah.
