Stesen perantara token adalah produk khas era AI, berfungsi sebagai lapisan perantara antara pengguna dan model besar, dengan mengumpulkan panggilan kepada hampir 20 model besar tempatan dan luar negara seperti ChatGPT dan Claude, membantu pengguna mengelakkan sekatan geografi dan menggunakan perkhidmatan AI dengan harga lebih rendah daripada harga rasmi.Penulis artikel: Zhan Fangge
Sumber artikel: Bao Bian
Perdagangan semula "mata wang digital" di era AI: Stesen perantaraan Token berlari pantas, tetapi pasti singkat umurnya?
Apabila anda meminta AI menulis laporan mingguan, “model besar” di belakangnya akan menerima keperluan anda, membalas maklumat anda, dan memahami konteks tersebut—semuanya sebenarnya dipecahkan menjadi unit komputasi individu, yang dikenali sebagai Token, diterjemahkan ke dalam Bahasa Melayu sebagai “kata unit”.
Setiap kali orang berinteraksi dengan AI, penggunaan dihitung berdasarkan Token dan dikenakan bayaran mengikut Token. Sebagai "wang sah" era AI, pergerakan Token telah mengubah naratif pembahagian kekayaan.
Ada yang tidak menghasilkan Token, hanya bertindak sebagai pengangkut Token, menjadi perantara untuk mendapat keuntungan daripada selisih harga, dan mendapat keuntungan besar. Perniagaan ini dikenali sebagai stesen perantaraan Token.
Sebahagian syarikat yang mencapai aliran bulanan berjumlah jutaan mungkin hanya mempunyai kurang daripada 20 orang dalam pasukan mereka. “Sementara beberapa industri tradisional masih memikirkan cara untuk mendapatkan keuntungan dan mengurangkan perbelanjaan, mereka setiap hari hanya memikirkan cara mengelakkan cukai,” begitu seorang pengetua stesen pertukaran Token yang baru masuk industri ini menerangkan perniagaan rakan seindustry mereka.
Pada awalnya, stesen perantara token kebanyakannya wujud untuk mengatasi sekatan wilayah model luar negara, dengan menggunakan pelbagai cara untuk menghubungkan model luar negara ke dalam negara, supaya pengguna tempatan boleh menggunakannya. Namun, sejak perkembangan perniagaan ini, banyak stesen perantara kini juga “mengeksport” model tempatan yang berguna untuk melayani pasaran luar negara.
Di belakang stesen perantaraan token, bukan hanya ada mitos kekayaan, tetapi juga menceritakan kisah "keperluan mendahului peraturan".
01 Perniagaan di puncak tren
Bagaimana untuk memahami stesen perantara token?
Sebagai contoh, untuk menonton rancangan hiburan atau filem tertentu, anda mungkin perlu berlanggan ke pelbagai platform seperti Tencent, iQiyi, Youku, Bilibili, dan sebagainya. Jika anda berlanggan semua, penggunaan sebenar mungkin rendah dan sangat membuang-buang wang. Pada masa ini, anda pasti ingin ada satu platform perkongsian langganan video, di mana anda hanya perlu membayar satu langganan sahaja untuk mengakses semua sumber tersebut dengan bebas.
Token Pusat Pemindahan melakukan tugas "pengumpulan model besar" ini, dan ia juga menggunakan pelbagai cara untuk mendapatkan token dari pelbagai model besar dengan kos rendah, membolehkan pengguna menggunakan ChatGPT, Claude, Gemini, dan sebagainya, baik di dalam negara mahupun luar negara yang mempunyai sekatan wilayah, dengan membayar lebih sedikit.
“Jika penggunaan Token anda tidak terlalu tinggi, kos yang dihasilkan daripada menggunakan stesen perantara akan lebih rendah, bahkan jauh lebih rendah, berbanding langganan langsung satu akaun,” kata seorang pentadbir stesen perantara kepada Bao Bian. Sesetengah pengguna tidak hanya menggunakan stesen perantara untuk mengelakkan sekatan geografi oleh pembesar model besar, tetapi juga kerana cara ini lebih murah dan membolehkan mereka mencuba lebih banyak model besar yang berbeza.
Pada antaramuka stesen perantara token, model besar yang boleh dipanggil boleh mencapai hampir 20 model. Setiap model berbeza, cara penagihan yang dipilih juga berbeza, dan kadar yang berlaku juga berbeza. Yang lebih murah, bahkan boleh membeli jutaan token dengan hanya beberapa ringgit. Berbanding dengan itu, jika berlanggan ChatGPT Plus, kos bulanan ialah 20 dolar AS.
Rintangan teknikal yang rendah dan pelbagai permainan kelabu dari hulu menyebabkan semakin ramai orang mencuba memasuki laluan ini untuk mendapat sebahagian keuntungan, harga Token juga turun.
Sebelum ini, 21st Century Business Herald melaporkan bahawa harga output API Claude-Opus-4-6 ialah sekitar 170 yuan per juta token, dan sebuah stesen perantaraan domestik telah menurunkan harga kepada separuh harga rasmi, sementara stesen-stesen kecil dan sederhana mampu menawarkan harga antara 20% hingga 30%.
Sebenarnya, perniagaan stesen perantara token boleh ditelusuri kembali ke tahun 2024 atau lebih awal lagi. “Pada tahun 2023, orang sudah mula membongkar model ChatGPT 3.5. Pelancaran Claude 3.5 menandakan lompatan kualitatif dalam tingkat vibe coding (pengaturcaraan berbahasa semula jadi), dan sejak itu, para pengatur cara telah mempunyai permintaan besar terhadap token.” kata pakar konten berbayar AI, McDonald, kepada Bao Bian.
Sekarang, teknologi AI semakin meresap dalam kehidupan harian dan pekerjaan, menggugat pelbagai industri, dan permintaan terhadap Token terus meningkat secara berterusan.
Sebelum ini, CCTV pernah melaporkan bahawa pada awal 2025, penggunaan harian token domestik hanya 7 trilion, meningkat kepada 30 trilion pada pertengahan tahun, dan melepasi 100 trilion pada akhir 2025. Pada awal 2026, penggunaan harian token telah mencapai 140 trilion.
Ini baru mengira jumlah panggilan mengikut pernyataan rasmi; jika ditambah dengan permintaan panggilan model luar negara, penggunaan Token akan lebih besar lagi. Oleh itu, di zaman sekarang di mana pelajar universiti pun ingin menggunakan model terkemuka untuk mengubah tesis mereka, stesen perantaraan Token pun muncul seperti cendawan selepas hujan.
Secara mengejutkan, rintangan teknikal bagi stesen penghantaran token itu sendiri tidak tinggi. Mac mengatakan vibe coding sangat mengurangkan rintangan untuk membina stesen penghantaran, di mana pentadbir hanya perlu memahami sedikit teknologi untuk melaksanakan penghantaran laman.
“Sekarang ada dua pilihan open-source yang jelas untuk dipanggil, satu dipanggil sub2 API, dan satu lagi dipanggil New API,” kata McDonald. “Anda hanya perlu membeli satu server, lalu beritahu ia: projek ini bagus, tolong bantu saya menghantar ke server mana, dan AI akan melakukannya untuk anda.”
Contohnya, New API adalah penyelesaian lengkap yang menggabungkan penukaran protokol, pengurusan saluran, penagihan, dan pengurusan latar belakang pengguna, yang boleh dipanggil oleh pengguna secara fleksibel.
Tahap teknikal tidak tinggi, tetapi perniagaan stesen perantaraan token menarik dan berbahaya.
02 Rantai kelabu
Untuk menjadi stesen perantara token, perlu berusaha di hulu rantai pasaran, iaitu "bagaimana memanggil model luar negara dengan kos yang lebih rendah".
Pola biasa ialah model eceran dan borong Token. Biasanya, platform utama menyediakan pakej langganan pembangun (Coding Plan), yang biasanya termasuk kuota percuma tetap, dengan harga bertingkat untuk penggunaan di luar kuota tersebut. Stesen perantara boleh membeli banyak pakej Coding Plan secara borong, menggabungkan kuota ke dalam satu kolam akaun, kemudian menjual semula dengan harga sedikit lebih rendah daripada API rasmi.
Sebagai contoh, API rasmi menjual pada harga RM1/10,000 Token, manakala kos yang dialokasikan daripada Rancangan Coding hanya RM0.2/10,000 Token, dan harga jualan pusat perantara ialah RM0.5, dengan margin kasar 60%.
Cara ini mempunyai kepatuhan yang tinggi, tetapi memerlukan volume yang besar untuk mendapatkan keuntungan.
Pengurus stesen perantaraan di atas memberitahu "Bao Bian" bahawa sekitar tahun 2024, pengeluar model besar luar negara masih berada dalam fasa memperluaskan pasaran dan memberikan kuota percuma untuk penggunaan model besar kepada beberapa syarikat semula jadi produk AI kecil, dengan tujuan agar produk mereka di peringkat aplikasi terus bekerjasama dengan pengeluar model besar.
“Jadi, akan ada sekelompok orang yang mengatasnamakan perniagaan AI untuk mendaftarkan secara beramai-ramai perusahaan rintisan semacam ini di suatu bandar di Amerika Syarikat, semata-mata untuk mendapatkan kuota percuma daripada pembekal tersebut, kemudian menggunakan beberapa teknik teknikal untuk mentransfernya secara percuma ke dalam negara,” kata ketua stesen perantara ini, yang mungkin merupakan bentuk awal stesen perantara Token di dalam negara, serta salah satu cara paling berkos rendah untuk memanggil model besar luar negara.
Permodelan perniagaan stesen perantara token telah beroperasi sehingga hari ini, dengan pelbagai kaedah tidak sah yang timbul, yang paling klasik ialah "sebaliknya".
Sebagai contoh, perisian seperti Windsurf dan Cursor telah menyediakan kebenaran untuk memanggil model besar seperti Claude, dan beberapa stesen perantara melakukan reka bentuk songsang untuk menyambungkan model besar ke stesen perantara mereka sendiri supaya pengguna boleh menggunakannya. “Ini seperti mencuri air dan elektrik—memasang paip sendiri ke paip awam untuk menggunakan air dan elektrik secara percuma dari saluran rasmi,” kata ketua stesen perantara tersebut.
Selain itu, kerana syarikat-syarikat seperti GPT dan Claude telah melancarkan pakej langganan peribadi, beberapa agen akan terlebih dahulu mendapatkan sejumlah besar akaun langganan peribadi, kemudian melalui kejuruteraan songsang, memisahkan kapasiti panggilan akaun tersebut dan menjualnya kepada lebih ramai pengguna.
Dalam proses ini, perolehan sumber nombor borong kemungkinan besar berkaitan dengan industri gelap seperti penyalahgunaan kad kredit, ID Apple, dsb. Selain itu, pembahagian lalu lintas juga boleh menyebabkan penghampiran akun, serta pengalaman pengguna yang buruk.
Bagi pengguna, walaupun stesen perantara token kelihatan selesa dan berpatutan, risiko yang terkandung di dalamnya mungkin sangat tinggi. Sebagai contoh, pengguna biasanya membayar secara pra-bayar dan tidak peka terhadap penggunaan token, sehingga stesen perantara mungkin secara sembunyi-sembunyi mengenakan caj yang lebih tinggi daripada yang telah dipersetujui. Namun, Xiao Zhang, seorang pekerja dalam industri AI, memberitahu "Bao Bian" bahawa pengguna boleh dengan mudah mengesan tanda-tanda ini jika mereka ingin menyemak, oleh itu hanya stesen perantara yang tidak peduli dengan reputasi mereka yang akan melakukan perkara ini.
Selain itu, “menggantung kepala domba dan menjual daging anjing” juga sangat biasa berlaku, “menggantikan model yang baik dengan model yang murah, ini dipanggil penambahan air.” kata McDonald. Risiko yang lebih besar datang daripada data. McDonald menyatakan bahawa (sebaliknya) adalah melalui kaedah teknikal, menghantar soalan yang dihantar pengguna kepada model besar, kemudian menghentikan jawapan model besar dan menghantarnya semula kepada pengguna.
Sepanjang proses tersebut, data pengguna tidak hanya sepenuhnya berada di bawah kuasa stesen perantara, tetapi juga seolah-olah tersebar di laman web, memberi ruang kepada perompak untuk memanfaatkannya.
Xiao Zhang menyatakan bahawa kebanyakan stesen persinggahan akan menandakan sama ada ia "songsang" selepas boleh memanggil model besar. Namun, walaupun ditandakan sebagai "claude-officially", sama ada ia benar-benar perkhidmatan API yang disediakan secara rasmi oleh pembuat model besar bergantung terutamanya pada kejujuran pentadbir laman.
Sebelum ini, Laporan Ekonomi Abad Ke-21 melaporkan bahawa banyak ketua stesen persinggahan telah ditanya sama ada mereka boleh menjual bilangan pengguna, dan juga disebut bahawa beberapa syarikat besar dalam industri akan menggunakan cara membeli data untuk melatih model.
Sebagai seorang profesional AI, Xiao Zhang memahami risiko semacam ini. Hanya sebahagian kecil pekerjaannya yang menggunakan stesen perantara, seperti mengubah kod atau dokumen, dan data serta kata laluan penting tidak akan diungkapkan. Selebihnya, pekerjaannya dilakukan menggunakan model besar buatan tempatan yang disediakan oleh syarikat.
Namun, bagi kebanyakan pengguna dari industri lain, kemampuan untuk mengetahui risiko data itu sendiri mungkin sudah menjadi halangan.
03 Pemisahan industri
Di satu sisi, perniagaan yang lama beroperasi di zona kelabu ini telah diberi label berisiko tinggi; pada Mei 2026, seorang pentadbir stesen perantara AI tempatan ditahan secara kriminal selama 37 hari oleh pihak berkuasa polis atas tindakan mengambil secara tidak sah dan menjual semula sumber antaramuka AI dengan harga rendah.
Di sisi lain, pada bulan Mei yang sama, masuknya dua tokoh terkenal secara berturut-turut telah membawa Token intermediary ke depan panggung.
Pada 1 Mei, pemain terkenal dalam dunia kripto, Sun Yuchen, mengumumkan secara rasmi di media sosial "stesen perantara AI terkuat sepanjang masa" miliknya—B.AI, dengan menekankan log masuk blockchain, pembayaran anonim tulen, tiada perubahan tidak sah, dan harga terendah di seluruh rangkaian. Namun, B.AI memerlukan pembayaran dalam kripto dan sengaja mengelakkan laluan pengesahan identiti, sehingga mendapat banyak pertanyaan mengenai pematuhan.
Pada hari yang sama, Fu Sheng, Ketua dan CEO Cheetah Mobile, juga mengumumkan pelancaran EasyRouter. Segera selepas itu, syarikat itu mengeluarkan penyataan di laman webnya bahawa ia tidak menyediakan perkhidmatan di dalam negara dan menyokong pengembalian dana, serta pernyataan Fu Sheng mengenai EasyRouter berubah dari "stesen perantara" kepada "gateway model peringkat perusahaan/layer penghalaan".
Laman web rasmi menunjukkan bahawa sumber APInya adalah "pengambilan langsung daripada penyedia awan dan platform AI. Berdasarkan penyedia awan dan platform AI terkemuka, menyediakan perkhidmatan pengagihan kuasa AI yang selaras, stabil, dan boleh dilacak."
Dengan kata lain, EasyRouter menyatakan bahawa sumber hulunya sepenuhnya kompaan dan tidak menjual semula kepada pengguna di kawasan lain melanggar kehendak syarikat model besar luar negara.
Sekarang, pengilang model besar hulu sedang menghadapi pengawasan yang semakin ketat. Pada 12 Jun 2026, tempatan, Anthropic mengumumkan bahawa ia menerima arahan dari kerajaan Amerika Syarikat, dan terpaksa memberikan sekatan akses penuh terhadap dua model AI paling canggihnya, Fable 5 dan Mythos 5, yang merangkumi semua institusi dan individu di luar Amerika Syarikat.
Dalam konteks kepatuhan yang semakin ketat, syarikat tempatan seperti EasyRouter juga mulai mencuba meneroka kepatuhan perniagaan ini.
Sebenarnya, perniagaan Token yang kompak tidaklah rumit. Pada tahun 2023, OpenRouter ditubuhkan di Amerika Syarikat sebagai platform pengumpul pelbagai pembekal model besar, yang bergantung pada penggunaan Token dalam jumlah besar untuk mendapatkan harga yang lebih baik daripada platform, kemudian menjualnya semula kepada pengguna. Secara ringkas, ia adalah perniagaan eceran Token yang dibeli secara borong.
Selain menjadi "pengedar eceran", terdapat peluang perniagaan B2B sepenuhnya dengan risiko kesesuaian yang lebih rendah. Ketua stesen perantaraan yang disebutkan di atas memberitahu "Bao Bian" bahawa beliau tidak memperoleh keuntungan daripada perniagaan stesen perantaraan B2C, tetapi lebih banyak daripada perkhidmatan membantu pemasangan stesen perantaraan. Sebagai contoh, ramai pengusaha ingin pekerja mereka menggunakan model AI yang lebih baik, dan bersedia membayar untuk membina stesen perantaraan bukan keuntungan di dalam perusahaan mereka.
Ada pihak yang mencuba menyediakan perkhidmatan sekitar stesen persinggahan, seperti perkhidmatan pengurusan dana termasuk penagihan standard kripto dan penyepaduan pintar. Seorang individu yang terlibat dalam perniagaan ini memberitahu "Bao Bian" bahawa walaupun stesen persinggahan Token kecil dan sederhana di dalam negara kurang melibatkan keperluan penyelesaian kripto, banyak stesen persinggahan Token besar luar negara mempunyai keperluan semacam ini, dan menurut piawaian industri, kadar komisen kira-kira 1%.
Ia juga menyatakan bahawa stesen pemindahan Token besar seperti ini tidak hanya menjalankan perniagaan memperkenalkan model luar negara ke dalam negara, tetapi juga menjalankan perniagaan mengeksport model tempatan. "DeepSeek, DouBao, dan beberapa model dari Alibaba memiliki keunggulan utama dalam harga yang murah; tidak menjual ke Amerika Syarikat, tetapi menjual ke tempat lain, ia memiliki keunggulan mutlak."
Dengan cara ini, stesen perantara token juga menjadi sepotong jujur dalam arus AI, merekodkan dengan tepat bagaimana permintaan sebenar mengalir dan berpindah.
“Kod itu sendiri tidak mempunyai nilai pada zaman ini,” kata Xiao Zhang.
Demikian juga, perkara yang benar-benar menentukan sejauh mana perniagaan pusat perantaraan token boleh berjalan, bukan tersembunyi dalam kod. Semasa tempoh pertumbuhan liar industri, yang memiliki sumber bekalan akan menguasai pasaran, tetapi apabila pengilang hulu semakin ketat dalam memerangi operasi melanggar peraturan, ruang keuntungan yang dibina atas sumber saluran langganan songsang dan kad hitam pasti akan semakin menyempit.
Pada akhirnya, kehadiran stesen perantara token kemungkinan besar hanya bertujuan untuk mengisi jurang pasaran dalam tempoh khas ini, sebagai produk sementara dalam gelombang AI. Jika suatu hari halangan teknologi AI dirobohkan, mungkin itulah masa ketika stesen perantara bermula pupus.
