Industri AI Memasuki 'Era Token' dengan Infrastruktur Tujuh Lapis

icon MarsBit
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Rancangan berita AI + kripto menunjukkan industri bergerak dari era 'model' ke era 'industri Token', didorong oleh permintaan inferensi AI yang meningkat. GoodVision AI menerangkan infrastruktur tujuh lapisan, mencakup tenaga, penghasilan GPU, dan pengagihan Token. Pelancaran Token baru dijangka semakin meningkat seiring pertumbuhan penggunaan AI Agent, dengan sistem berbasi Token menjadi pusat dalam penghasilan dan penggunaan.

Penggerak era AI telah berubah daripada model kepada Token

Dalam dua tahun terakhir, naratif fasa pertama industri AI berpusat pada "perang model besar" yang dimulai oleh pelbagai syarikat besar. Jumlah parameter meningkat dari ratusan miliar ke trilion, kos latihan naik dari puluhan juta dolar AS kepada ratusan juta dolar AS, dan kluster GPU berkembang dari ribuan kad kepada puluhan ribu kad. Semua orang membincangkan model siapa yang lebih kuat dan siapa yang lebih dekat kepada AGI, seolah-olah matlamat persaingan AI adalah pada prestasi model besar itu sendiri.

Sementara itu, pada tahun 2026, logik pendorong industri AI telah berubah. Laporan terbaru JPMorgan berpendapat bahawa pendorong sebenar kepada pengembangan berterusan infrastruktur AI di masa depan bukan lagi pelatihan model, tetapi permintaan inferens AI dalam jumlah besar. Yang akan mengkonsumsi kekuatan pengiraan paling banyak di masa depan bukan lagi pelatihan model besar, tetapi AI Agent yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap pelaksanaan tugas pada dasarnya mengkonsumsi Token. Industri AI sedang berpindah dari "era model" ke "era industri Token".

Kerana masa depan yang benar-benar menggerakkan dunia AI bukan hanya model itu sendiri, tetapi sistem penghasilan, pengagihan, penskudulan, dan penggunaan yang dibina di sekitar Token. Terutamanya selepas AI Agent mula muncul dalam skala besar, bagaimana Token dihasilkan secara masa nyata, diagihkan merentas wilayah, diskudul secara dinamik, dan digunakan secara efisien, akan menjadi masalah baru yang paling penting dalam industri AI keseluruhan.

Seperti yang baru-baru ini dinyatakan oleh Jensen Huang, AI bukanlah industri perisian biasa, tetapi satu sistem infrastruktur seperti elektrik dan internet. Dalam struktur "kekek berlapis lima" beliau, industri AI dibahagikan kepada lima lapisan: tenaga, cip, infrastruktur, model, dan aplikasi. Seiring dengan peralihan industri AI dari "era latihan" ke "era inferens", GoodVision AI lebih cenderung memahami keseluruhan rantai nilai ekonomi AI sebagai struktur "kekek berlapis tujuh" yang berputar di sekitar Token:

Tahap pertama: Elektrik — Asas tenaga dalam era AI
Lapisan Kedua: AIDC — Pabrik Token
Tahap ketiga: GPU — Peralatan penghasilan Token
Tingkat keempat: LLM – Enjin penghasilan Token
Tingkat Kelima: Pengagihan Token — "Grid" Zaman AI
Tingkat keenam: Pembaikan Token dan Penjadualan Pintar — Otak Era AI
Tingkat Ketujuh: AI Agent — Terminal Penggunaan Token

Dari tenaga, GPU, hingga AIDC, nod tepi, hingga inferens model dan penjadualan pintar, industri AI sedang membentuk satu "sistem industri Token" yang belum pernah terjadi sebelumnya.

However, at this stage, this system is still far from mature.

Seseorang memiliki GPU paling canggih tetapi terbatas oleh tenaga; seseorang membina AIDC yang besar tetapi kekurangan pengagihan yang efisien; seseorang membangunkan AI Agent yang kuat tetapi menghadapi kos inferens yang tinggi dan latensi; seseorang menguasai nod tepi tetapi tidak mampu membentuk rangkaian yang koheren dan bersatu. Keseluruhan rantai nilai walaupun berkembang pesat, tetapi antara setiap peringkat masih terdapat banyak pemisahan, pembaziran, dan halangan kecekapan.

Namun, hanya apabila tujuh lapisan infrastruktur ini benar-benar disambungkan, dikoordinasikan, dan dipertautkan bersama, industri AI akan berpindah dari era「alat」hari ini ke era「penggunaan berskala besar」milik dunia pintar.

Lapisan pertama kek: Tenaga — Energi di Era AI

Revolusi industri memperebutkan batu bara dan minyak, era internet memperebutkan trafik dan pelayan, sedangkan era AI, perang paling mendasar sedang kembali kepada tenaga.

Kerana AI akhirnya menghabiskan tenaga elektrik. Penggunaan tenaga pusat data AI berskala besar sudah hampir setara dengan sebuah bandar sederhana. Pusat data AI baru di seluruh dunia sedang menghadapi masalah yang sama: GPU boleh dibeli, tanah boleh dibina, tetapi bekalan kuasa tidak mampu mengikut tempo, dan pengurusan grid juga tidak mampu mengikut tempo.

Inilah sebabnya semakin banyak syarikat AI mulai memperhatikan semula infrastruktur tenaga. Di GTC 2026, Huang Renxun bahkan mentakrifkan pusat data masa depan sebagai "pabrik Token". Hulu pabrik ini akan mencetuskan satu industri tenaga super.

Di pasaran China, syarikat-syarikat seperti Changjiang Power, China National Nuclear Power, China General Nuclear Power, Three Gorges Energy, Longyuan Power, dan Huadian New Energy mewakili arah tenaga utama seperti tenaga hidro, tenaga nuklear, tenaga angin, dan tenaga suria. Di antaranya, tenaga nuklear dan tenaga hidro, dengan kemampuan bekalan tenaga yang stabil, sedang menjadi tenaga asas paling penting untuk AIDC; manakala tenaga angin dan tenaga suria mendapat manfaat daripada peningkatan permintaan industri AI terhadap tenaga hijau dan ESG. Seiring dengan kemajuan projek "Digital East, Computing West" dan pembinaan pusat data AI berskala besar, hubungan sinergi antara pusat tenaga baharu dan pusat pengiraan sedang dipercepatkan.

Di pasaran Amerika Syarikat, raksasa tenaga tradisional seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., dan Exelon juga sedang mendapat manfaat daripada pengembangan pusat data AI. NextEra merupakan pemimpin tenaga hijau di Amerika Utara; Dominion menguasai sumber transmisi utama di "koridor pusat data" Virginia Utara; sementara Exelon, dengan kemampuan bekalan tenaga nuklear yang stabil, menjadi salah satu penerima faedah utama permintaan tenaga "berterusan dan sangat stabil" di era AI. Secara keseluruhan, industri tenaga global sedang berubah dari perniagaan utiliti tradisional kepada lapisan sumber utama di era infrastruktur AI.

Pusat data AI

Secara keseluruhan, lanskap persaingan lapisan ini sedang berubah dari "persaingan tarif listrik" antara syarikat tenaga tradisional kepada "persaingan hak penguncian tenaga" antara pusat data AI, penyedia awan, dan syarikat tenaga di hujung rantai. Siapa yang mampu mengunci tenaga yang jangka panjang, stabil, dan berkos rendah, dialah yang menguasai permata naga pertama dalam penghasilan Token.

Lapisan kedua: AIDC — Pabrik Bahan Baku Token

Satu GPU tunggal tidak bermakna; yang benar-benar penting adalah klauster berskala besar. Maka muncullah AIDC.

Ia seperti kilang keluli, pembangkit listrik, dan pabrik lini perakitan pada era industri, yang mengumpulkan ribuan GPU untuk membentuk kapasiti penghasilan Token yang stabil. Namun, masalah kilang mulai muncul: tempoh pembinaan AIDC tradisional sering berlangsung selama 18 hingga 36 bulan, dan peningkatan kapasiti grid mungkin memerlukan masa yang lebih lama lagi. Apabila permintaan AI meningkat secara eksponen, kelajuan pembinaan IDC zaman lama sudah tidak mampu memenuhi ekonomi Token yang baharu.

Di pasaran saham AS, Equinix merupakan salah satu pengendali pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih daripada 30 negara. Kelebihan utamanya bukan hanya bilangan pusat data, tetapi kemampuan sambungan global dan sumber daya rangkaian latensi rendah, menjadikannya nod penting infrastruktur untuk pelaksanaan kuasa AI.

Digital Realty memasuki infrastruktur AI melalui platform PlatformDIGITAL, melayani penyedia awan besar dan institusi kewangan.

Di pasaran China, Runze Technology adalah salah satu operator AIDC paling klasik di pasaran A. Usaha utamanya telah berubah secara berperingkat dari IDC tradisional kepada pusat kekuatan AI, dengan keunggulan kompetitif utamanya terletak pada pusat data berskala besar, sumber daya elektrik, dan kemampuan pengurusan AIDC. Perusahaan seperti Aofei Data dan Capital Online masing-masing terus memperluas operasi mereka ke arah pusat data wilayah, infrastruktur awan, dan pengurusan kekuatan AI. Sugon berfokus pada kerjasama dalam bidang kerajaan, perniagaan, dan penyelidikan dalam bisnis AIDC.

Sementara itu, pemain lain datang dari "peralihan penambangan". Perusahaan-perusahaan seperti CoreWeave, IREN, Applied Digital, dan Cipher Mining, yang sebelumnya banyak terkait dengan penambangan kripto, dengan cepat beralih ke infrastruktur komputasi AI akibat lonjakan permintaan GPU AI. IREN menonjolkan model "tenaga hijau + komputasi AI", membangun pusat data GPU berkepadatan tinggi menggunakan sumber energi terbarukan. Applied Digital dan Cipher Mining juga sedang beralih dari penambangan tradisional ke infrastruktur komputasi berkinerja tinggi AI.

Pusat data AI

Selain itu, AI Factory yang terpinggirkan, diperkecil, dan dimodularisasi mulai menjadi trend baru. Seperti masa internet yang berpindah dari komputer besar ke awan komputasi, kuasa pengiraan AI perlu bergerak secara beransur-ansur dari nod pusat super besar ke nod tepi yang bersifat wilayah.

Oleh itu, GoodVision AI memilih jalan lain: membina AI Factory yang lebih ringan, modular, dan boleh disalin dengan pantas. Berbanding AIDC besar tradisional, GoodVision AI lebih menekankan keupayaan penghantaran berdasarkan wilayah, kecekapan kluster GPU berketumpatan tinggi, serta kerjasama terpadu antara tenaga dan kuasa pengiraan.

Logik utamanya bukanlah membina satu pusat data super besar, tetapi menghantar nod AI Factory dengan cepat ke kawasan berpenduduk padat di seluruh dunia, biasanya berupa pusat komputasi inferensia kecil 2-4MW. Model ini tidak hanya membolehkan akses yang lebih pantas kepada sumber tenaga tempatan, tetapi juga lebih sesuai dengan trend masa depan di mana keperluan inferensia AI akan tersebar ke tepi.

Jika AIDC tradisional lebih seperti pabrik baja besar pada era industri, maka yang dibina oleh GoodVision AI lebih seperti "pabrik Token wilayah" pada era AI—lebih ringan, lebih fleksibel, lebih dekat dengan pengguna, dan lebih sesuai dengan arah perkembangan rangkaian inferensi global terdistribusi di masa depan.

Lapisan ketiga: GPU — Peralatan penghasil Token

Jika kuasa elektrik adalah tenaga, maka GPU adalah peralatan pengeluaran. Dalam beberapa tahun pertama ledakan AI, GPU terutama digunakan untuk pelatihan; tetapi di masa depan, permintaan yang lebih besar akan datang daripada inferens. Kerana pelatihan hanya dimiliki oleh beberapa syarikat terkemuka, manakala inferens akan meresap ke dalam setiap aplikasi, setiap peranti, dan setiap terminal. Robot memerlukan inferens, pemanduan automatik memerlukan inferens, cermin AI memerlukan inferens, dan bahkan kerjasama antara setiap AI Agent di masa depan juga secara semasa menghabiskan Token.

NVIDIA masih menjadi pusat mutlak dalam industri cip AI global. Produk GPU seperti H100, B200, dan Blackwell hampir menentukan piawaian pelatihan dan inferens AI global semasa ini. Lebih penting lagi, NVIDIA tidak hanya menjual cip, tetapi juga membina ekosistem lengkap melalui sistem perisian dan peranti keras seperti CUDA, TensorRT, DGX, dan HGX. Oleh itu, pesaingnya tidak hanya perlu menantang prestasi GPU, tetapi juga menantang seluruh ekosistem perisian AI.

AMD adalah pencabar GPU utama semasa ini, dengan produk utama termasuk AI GPU MI300X. Berbanding NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perisian ROCm, dengan harapan menarik pembangun AI dan pelanggan korporat melalui pendekatan yang lebih terbuka.

Broadcom dan Marvell mewakili jalan lain—ASIC dan perhubungan berkelajuan tinggi. Seiring dengan semakin kompleksnya skenario inferensi AI, semakin banyak perusahaan yang mencuba memperbuat cip ASIC tersuai untuk mendapatkan nisbah kecekapan tenaga yang lebih tinggi dan kos yang lebih rendah.

Intel pula memasuki pasaran AI melalui CPU server dan kad akselerator AI Gaudi, berharap memanfaatkan ekosistem CPU sendiri untuk kembali bersaing dalam infrastruktur AI.

Di pasaran China, Cambricon merupakan salah satu syarikat paling mewakili chip AI tempatan, yang mempromosikan siri chip AI Kunlun dan membina kerangka AI buatan sendiri Neuware. Hygon Information pula memiliki lesen arsitektur AMD Zen, dengan fokus utama pada pasaran DCU dan inferensi AI.

Syarikat GPU tempatan seperti Moore Threads, Suanyuan Technology, Muxi Holdings dan Biren Technology mewakili arah penggantian tempatan cip AI China. Mereka secara umum menekankan kompatibiliti dengan ekosistem CUDA dan cuba membina kumpulan GPU tempatan.

Pusat data AI

Dari ekosistem CUDA hingga memori HBM, hingga Tensor Core, kecekapan "penghasilan Token semasa unit masa" sebenarnya merupakan inti seluruh industri AI. Sementara itu, GPU serta infrastruktur di belakangnya—seperti pelayan, modul cahaya, penyejukan cecair, dan suis pertukaran—juga berkait rapat dengan kecekapan penghasilan Token.

Benda-benda ini tidak secerah syarikat-syarikat aplikasi AI seperti NVIDIA dan OpenAI, tetapi mereka menentukan sama ada seluruh dunia AI boleh berfungsi secara sebenarnya. Seperti Revolusi Industri yang tidak hanya memerlukan enjin stim, tetapi juga keretapi, grid elektrik, dan pelabuhan. Revolusi AI juga bukan sekadar revolusi perisian. Ia adalah peningkatan rantai pasokan global yang merangkumi tenaga, cip, rangkaian, komputan awan, dan infrastruktur.

Pusat data AI

Vertiv ialah pemimpin global dalam UPS dan pengurusan kuasa pusat data, menyediakan sistem kuasa pusat data, pengagihan kuasa rak, dan sistem pendingin presisi.

Yingweike adalah pemimpin pasaran A dalam sistem penyejukan cecair dan pengawalan suhu, dengan pelanggan termasuk syarikat internet besar seperti BAT. Seiring dengan peningkatan kuasa GPU, penyejukan cecair sedang menjadi standard penting untuk AIDC.

Perusahaan-perusahaan seperti Zhongheng Electric, Kehua Data, dan Keshida mempunyai kedudukan penting dalam bidang UPS, sistem kuasa, dan bekalan kuasa IDC.

Dalam arah rangkaian dan modul cahaya, syarikat-syarikat seperti Zhongji Chuangchuang, Xinyisheng, dan Tianfu Communications mendapat manfaat daripada lonjakan permintaan komunikasi berkelajuan tinggi di dalam kluster AI.

Sementara itu, dalam arah keseluruhan pelayan, syarikat-syarikat seperti Dell, HPE, Supermicro, Lenovo, dan Inspur bertanggungjawab atas pemasangan dan penghantaran berskala besar pelayan AI.

Lapisan ini, walaupun tidak terus berhadapan dengan pengguna akhir, menentukan sama ada infrastruktur AI boleh beroperasi dengan stabil. Penyejukan cecair, UPS, modul cahaya, suis pertukaran, penyimpanan tenaga, dan keseluruhan pelayan, seperti kereta api, grid elektrik, dan pelabuhan pada era industri, sedang menjadi perniagaan sejati 'penjual cangkul' di dunia AI.

Lapisan keempat kek: LLM – Enjin penghasilan Token

LLM (model bahasa besar) menentukan bagaimana Token difahami, dihasilkan, dan diorganisasi. Dalam dua tahun terakhir, syarikat-syarikat seperti OpenAI, Anthropic, Google, Meta, xAI, dan DeepSeek telah memicu "perlumbaan model besar" secara global. Jumlah parameter telah bergerak dari berbilion ke bertrilion, dan kemampuan model telah berkembang dari penghasilan teks kepada multimodal, penalaran, kod, kerjasama Agent, dan ingatan jangka panjang.

Namun, seiring dengan perkembangan industri, pasaran mulai sedar: yang benar-benar penting di masa depan bukan lagi "siapa yang memiliki model terbesar", tetapi siapa yang mampu menjalankan model secara berterusan dengan kos yang lebih rendah dan kecekapan yang lebih tinggi. Kerana model itu sendiri tidak mencipta nilai secara langsung; nilai yang sebenarnya dicipta ialah melalui proses inferens yang berterusan selepas model dipanggil.

Ini juga bermakna bahawa LLM sedang berubah daripada sekadar "memperlihatkan kemampuan model" pada masa lalu, kepada menjadi "mesin penghasil Token" di dunia AI.

Model tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, dan Meta Llama sedang bersaing untuk menguasai pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek mulai membentuk semula landskap persaingan industri melalui kos yang lebih rendah dan kecekapan inferens yang lebih tinggi. Kini, persaingan di lapisan LLM juga perlahan-lahan tidak lagi semata-mata mengejar jumlah parameter, tetapi penilaian berpindah kepada perbandingan pelbagai dimensi:


Cost of token
Kecekapan inferensi
Konteks kemampuan
Koordinasi Agen Berbilang
Memori jangka panjang
Kemampuan kolaborasi model dan infrastruktur

Pusat data AI

Yang benar-benar penting di era AI bukanlah sekadar melihat sama ada model besar itu "bijak", tetapi sama ada model tersebut boleh dijalankan secara berterusan, berskala besar, dan berkos rendah di seluruh dunia. GoodVision AI juga mempunyai penyelesaian penambahbaikan sendiri pada tahap ini: melalui kerjasama dengan pengeluar model besar, menempatkan model besar di pusat data AI Factory, untuk beralih daripada perniagaan penyewaan kuasa pengiraan tradisional kepada penyediaan perkhidmatan Token secara langsung; bukan sahaja meningkatkan margin keuntungan perniagaan, tetapi juga memberikan pengalaman pengguna yang lebih mesra.

Lapisan kelima kek: Pembahagian Token — "Grid" Era AI

Selepas AIDC siap dibina, soalan seterusnya muncul: bagaimana kekuatan pengiraan ini boleh digunakan oleh seluruh dunia?

Oleh itu, platform penyewaan kuasa pengiraan mula muncul. Ia berfungsi seperti "sistem grid" di era AI, memecah dan mengagihkan sumber GPU yang terpusat, kemudian menyewakannya mengikut keperluan kepada pembangun, perusahaan, dan aplikasi AI.

AWS, Azure, Google Cloud, Alibaba Cloud, dan Tencent Cloud masih merupakan pemain paling kuat di lapisan ini. Mereka memiliki infrastruktur komputasi awan terbesar di dunia dan sedang secara bertahap mengintegrasikan sumber daya AI GPU ke dalam sistem IaaS mereka.

Namun, pada masa yang sama, sejumlah "cloud asli AI" mula bangkit dengan cepat. Syarikat-syarikat seperti CoreWeave, Nebius, dan Nscale membina platform cloud GPU secara khusus berdasarkan keperluan latihan dan inferensi AI. Berbanding penyedia cloud tradisional, mereka lebih fleksibel, lebih fokus kepada tugas AI, dan lebih mahir dalam pengoptimuman kluster GPU.

CoreWeave merupakan salah satu syarikat paling mewakili NeoCloud. Awalnya ia fokus pada penambangan Ethereum, kemudian beralih sepenuhnya kepada perkhidmatan awan AI GPU, dan kini menjadi syarikat infrastruktur AI yang disokong utama oleh NVIDIA.

Platform awan ringan seperti DigitalOcean dan Vultr ditujukan kepada pembangun kecil dan sederhana serta syarikat bermula, dengan penekanan pada penghantaran pantas dan perkhidmatan GPU berkos rendah.

Di pasaran China, selain raksasa-raksasa, syarikat-syarikat seperti UCloud, Kingsoft Cloud, dan Capital Online juga merupakan penyedia utama dalam pasaran penyewaan GPU cloud dan kekuatan pengiraan AI. Struktur persaingan lapisan ini sangat serupa dengan grid listrik awal: bagaimana mengagihkan kekuatan pengiraan yang tersebar secara efisien.

Pusat data AI

Lapisan keenam kek: Pembaikan Token dan Penjadualan Pintar — Otak Zaman AI

Ini mungkin lapisan "kue" yang paling diremehkan tetapi paling kritikal. Selepas penggunaan AI Agent meledak, orang ramai menyedari bahawa tidak semua tugas patut memanggil model besar yang paling mahal. Banyak tugas ringan boleh diselesaikan dengan model tempatan; banyak tugas masa nyata lebih sesuai dengan inferensi tepi; dan banyak tugas privasi bahkan tidak boleh diunggah ke awan. Selepas soalan "adakah terdapat kuasa pengiraan", kini muncul soalan tambahan, iaitu "bagaimana untuk menggunakan kuasa pengiraan dengan lebih bijak".

Seiring dengan pertumbuhan eksponen dalam permintaan Token, "menggunakan model yang tepat, pada kekuatan pengiraan yang sesuai, untuk menangani tugas yang sesuai" adalah kunci untuk mengguna dan menggunakan Token secara rasional dan berkesan. Ini adalah salah satu arah utama yang sedang diperjuangkan oleh GoodVision AI selain membina pabrik AI Token.

Seperti sistem elektrik hari ini: beberapa permintaan datang dari grid besar; beberapa permintaan datang dari solar atap. Yang paling penting sebenarnya ialah lapisan tengah "sistem pengagihan pintar".

AI masa depan juga akan memiliki struktur yang sama: tugas ringan diselesaikan oleh model kecil tempatan, tugas kompleks memanggil model besar awan, tugas privasi tinggi diproses di tepi, dan tugas berpembebanan tinggi dijadualkan dinamik melalui awan campuran.

Selain Goodvision AI, syarikat-syarikat seperti Qingyun Technology, Lambda, OpenRouter, dan Fireworks AI juga merupakan pemimpin dalam pengoptimuman Token dan penjadualan pintar.

Pemain yang sama sangat tumpang tindih antara lapisan "kue" ini dan dua lapisan "kue" sebelumnya—AIDC dan penyewaan daya komputasi. Seiring sumber daya GPU, node wilayah, dan skala tugas inferensi terus membesar, hanya "memiliki daya komputasi" sudah tidak lagi cukup untuk membangun hambatan jangka panjang. Semakin banyak operator AIDC dan platform awan GPU menyedari bahawa, di masa depan, yang benar-benar menentukan kecekapan dan margin keuntungan bukan hanya jumlah GPU, tetapi bagaimana cara menyusun semula model, daya komputasi, dan arus Token secara dinamik.

Oleh itu, banyak platform yang sebelumnya menyediakan AIDC dan GPU cloud juga mulai meluas ke lapisan "penjadualan pintar". Sebagai contoh, syarikat-syarikat seperti UCloud, Capital Online, dan Sugon di pasaran China sedang mencuba menggabungkan infrastruktur GPU cloud, sumber pelbagai cloud, dan kemampuan penjadualan inferens mereka, secara perlahan-lahan berpindah dari "menjual kuasa pengiraan" kepada "mengoptimumkan kuasa pengiraan".

Pusat data AI

Lapisan ketujuh kek: Model dan Agent — Pengguna Token

Walaupun lapisan ini paling dekat dengan pengguna dan paling mudah mendapatkan trafik, persaingan juga paling sengit. Di GTC 2026, Huang Renxun mengemukakan pandangan berikut: di masa depan, setiap syarikat akan menjadi «pembuat Token dan pengguna Token».

Seorang AI Agent mungkin memanggil beberapa model, alat, dan API secara serentak, serta terus melakukan penalaran, perancangan, dan pelaksanaan. Ini bermakna, jumlah Token yang akan digunakan oleh AI di masa depan akan jauh melebihi skala percakapan antara manusia dan AI hari ini. Beberapa pengguna AI berat semasa ini telah membina sistem dengan banyak Agent yang beroperasi secara serentak dan saling memanggil, serta menghabiskan 1 miliar Token setiap hari tanpa sebarang kesukaran.

Masa depan bukanlah 1 bilion orang yang menggunakan AI, tetapi 10 bilion, bahkan 100 bilion agen AI yang bekerja serentak dan saling memanggil. Bottleneck sebenarnya juga akan berpindah dari “keupayaan model” kepada “kecekapan pengagihan Token”.

Raksasa teknologi tidak perlu diterangkan lagi, Microsoft, Google, Meta, Amazon dan lain-lain sedang secara beransur-ansur memasukkan kemampuan AI ke dalam semua produk mereka melalui sistem pejabat, carian, rangkaian sosial, dan perkhidmatan awan.

Syarikat perisian perniagaan seperti Adobe, Salesforce, ServiceNow, dan Palantir sedang mempercepat kemajuan dalam agen AI perniagaan dan aliran kerja automatik. Sementara itu, Hugging Face sedang menjadi 'Github' era AI. Ia bukan sahaja komuniti model, tetapi juga infrastruktur penting dalam ekosistem pembangunan AI global.

Di pasaran China, syarikat-syarikat seperti iFlytek, Kunlun Wanwei, 360, Kingsoft Office dan SenseTime sedang membina strategi sekitar pembantu AI, pekerjaan AI dan AI Agent.

Setelah "kekek tujuh lapis" benar-benar terbentuk, dunia AI baru akan benar-benar bermula

Industri AI hari ini sebenarnya masih berada di dalam satu sistem infrastruktur yang belum sepenuhnya matang.

Seseorang memiliki GPU paling canggih tetapi terbatas oleh tenaga; seseorang membina AIDC yang besar tetapi kekurangan pengagihan yang efisien; seseorang mengembangkan model dan Agent yang kuat tetapi menghadapi kos inferens yang tinggi dan latensi; seseorang menguasai nod tepi tetapi tidak mampu membentuk rangkaian yang koordinasi secara seragam.

Dari tenaga elektrik, AIDC, GPU, hingga LLM, pengagihan Token, pengagihan pintar dan AI Agent, keseluruhan rantai nilai AI walaupun sedang berkembang pesat, masih menghadapi banyak keputusan, pengulangan dan bottleneck kecekapan antara setiap peringkat.

Namun, hanya apabila "kekek berlapis tujuh" ini benar-benar dibina sepenuhnya dan mulai beroperasi secara koordinatif yang efisien, industri AI akan berpindah dari "era alat" hari ini ke "era penggunaan berskala besar" milik dunia pintar.

Dunia AI masa depan tidak lagi hanya melibatkan segelintir raksasa teknologi yang melatih model besar, tetapi puluhan miliar AI Agent yang secara berterusan dalam talian, bekerjasama, dan memanggil kekuatan komputasi serta Token. Setiap perbualan, setiap penalaran, setiap panggilan alat, dan setiap tugas yang dijalankan secara automatik, semuanya didukung oleh kerjasama sistem tenaga, GPU, rangkaian, sistem pengagihan, dan nod penalaran.

Ini juga bermakna bahawa industri AI sedang berubah daripada "logik perisian" sebelum ini kepada satu sistem industri super yang merangkumi tenaga, cip, komputing awan, rangkaian tepi, dan pengagihan pintar.

Seperti revolusi industri yang tidak hanya memerlukan enjin stim, tetapi juga rel kereta api, grid elektrik, dan pelabuhan; revolusi internet tidak hanya memerlukan PC, tetapi juga serat optik, pusat data, dan komputasi awan. Tanda kejadian matang sebenar revolusi AI bukanlah hanya satu aplikasi popular, tetapi pembentukan sebuah "jaringan infrastruktur pintar" secara global yang mampu menghasilkan, mengagih, mengurus, dan mengonsumsi Token secara berterusan.

Dan apabila tujuh lapisan infrastruktur ini akhirnya disambungkan secara sebenar, logik persaingan dalam industri AI juga akan diubah secara keseluruhan. Syarikat paling penting di masa depan mungkin bukan lagi yang memiliki model terbesar, tetapi yang mampu menyambungkan tenaga, kuasa pengiraan, rangkaian, model, dan aliran Token.































Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.