Pendorong utama era AI telah berubah dari model menjadi Token

Dalam dua tahun terakhir, narasi fase pertama industri AI terutama berputar di sekitar "perang model besar" yang dimulai oleh berbagai perusahaan besar. Jumlah parameter berkembang dari ratusan miliar menuju triliunan, biaya pelatihan naik dari puluhan juta dolar AS menjadi ratusan juta dolar AS, dan kluster GPU berkembang dari ribuan kartu menjadi puluhan ribu kartu. Semua orang membahas model siapa yang lebih kuat dan siapa yang lebih dekat dengan AGI, seolah-olah tujuan kompetisi AI adalah pada kinerja model besar itu sendiri.

Sementara waktu berlanjut ke tahun 2026, logika pendorong industri AI telah berubah. Laporan terbaru JPMorgan menyatakan bahwa yang akan mendorong ekspansi berkelanjutan infrastruktur AI di masa depan bukan lagi pelatihan model, melainkan permintaan inferensi AI dalam jumlah besar. Yang akan mengonsumsi daya komputasi paling banyak di masa depan bukan lagi pelatihan model besar, melainkan AI Agent yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap eksekusi tugas pada dasarnya mengonsumsi Token. Industri AI sedang berpindah dari "era model" menuju "era industri Token".

Karena yang benar-benar mendorong dunia AI di masa depan bukan hanya model itu sendiri, tetapi sistem produksi, distribusi, penjadwalan, dan konsumsi yang terbentuk di sekitar Token. Terutama setelah AI Agent mulai muncul dalam skala besar, bagaimana Token dihasilkan secara real-time, didistribusikan lintas wilayah, dijadwalkan secara dinamis, dan dikonsumsi secara efisien akan menjadi masalah baru paling inti dalam seluruh industri AI.

Seperti yang baru-baru ini diajukan oleh Jensen Huang, AI bukanlah industri perangkat lunak sederhana, melainkan sebuah sistem infrastruktur seperti listrik dan internet. Dalam arsitektur "kue lima lapis" nya, industri AI dibagi menjadi lima lapisan: energi, chip, infrastruktur, model, dan aplikasi. Seiring dengan peralihan industri AI dari era "pelatihan" menuju era "inferensi", GoodVision AI lebih cenderung memahami seluruh rantai nilai ekonomi AI sebagai struktur "kue tujuh lapis" yang berputar di sekitar Token:

Lapisan pertama: Listrik — Dasar energi di era AI
Lapisan Kedua: AIDC—Pabrik Token
Lapisan ketiga: GPU—Perangkat produksi Token
Lapisan keempat: LLM—Mesin produksi Token
Lapisan Kelima: Distribusi Token — 'Jaringan Listrik' di Era AI
Lapisan keenam: Optimalisasi Token dan Penjadwalan Cerdas—Otak di Era AI
Lapisan Ketujuh: AI Agent—Terminal Konsumsi Token

Dari energi, GPU, hingga AIDC, node tepi, hingga inferensi model dan penjadwalan cerdas, industri AI sedang membentuk sistem "industri Token" yang belum pernah ada sebelumnya.

Namun, pada tahap ini, sistem ini masih jauh dari sempurna.

Ada yang memiliki GPU paling canggih tetapi terbatas oleh energi; ada yang membangun AIDC besar-besaran tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan AI Agent kuat tetapi menghadapi biaya inferensi dan latensi tinggi; ada yang menguasai node tepi tetapi tidak dapat membentuk jaringan yang terkoordinasi secara seragam. Seluruh rantai industri meskipun berkembang pesat, tetap memiliki banyak pemisahan, redundansi, dan hambatan efisiensi di antara berbagai lapisannya.

Namun, hanya ketika tujuh lapisan infrastruktur ini benar-benar terhubung, berkolaborasi, dan saling terintegrasi, industri AI akan benar-benar beralih dari era «alat» saat ini menuju era «adopsi massal» dunia cerdas.

Lapisan pertama kue: Listrik—Energi di Era AI

Revolusi industri memperebutkan batu bara dan minyak, era internet memperebutkan lalu lintas dan server, sedangkan di era AI, perang paling mendasar sedang kembali ke energi.

Karena AI pada akhirnya mengonsumsi listrik. Konsumsi listrik sebuah pusat data AI besar sudah mendekati sebesar kota menengah. Pusat data AI baru di seluruh dunia sedang menghadapi masalah yang sama: GPU bisa dibeli, lahan bisa dibangun, tetapi pasokan listrik tidak mampu mengikuti, dan pengaturan jaringan listrik juga tidak mampu mengikuti.

Inilah mengapa semakin banyak perusahaan AI mulai kembali memperhatikan infrastruktur energi. Di GTC 2026, Jensen Huang bahkan mendefinisikan pusat data masa depan sebagai "pabrik Token". Hulu pabrik ini akan memicu munculnya industri energi super.

Di pasar Tiongkok, perusahaan-perusahaan seperti China Yangtze Power, China National Nuclear Power, China General Nuclear Power, Three Gorges Energy, Longyuan Power, dan Huadian New Energy mewakili arah energi inti seperti hidro, nuklir, angin, dan fotovoltaik. Di antaranya, energi nuklir dan hidro, berkat kemampuan pasokan listrik yang stabil, sedang menjadi sumber energi paling penting untuk AIDC; sementara energi angin dan fotovoltaik mendapat manfaat dari peningkatan permintaan akan listrik hijau dan ESG dari industri AI. Seiring kemajuan proyek "East Data, West Computing" dan pembangunan pusat data AI skala besar, hubungan sinergis antara basis energi terbarukan dan pusat komputasi sedang dipercepat.

Di pasar Amerika Serikat, raksasa energi tradisional seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., dan Exelon juga sedang mendapat manfaat dari ekspansi pusat data AI. NextEra merupakan pemimpin listrik hijau di Amerika Utara; Dominion menguasai sumber daya transmisi inti di "koridor pusat data" Virginia Utara; sementara Exelon, berkat kemampuan pasokan listrik stabil dari tenaga nuklir, menjadi penerima manfaat penting atas permintaan "listrik stabil 24/7" di era AI. Secara keseluruhan, industri listrik global sedang bertransformasi dari utilitas tradisional menjadi lapisan sumber daya inti di era infrastruktur AI.

Pusat data AI

Secara keseluruhan, lanskap persaingan lapisan ini sedang berubah dari "persaingan tarif listrik" antara perusahaan energi tradisional menjadi "persaingan hak penguncian listrik" di antara pusat data AI hilir, penyedia cloud, dan perusahaan energi. Siapa yang dapat mengunci energi jangka panjang, stabil, dan berbiaya rendah, dialah yang menguasai龙珠 pertama dalam produksi Token.

Lapisan kedua: AIDC—Pabrik Bahan Baku Token

Satu GPU tunggal tidak berarti apa-apa, yang benar-benar penting adalah kluster berskala besar. Maka muncullah AIDC.

Ia seperti pabrik baja, pembangkit listrik, dan pabrik jalur perakitan di era industri, yang mengumpulkan ribuan GPU untuk membentuk kapasitas produksi Token yang stabil. Namun, masalah pabrik mulai muncul: siklus pembangunan AIDC tradisional sering memakan waktu 18 hingga 36 bulan, dan ekspansi jaringan listrik bahkan memerlukan waktu lebih lama lagi. Ketika permintaan AI tumbuh secara eksponensial, kecepatan pembangunan IDC era lama sudah tidak lagi mampu memenuhi ekonomi Token baru.

Di pasar saham AS, Equinix adalah salah satu operator pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih dari 30 negara. Keunggulan intinya bukan hanya jumlah ruang server, tetapi kemampuan koneksi global dan sumber daya jaringan latensi rendah, menjadikannya simpul infrastruktur penting untuk penempatan daya komputasi AI.

Digital Realty memasuki infrastruktur AI melalui platform PlatformDIGITAL, melayani penyedia cloud besar dan lembaga keuangan.

Di pasar Tiongkok, Runze Technology merupakan salah satu operator AIDC paling khas di pasar A. Bisnis intinya secara bertahap telah beralih dari IDC tradisional menuju pusat kekuatan komputasi AI, dengan daya saing utama terletak pada fasilitas server skala besar, sumber daya listrik, dan kemampuan operasional AIDC. Perusahaan seperti Aofei Data dan Capital Online terus memperluas operasi mereka masing-masing di bidang pusat data regional, infrastruktur cloud, dan pengelolaan kekuatan komputasi AI. Sugon berfokus pada kolaborasi di bidang pemerintah, bisnis, dan penelitian ilmiah dalam bisnis AIDC-nya.

Sementara itu, kelompok pemain lain berasal dari "transisi dari pertambangan". Perusahaan-perusahaan seperti CoreWeave, IREN, Applied Digital, dan Cipher Mining awalnya banyak terkait dengan penambangan kripto, tetapi seiring lonjakan permintaan GPU AI, mereka dengan cepat beralih ke infrastruktur daya komputasi AI. IREN menonjolkan model "listrik hijau + daya komputasi AI", membangun pusat data GPU berdensitas tinggi menggunakan energi terbarukan. Applied Digital dan Cipher Mining juga sedang bertransisi dari pertambangan tradisional menuju infrastruktur komputasi berkinerja tinggi AI.

Pusat data AI

Selain itu, AI Factory yang terpinggirkan, diperkecil, dan dimodularisasi mulai menjadi tren baru. Seperti halnya era internet yang berpindah dari komputer besar menuju komputasi awan, daya komputasi AI perlu secara bertahap menyebar dari node pusat super besar menuju node-edge terlokalisasi.

Oleh karena itu, GoodVision AI memilih jalur lain: membangun AI Factory yang lebih ringan, modular, dan cepat direplikasi. Dibandingkan AIDC besar tradisional, GoodVision AI lebih menekankan kemampuan penyebaran regional, efisiensi kluster GPU densitas tinggi, serta sinergi terpadu antara energi dan daya komputasi.

Logika intinya bukan membangun satu pusat data super besar, melainkan secara cepat menerapkan node AI Factory di wilayah dengan kepadatan penduduk tinggi secara global, biasanya berupa ruang komputasi inferensi kecil berkapasitas 2-4 MW. Model ini tidak hanya memungkinkan akses lebih cepat terhadap sumber daya energi lokal, tetapi juga lebih sesuai dengan tren masa depan di mana kebutuhan inferensi AI menyebar ke sisi edge.

Jika AIDC tradisional lebih seperti pabrik baja besar di era industri, maka yang dibangun oleh GoodVision AI lebih seperti "pabrik Token terlokalisasi" di era AI—lebih ringan, lebih fleksibel, lebih dekat dengan pengguna, dan lebih sesuai dengan arah perkembangan jaringan inferensi terdistribusi global di masa depan.

Lapisan ketiga: GPU—Perangkat produksi Token

Jika listrik adalah energi, maka GPU adalah peralatan produksi. Dalam beberapa tahun pertama ledakan AI, GPU terutama melayani pelatihan; namun di masa depan, permintaan yang lebih besar akan datang dari inferensi. Karena pelatihan hanya dimiliki oleh beberapa perusahaan terkemuka, sementara inferensi akan meresap ke setiap aplikasi, setiap perangkat, dan setiap terminal. Robot membutuhkan inferensi, kendaraan otonom membutuhkan inferensi, kacamata AI membutuhkan inferensi, bahkan kerja sama antar setiap AI Agent di masa depan juga secara real-time mengonsumsi Token.

NVIDIA saat ini tetap menjadi inti mutlak dalam industri chip AI global. Produk GPU-nya seperti H100, B200, dan Blackwell hampir mendefinisikan standar pelatihan dan inferensi AI global saat ini. Lebih penting lagi, NVIDIA tidak hanya menjual chip, tetapi juga membangun ekosistem lengkap melalui sistem perangkat lunak dan perangkat keras seperti CUDA, TensorRT, DGX, dan HGX, sehingga pesaingnya tidak hanya perlu menantang kinerja GPU, tetapi juga seluruh ekosistem perangkat lunak AI.

AMD adalah pesaing GPU utama saat ini, dengan produk inti termasuk AI GPU MI300X. Dibandingkan NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perangkat lunak ROCm, berharap dapat menarik pengembang AI dan pelanggan perusahaan melalui pendekatan yang lebih terbuka.

Broadcom dan Marvell mewakili jalur lain—ASIC dan koneksi berkecepatan tinggi. Seiring dengan semakin kompleksnya skenario inferensi AI, semakin banyak perusahaan yang mencoba mengembangkan chip ASIC khusus untuk mendapatkan rasio efisiensi energi yang lebih tinggi dan biaya yang lebih rendah.

Intel memasuki pasar AI melalui CPU server dan kartu akselerator AI Gaudi, berharap dapat memanfaatkan ekosistem CPU-nya untuk kembali bersaing dalam infrastruktur AI.

Di pasar Tiongkok, Cambricon merupakan salah satu perusahaan paling representatif dalam pengembangan chip AI buatan dalam negeri, yang secara utama mempromosikan seri chip AI Kunlun dan membangun kerangka kerja AI hasil pengembangan sendiri, Neuware. Higon Information memiliki lisensi arsitektur AMD Zen, dengan fokus utama pada pasar DCU dan inferensi AI.

Perusahaan GPU lokal seperti Moore Threads, Suanyuan Technology, Muxi Shares, dan Biren Technology mewakili arah "substitusi lokal" chip AI Tiongkok. Mereka secara umum menekankan kompatibilitas dengan ekosistem CUDA dan berupaya membangun klaster GPU lokal.

Pusat data AI

Dari ekosistem CUDA hingga memori HBM, hingga Tensor Core, inti seluruh industri AI sebenarnya terus meningkatkan "efisiensi generasi Token per satuan waktu". Sementara itu, GPU serta infrastruktur di baliknya—seperti server, modul optik, pendingin cair, dan switch—juga terkait erat dengan efisiensi produksi Token.

Hal-hal ini tidak secerah perusahaan seperti NVIDIA atau OpenAI, tetapi mereka menentukan apakah seluruh dunia AI dapat berjalan secara nyata. Seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan. Revolusi AI juga bukan sekadar revolusi perangkat lunak. Ini adalah peningkatan rantai pasok global yang mencakup energi, chip, jaringan, komputasi awan, dan infrastruktur.

Pusat data AI

Vertiv adalah pemimpin global dalam UPS dan manajemen daya pusat data, menyediakan sistem pasokan daya pusat data, distribusi daya rak, dan sistem pendingin presisi.

Yingweike adalah pemimpin pasar di pasar saham A untuk sistem pendinginan cair dan pengendalian suhu, dengan klien termasuk perusahaan internet besar seperti BAT. Seiring daya GPU yang terus meningkat, pendinginan cair sedang menjadi standar penting untuk AIDC.

Perusahaan-perusahaan seperti Zhongheng Electric, Kehua Data, dan Keshida memiliki posisi penting di bidang UPS, sistem daya, dan pasokan listrik IDC.

Di bidang jaringan dan modul optik, perusahaan-perusahaan seperti Zhongji Xuchuang, Xinyisheng, dan Tianfu Communications mendapat manfaat dari lonjakan permintaan komunikasi kecepatan tinggi di dalam klaster AI.

Sementara itu, di bidang server lengkap, perusahaan-perusahaan seperti Dell, HPE, Supermicro, Lenovo, dan Inspur bertanggung jawab atas perakitan dan pengiriman skala besar server AI.

Lapisan ini meskipun tidak langsung menghadap pengguna akhir, menentukan apakah infrastruktur AI dapat beroperasi secara stabil. Pendinginan cair, UPS, modul optik, switch, penyimpanan energi, dan server lengkap, seperti kereta api, jaringan listrik, dan pelabuhan di era industri, sedang menjadi bisnis sejati "penjual sekop" di dunia AI.

Lapisan keempat kue: LLM—Mesin produksi Token

LLM (large language model) menentukan bagaimana Token dipahami, dihasilkan, dan diorganisasi. Dalam dua tahun terakhir, perusahaan-perusahaan seperti OpenAI, Anthropic, Google, Meta, xAI, dan DeepSeek telah memicu kompetisi global dalam pengembangan model besar. Jumlah parameter telah berkembang dari ratusan miliar menuju triliunan, dan kemampuan model pun secara bertahap diperluas dari generasi teks menjadi multimodal, penalaran, kode, kolaborasi Agent, dan memori jangka panjang.

Namun seiring perkembangan industri, pasar pun mulai menyadari: yang benar-benar penting di masa depan bukan lagi "siapa yang memiliki model terbesar", melainkan siapa yang mampu menjalankan model secara berkelanjutan dengan biaya lebih rendah dan efisiensi lebih tinggi. Karena model itu sendiri tidak menciptakan nilai secara langsung; nilai yang sesungguhnya diciptakan adalah proses inferensi yang terjadi setelah model terus-menerus dipanggil.

Ini juga berarti bahwa LLM sedang bertransformasi dari sekadar "menunjukkan kemampuan model" di masa lalu menjadi "mesin produksi Token" di dunia AI.

Model-model tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, dan Meta Llama sedang bersaing untuk merebut pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek mulai membentuk ulang lanskap persaingan industri melalui biaya yang lebih rendah dan efisiensi inferensi yang lebih tinggi. Kini, persaingan di lapisan LLM juga secara bertahap tidak lagi semata-mata mengejar jumlah parameter, melainkan standar penilaian berpindah ke berbagai dimensi perbandingan:

Biaya token
Efisiensi inferensi
Konteks kemampuan
Kolaborasi Multi-Agent
Long-term memory
Kemampuan kolaborasi model dan infrastruktur

Pusat data AI

Yang benar-benar penting di era AI bukan hanya seberapa "cerdas" model besar, tetapi apakah model tersebut dapat dijalankan secara berkelanjutan, berskala besar, dan berbiaya rendah di seluruh dunia. GoodVision AI juga memiliki solusi optimasi sendiri di tingkat ini: melalui kolaborasi dengan pabrikan model besar, menempatkan model besar di fasilitas AI Factory, sehingga beralih dari bisnis penyewaan daya komputasi tradisional menjadi menyediakan layanan Token secara langsung; tidak hanya meningkatkan marjin bisnis, tetapi juga memberikan pengalaman pengguna yang lebih ramah.

Lapisan kelima kue: Distribusi Token — "Jaringan Listrik" di Era AI

Setelah AIDC selesai dibangun, pertanyaan berikutnya muncul: bagaimana daya komputasi ini dapat digunakan oleh seluruh dunia?

Oleh karena itu, platform penyewaan daya komputasi mulai muncul. Mereka seperti sistem "jaringan listrik" di era AI, yang memecah dan mendistribusikan sumber daya GPU yang terpusat, lalu menyewakannya sesuai kebutuhan kepada pengembang, perusahaan, dan aplikasi AI.

AWS, Azure, Google Cloud, Alibaba Cloud, dan Tencent Cloud tetap menjadi pemain terkuat di lapisan ini. Mereka memiliki infrastruktur komputasi awan terbesar di dunia dan sedang secara bertahap mengintegrasikan sumber daya AI GPU ke dalam sistem IaaS mereka.

Namun, pada saat yang sama, sekelompok "cloud native AI" mulai bangkit dengan cepat. Perusahaan-perusahaan seperti CoreWeave, Nebius, dan Nscale secara khusus membangun platform cloud GPU yang dirancang untuk kebutuhan pelatihan dan inferensi AI. Dibandingkan penyedia cloud tradisional, mereka lebih fleksibel, lebih fokus pada tugas AI, dan lebih ahli dalam optimasi klaster GPU.

CoreWeave adalah salah satu perusahaan paling representatif di NeoCloud saat ini. Awalnya fokus pada penambangan Ethereum, kemudian beralih sepenuhnya ke layanan cloud GPU AI, dan kini menjadi perusahaan infrastruktur AI yang didukung secara signifikan oleh NVIDIA.

Platform cloud ringan seperti DigitalOcean dan Vultr ditujukan bagi pengembang dan perusahaan rintisan skala kecil dan menengah, dengan penekanan pada peluncuran cepat dan layanan GPU berbiaya rendah.

Di pasar Tiongkok, selain para raksasa, perusahaan-perusahaan seperti UCloud, Kingsoft Cloud, dan Capital Online juga merupakan pemasok utama di pasar penyewaan GPU cloud dan kekuatan komputasi AI. Pola persaingan di lapisan ini sangat mirip dengan jaringan listrik awal: bagaimana mendistribusikan kekuatan komputasi yang terpisah secara efisien.

Pusat data AI

Lapisan keenam kue: Optimasi Token dan Penjadwalan Cerdas—Otak di Era AI

Ini mungkin lapisan "kue" yang paling diremehkan tetapi paling krusial. Setelah penggunaan AI Agent meledak, orang menyadari bahwa tidak semua tugas layak memanggil model besar termahal. Banyak tugas sederhana dapat diselesaikan oleh model lokal; banyak tugas real-time lebih cocok untuk inferensi edge; banyak tugas privasi bahkan tidak boleh diunggah ke cloud. Setelah pertanyaan "apakah ada daya komputasi," muncul pertanyaan baru, yaitu "bagaimana menggunakan daya komputasi dengan lebih cerdas."

Seiring dengan pertumbuhan eksponensial permintaan akan Token, "menggunakan model yang tepat, pada daya komputasi yang tepat, untuk menangani tugas yang tepat" adalah kunci agar Token digunakan secara tepat dan efisien. Ini adalah salah satu arah utama yang sedang dikerjakan oleh GoodVision AI selain membangun pabrik AI Token.

Seperti sistem listrik hari ini: beberapa permintaan berasal dari jaringan listrik besar; beberapa permintaan berasal dari surya atap. Yang benar-benar penting adalah lapisan tengah berupa "sistem penjadwalan cerdas".

AI masa depan juga akan memiliki struktur yang sama: tugas sederhana diselesaikan oleh model kecil lokal, tugas kompleks memanggil model besar云端, tugas dengan privasi tinggi diproses di edge, dan tugas dengan konversi tinggi dijadwalkan secara dinamis melalui hybrid cloud.

Selain Goodvision AI, perusahaan-perusahaan seperti Qingyun Technology, Lambda, OpenRouter, dan Fireworks AI juga merupakan pemimpin dalam optimasi token dan penjadwalan cerdas.

Dan lapisan "kue" ini memiliki banyak pemain yang tumpang tindih dengan dua lapisan "kue" sebelumnya—AIDC dan penyewaan daya komputasi. Ketika sumber daya GPU, node regional, dan skala tugas inferensi terus membesar, hanya "memiliki daya komputasi" sudah tidak cukup untuk membangun hambatan jangka panjang. Semakin banyak operator AIDC dan platform cloud GPU menyadari bahwa yang akan menentukan efisiensi dan margin keuntungan di masa depan bukan hanya jumlah GPU, tetapi bagaimana cara secara dinamis mengatur model, daya komputasi, dan arus token.

Oleh karena itu, banyak platform yang awalnya fokus pada AIDC dan GPU cloud juga mulai memperluas ke arah "lapisan penjadwalan cerdas". Misalnya, perusahaan-perusahaan di pasar Tiongkok seperti UCloud, Capital Online, dan Sugon, sedang mencoba menggabungkan fasilitas GPU cloud mereka, sumber daya multi-cloud, dan kemampuan penjadwalan inferensi, secara bertahap berpindah dari "menjual daya komputasi" menuju "mengoptimalkan daya komputasi".

Pusat data AI

Lapisan ketujuh kue: Model dan Agent—Konsumen Token

Lapisan ini, meskipun paling dekat dengan pengguna dan paling mudah mendapatkan lalu lintas, juga memiliki persaingan paling ketat. Di GTC 2026, Huang Renxun mengemukakan pandangan berikut: di masa depan, setiap perusahaan akan menjadi "produsen Token dan konsumen Token".

Sebuah AI Agent dapat secara bersamaan memanggil beberapa model, beberapa alat, dan beberapa API, serta terus melakukan penalaran, perencanaan, dan eksekusi. Ini berarti, jumlah Token yang dikonsumsi oleh AI di masa depan akan jauh melebihi skala percakapan manusia dengan AI saat ini. Beberapa pengguna AI berat saat ini telah membangun sistem multi-Agent yang berjalan secara paralel dan saling memanggil, mengonsumsi 1 miliar Token per hari tanpa kesulitan.

Masa depan bukanlah 1 miliar orang yang menggunakan AI, melainkan 10 miliar, bahkan 100 miliar AI Agent yang bekerja secara bersamaan dan saling memanggil. Dan kendala sejati juga akan berpindah dari “kemampuan model” ke “efisiensi penjadwalan Token”.

Raksasa teknologi tentu saja tidak perlu dijelaskan lebih lanjut, Microsoft, Google, Meta, Amazon, dan lainnya sedang secara bertahap mengintegrasikan kemampuan AI ke dalam semua produk mereka melalui sistem perkantoran, pencarian, jaringan sosial, dan layanan cloud.

Perusahaan perangkat lunak perusahaan seperti Adobe, Salesforce, ServiceNow, dan Palantir sedang mempercepat kemajuan di bidang AI Agent tingkat perusahaan dan alur kerja otomatis. Sementara itu, Hugging Face sedang menjadi 'Github' di era AI. Ini bukan hanya komunitas model, tetapi juga infrastruktur penting bagi ekosistem pengembangan AI global.

Di pasar Tiongkok, perusahaan-perusahaan seperti iFlytek, Kunlun Wanwei, 360, Kingsoft Office, dan SenseTime sedang melakukan penempatan terkait asisten AI, kantor AI, dan AI Agent.

Setelah "kue tujuh lapis" benar-benar terbentuk, dunia AI baru akan benar-benar dimulai

Industri AI hari ini sebenarnya masih berada dalam satu sistem infrastruktur yang belum sepenuhnya matang.

Beberapa orang memiliki GPU canggih terkini, tetapi terbatas oleh energi; beberapa orang membangun AIDC besar, tetapi kekurangan penjadwalan yang efisien; beberapa orang mengembangkan model dan Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; beberapa orang menguasai node tepi, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara seragam.

Dari listrik, AIDC, GPU, hingga LLM, distribusi token, penjadwalan cerdas, dan AI Agent, seluruh rantai industri AI meskipun sedang berkembang pesat, masih mengalami banyak pemisahan, redundansi, dan hambatan efisiensi di antara berbagai lapisannya.

Namun, hanya ketika "kue tujuh lapis" ini benar-benar dibangun secara lengkap dan mulai beroperasi secara efisien dan terkoordinasi, industri AI akan benar-benar beralih dari "era alat" saat ini menuju "era adopsi massal" dunia cerdas.

Dunia AI masa depan tidak lagi hanya tentang beberapa raksasa teknologi yang melatih model besar, melainkan miliaran AI Agent yang terus online, bekerja sama secara terus-menerus, dan memanggil daya komputasi serta Token. Setiap percakapan, setiap penalaran, setiap pemanggilan alat, dan setiap tugas otomatis yang dieksekusi, didukung oleh kerja sama sistem energi, GPU, jaringan, sistem penjadwalan, dan node inferensi.

Ini juga berarti industri AI sedang bertransformasi dari logika perangkat lunak masa lalu menjadi sistem industri super yang mencakup energi, chip, komputasi awan, jaringan tepi, dan penjadwalan cerdas.

Seperti revolusi industri yang tidak hanya membutuhkan mesin uap, tetapi juga kereta api, jaringan listrik, dan pelabuhan; revolusi internet tidak hanya membutuhkan PC, tetapi juga serat optik, pusat data, dan komputasi awan. Tanda kejadian matang dari revolusi AI juga bukan hanya satu aplikasi viral, melainkan mulai terbentuknya sebuah "jaringan infrastruktur cerdas" secara global yang mampu memproduksi, mendistribusikan, mengoordinasikan, dan mengonsumsi Token secara berkelanjutan.

Dan ketika tujuh lapisan infrastruktur ini akhirnya terhubung sepenuhnya, logika persaingan di industri AI juga akan direkonstruksi secara total. Perusahaan paling penting di masa depan mungkin bukan lagi yang hanya memiliki model terbesar, tetapi yang mampu menghubungkan energi, kekuatan komputasi, jaringan, model, dan aliran Token.

Industri AI Memasuki 'Era Token' dengan Infrastruktur Tujuh Lapis

Pendorong utama era AI telah berubah dari model menjadi Token

Lapisan pertama kue: Listrik—Energi di Era AI

Lapisan kedua: AIDC—Pabrik Bahan Baku Token

Lapisan ketiga: GPU—Perangkat produksi Token

Lapisan keempat kue: LLM—Mesin produksi Token

Lapisan kelima kue: Distribusi Token — "Jaringan Listrik" di Era AI

Lapisan keenam kue: Optimasi Token dan Penjadwalan Cerdas—Otak di Era AI

Lapisan ketujuh kue: Model dan Agent—Konsumen Token

Setelah "kue tujuh lapis" benar-benar terbentuk, dunia AI baru akan benar-benar dimulai