Setelah Pertumbuhan 10x pada Modul Optik, Di Mana Peluang Rantai Pasok AI Berikutnya?

iconMetaEra
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Berita AI + kripto menunjukkan modul optik melonjak 10x, dipimpin oleh Zhongji Axchuang, Xinyi Sheng, Tianfu Communication, dan Yuanjie Technology. Para investor kini mencari nama berikutnya yang besar. Berita on-chain menunjukkan gelombang berikutnya dalam rantai pasokan AI akan berfokus pada daya, pendinginan cair, dan infrastruktur native AI. Saat pusat data beralih ke real estat industri, efisiensi energi dan optimasi jaringan akan mendorong nilai. Kompresi token dan integrasi AI perusahaan juga akan membentuk ulang keuntungan jangka panjang.

Penulis artikel ini: Hu Xuanfeng, Direktur Bisnis Aset Digital Fosun Wealth, CMO FinChain, Direktur Eksekutif Institut Aplikasi dan Investasi Blockchain Hong Kong, Wakil Ketua Pusat Promosi Industri Blockchain Changsanjiang

Peringatan risiko: Artikel ini tidak merupakan saran untuk membeli atau menjual sekuritas apa pun, dan tidak membuat penilaian pasti mengenai harga saham industri atau perusahaan apa pun. Istilah seperti "peluang", "penilaian ulang", dan "peta kekayaan" yang disebutkan dalam artikel ini merujuk pada tren industri dan arah yang mungkin menjadi perhatian pasar modal. Investasi yang sebenarnya tetap memerlukan penilaian independen berdasarkan valuasi, kinerja, pesanan, struktur persaingan, kualitas keuangan, dan kemampuan menanggung risiko.

Pendahuluan: Siapa modul cahaya berikutnya

Setelah modul cahaya naik sepuluh kali lipat, banyak orang merasa telah melewatkan peluang terbaik dalam rantai industri AI. Perusahaan-perusahaan hulu seperti Zhongji Xuchuang, Xinyisheng, Tianfu Communications, dan Yuanjie Technology menjadi garis utama paling menonjol di pasar modal selama setahun terakhir. Terutama Yuanjie Technology, harga sahamnya sempat melebihi Kweichow Moutai pada April 2026, menjadi perwakilan baru saham berharga tinggi di pasar A. Fakta ini sendiri menunjukkan bahwa perangkat keras komputasi AI telah berubah dari tema teknis menjadi peristiwa penentuan harga yang nyata di pasar modal. [1]

Namun, yang benar-benar ingin saya bahas adalah "Siapa modul cahaya berikutnya?" yang paling diperhatikan oleh semua orang.

Untuk mengetahui jawaban ini, kita tidak bisa melihatnya secara dangkal, tetapi harus memahami logika dasarnya: dalam setiap gelombang revolusi industri, pasar modal mungkin memberikan valuasi tinggi kepada perusahaan yang mampu bercerita dengan baik, tetapi hal ini tidak bertahan lama. Perusahaan yang benar-benar mampu mendapatkan penilaian modal dalam jangka panjang biasanya adalah mereka yang mengatasi hambatan baru.

Siapa yang mengatasi bottleneck baru, ia yang memiliki kekuatan penetapan harga baru; siapa yang memiliki kekuatan penetapan harga baru, ia yang mungkin mendapatkan penilaian ulang. Gelombang pasar modul optik ini pada dasarnya bukan karena pasar tiba-tiba menyukai komunikasi optik, melainkan karena pusat data AI terlebih dahulu mendorong bottleneck "interkoneksi kecepatan tinggi" ke depan panggung.

Satu: AI adalah revolusi infrastruktur informasi baru

Hari ini, banyak orang melihat AI dengan pola pikir tema: ChatGPT populer, jadi spekulasi valuasi model besar; NVIDIA naik, jadi spekulasi GPU; modul cahaya naik, semua orang mengejar modul cahaya; aplikasi belum menghasilkan keuntungan besar, jadi katakan AI adalah gelembung.

Pandangan ini terlalu jangka pendek, lebih mudah terjebak dalam tren mengikuti apa yang sedang populer. Yang seharusnya dilakukan adalah melakukan analisis mendalam: mengapa modul cahaya mendapat pengakuan dari modal, dan apa pola yang bisa dieksplorasi.

AI adalah revolusi infrastruktur informasi baru. Seperti telegraf, telepon, dan internet seluler, AI sedang mendefinisikan ulang cara produksi, transmisi, pemrosesan, dan monetisasi informasi.

Saya baru saja menulis buku baru saya, "Ekonomi Token: Jalur Pengembangan Baru di Era Cerdas," dan setelah melakukan penelitian mendalam, saya menemukan bahwa setiap revolusi informasi generasi baru akan menghasilkan unit penilaian bisnis baru.

Di era telegraf, unit terpenting adalah "kata"; di era telepon, unit terpenting adalah "menit"; di era internet seluler, unit terpenting adalah "data"; di era AI, unit terpenting adalah Token, yaitu------token.

Token secara tampak adalah unit terkecil yang diproses oleh AI, namun di baliknya merupakan biaya komprehensif dari daya komputasi, listrik, memori GPU, penyimpanan, jaringan, arsitektur model, dan efisiensi inferensi. Ketika Anda bertanya kepada AI, Anda menghabiskan token; ketika perusahaan menjalankan proses melalui Agent, mereka juga menghabiskan token. Di masa depan, ketika AI memasuki layanan pelanggan, riset investasi, desain, pemrograman, pendidikan, perawatan kesehatan, keuangan, dan manufaktur, setiap eksekusi tugas akan memiliki biaya token yang nyata.

Jadi, distribusi kekayaan jangka panjang dalam rantai pasokan AI tidak bisa hanya dilihat dari siapa yang menjual GPU. Yang benar-benar penting adalah empat hal: siapa yang memproduksi token, siapa yang menurunkan biaya token, siapa yang mengoordinasikan token, dan siapa yang mengubah token menjadi hasil yang mau dibayar pengguna.

Dua, sejarah bukan latar belakang, tetapi aturan alokasi industri

Untuk memahami masa depan AI, pertama-tama harus memahami sejarah industri informasi selama seratus tahun terakhir.

Telegram, telepon, internet, secara tampak adalah tiga industri berbeda, tetapi pada dasarnya mereka mengulangi skenario yang sama: ketika unit baru muncul, harganya mahal, infrastruktur duluan menghasilkan keuntungan; setelah biaya per unit turun, lapisan efisiensi mengambil alih; akhirnya, lapisan akses kembali mendistribusikan nilai bisnis.

Adegan pertama, era telegraf.

Pada tahun 1866, kabel bawah laut transatlantik secara resmi mulai digunakan, mengubah waktu pengiriman informasi antara Eropa dan Amerika Utara dari hitungan minggu menjadi hitungan menit. Namun, pada awalnya telegraf sangat mahal, dengan harga sepuluh dolar per kata, dengan minimum sepuluh kata. Mengirim telegraf transatlantik terpendek setara dengan gaji sepuluh minggu pekerja terampil pada masa itu. [2]

Pada saat itu, orang-orang yang pertama kali menghasilkan uang adalah mereka yang memasang kabel bawah laut dan yang mengendalikan jaringan telegraf internasional, karena mereka menguasai jalan raya informasi global untuk keuangan, perdagangan, pelayaran, dan diplomasi pada masa itu.

Tetapi jika satu kata terlalu mahal, pasti akan memaksa munculnya teknologi kompresi. Pedagang mulai menggunakan kode telegraf dan buku kode bisnis. Satu kata tidak lagi hanya satu kata, tetapi bisa mewakili seluruh kalimat, instruksi transaksi, atau spesifikasi barang. Hari ini kita membahas kompresi model AI, kuantisasi, dan decoding spekulatif, terdengar sangat mutakhir, tetapi logika dasarnya tidak baru. Manusia telah melakukan hal yang sama sejak era telegraf: apakah informasi yang sama bisa dikirimkan dengan unit penilaian yang lebih sedikit?

Selanjutnya, pintu masuk muncul. Reuters adalah contoh klasik. Pada tahun 1850, Paul Julius Reuter menggunakan 45 merpati pos untuk mengirimkan harga saham dan berita antara Brussels dan Aachen, lebih cepat sekitar 6 jam dibandingkan kereta api; setelah kabel di Selat Inggris selesai dipasang, ia segera terhubung ke jaringan telegraf dan menjual informasi keuangan, berita bisnis, dan data pasar kepada bank, surat kabar, dan pedagang. [3]

Keunggulan Reuters bukan karena ia memasang kabel, tetapi karena ia tahu informasi apa yang penting dan siapa yang bersedia membayar lebih untuk informasi yang lebih cepat. Perusahaan telegraf menghasilkan uang dari biaya transmisi karakter, sedangkan Reuters menghasilkan uang dari hak distribusi informasi. Satu menghasilkan uang dari saluran, yang lain menghasilkan uang dari nilai informasi.

Adegan kedua, era telepon.

Unit penilaian pada era telepon berubah menjadi menit. Pada tahun 1915, pada awal komersialisasi telepon lintas benua di Amerika Serikat, biaya tiga menit pertama dari New York ke San Francisco sekitar $20,70, setara dengan ratusan dolar saat ini. [4] Pemenang pertama secara alami adalah AT&T. Jaringan telepon memiliki sifat monopoli fisik yang kuat, di mana saluran, switch, stasiun relay, dan pengguna akhir bersama-sama membentuk jaringan besar.

Namun kemudian, mesin pertukaran otomatis, penguat sinyal, dan peningkatan peralatan komunikasi menyebabkan biaya per menit panggilan terus turun. Pasar modal mulai menilai ulang perusahaan-perusahaan yang memproduksi peralatan untuk meningkatkan efisiensi sistem. Kemudian, halaman kuning tumbuh di jaringan telepon. Halaman kuning tidak memungut biaya panggilan, tetapi memungut biaya pameran dari bisnis. Pengguna mencari bisnis, dan bisnis ingin ditemukan oleh pengguna—inilah yang membentuk pintu masuk bisnis.

Adegan ketiga adalah era ponsel dan internet.

Pada masa awal komunikasi nirkabel, penyedia infrastruktur paling berharga. Kemudian, operator komunikasi mengendalikan nomor, jaringan, paket, dan penagihan, menjadi sangat diminati; pesan teks, suara, dan data dikenai biaya berdasarkan penggunaan. Internet, yang didasarkan pada infrastruktur jaringan kabel dan nirkabel, secara signifikan menurunkan biaya komunikasi dan meningkatkan efisiensi pelaksanaan, sehingga memicu era data. Seiring penurunan cepat biaya per unit data, infrastruktur dasar tidak lagi dinilai tinggi, sementara perusahaan yang menguasai pintu masuk pengguna menjadi semakin berharga, menciptakan raksasa platform internet. WeChat, Taobao, Meituan, Douyin, Xiaohongshu, dan Pinduoduo mengambil alih waktu, transaksi, dan keputusan konsumsi pengguna.

Operator mengendalikan byte, sementara platform internet mengendalikan niat bisnis di dalam byte. Inilah hukum yang dijalani oleh tiga generasi industri informasi: infrastruktur naik terlebih dahulu, lalu lapisan efisiensi mengambil alih, dan lapisan akses akhirnya mendistribusikan nilai yang lebih tinggi. AI saat ini berada pada posisi kritis dalam transisi dari tahap pertama ke tahap kedua dan ketiga.

Tiga, mengapa gelombang pertama jatuh pada GPU, HBM, dan modul optik

Dalam dua tahun terakhir, gelombang pertama AI yang awalnya naik pada NVIDIA, penyimpanan, dan modul optik tidaklah mengherankan. Karena tahap pertama AI adalah pelatihan model besar dan pembangunan klaster komputasi.

Melatih model besar memerlukan banyak GPU; GPU memerlukan memori berpita lebar tinggi, yaitu HBM; banyak GPU yang harus bekerja sama memerlukan koneksi berkecepatan tinggi, yaitu modul optik, chip switching, PCB, konektor, dan perangkat jaringan. Pusat data tradisional seperti sekumpulan server yang menangani banyak tugas biasa, sedangkan pusat data AI lebih seperti satu superkomputer raksasa. Puluhan ribu hingga ratusan ribu GPU harus bekerja seolah-olah menjadi satu kesatuan, di mana perlambatan pada tahap mana pun akan menunda keseluruhan sistem.

GPU mahal, jika jaringan tidak cukup cepat, GPU akan menunggu data. GPU menunggu data berarti aset mahal berjalan sia-sia. Oleh karena itu, kenaikan modul optik didukung oleh dasar industri; kenaikan HBM adalah hasil dari pasar modal yang membeli hambatan nyata dalam rantai industri.

Namun pasar tidak akan selamanya hanya fokus pada hambatan pertama. Setelah tahapan-tahapan eksplisit seperti GPU, HBM, dan modul optik dibahas secara mendalam, pertanyaan akan terus bergeser ke belakang: Setelah daya komputasi dibangun, bagaimana cara membuatnya berjalan stabil? Bagaimana cara membuatnya lebih murah? Bagaimana cara memasukkannya ke dalam proses perusahaan? Bagaimana cara mengubahnya menjadi hasil yang mau dibayar oleh pengguna?

Empat: Hambatan berikutnya dalam perkembangan AI: listrik, pendinginan cair, dan properti industri komputasi

Garis paling pasti berikutnya, menurut saya, adalah listrik dan pendinginan cair. Alasannya sederhana: pusat data AI sedang berubah dari "bisnis ruang server" menjadi "bisnis energi".

Dulu, orang memahami pusat data sebagai gedung yang berisi banyak server. Pusat data AI tidak demikian. Batasan utama pusat data AI kini berubah menjadi akses listrik, kepadatan daya rak, kapasitas pendinginan, pengelolaan energi, dan pengiriman infrastruktur. NVIDIA secara resmi menekankan dalam pengenalan GB200 NVL72 bahwa sistem ini menghubungkan 36 Grace CPU dan 72 Blackwell GPU dalam desain berbasis rak yang didinginkan cair, yaitu sistem pendinginan cair tingkat rak. [5]

Ini berarti persaingan AI sudah bukan lagi sekadar persaingan satu GPU, melainkan persaingan sistem yang mencakup rak, ruang server, hingga pusat data secara keseluruhan. Di masa depan, kepadatan daya rak akan terus meningkat hingga level puluhan kilowatt bahkan ratusan kilowatt, dan pendinginan cair serta pasokan daya bukan lagi pendukung belakang, melainkan prasyarat awal dalam penempatan daya komputasi.

Yang lebih penting lagi adalah listrik. Menurut International Energy Agency dalam laporan "Energy and AI", konsumsi listrik pusat data global diperkirakan akan hampir berlipat ganda pada tahun 2030, mencapai sekitar 945 TWh, atau sekitar tetapi di bawah 3% dari total konsumsi listrik global; di mana AI merupakan salah satu pendorong pertumbuhan terpenting. [6]

GPU bisa dipesan, modul optik bisa diperluas produksinya, server bisa dirakit, tetapi jaringan listrik, gardu listrik, saluran transmisi, sumber daya cadangan, dan sistem pendingin tidak bisa muncul begitu saja dalam beberapa bulan. Semakin kuat AI, semakin tinggi konsumsi dayanya; semakin padat daya komputasi, semakin besar panasnya; semakin terpusat pusat data, semakin ekstrem persyaratan listrik dan pendinginannya.

Jadi, transformator, UPS, panel distribusi, catu daya switch-mode, saluran bus, sistem daya pusat data, pelat dingin cair, CDU, pompa dan katup, penukar panas, solusi pendinginan cair seluruh kabinet, serta integrasi infrastruktur pusat data akan dinilai ulang. Sebelumnya, semua produk ini dianggap bagian dari industri manufaktur tradisional, tetapi setelah munculnya AI, mereka berubah menjadi prasyarat untuk penyediaan daya komputasi.

Langkah selanjutnya, pusat data AI akan berubah dari IDC tradisional menjadi jenis properti industri baru. IDC tradisional menilai jumlah rak, tingkat pemuatan, PUE, sewa, dan pelanggan; sedangkan pusat data AI menilai indikator listrik, gardu listrik, kontrak energi jangka panjang, kemampuan pendinginan cair, akses jaringan berkecepatan tinggi, kontrak jangka panjang dengan pelanggan besar, kemampuan operasional klaster GPU, dan ruang perluasan lahan.

Ini bukan lagi bisnis sederhana "membangun gedung dan menempatkan server." Ini lebih mirip stasiun di era kereta api, dermaga di era pelabuhan, bandara di era penerbangan, atau pusat terhubung di era jalan raya. Perusahaan pusat data AI terbaik di masa depan tidak hanya menyewakan ruang server, tetapi juga mengorganisasi tanah, listrik, pendinginan, jaringan, chip, dan kontrak jangka panjang pelanggan menjadi satu aset infrastruktur yang menghasilkan arus kas, memiliki hambatan, dan langka.

Garis ini masih memiliki perubahan lanjutan: finansialisasi aset pusat data. Setelah pusat data AI membentuk arus kas yang stabil, ia berpotensi diubah menjadi REITs, RWA, dana infrastruktur, produk hak penghasilan, dan aset sewa jangka panjang. Di era komputasi awan, pusat data merupakan aset latar belakang penyedia cloud; di era AI, pusat data akan dinilai ulang sebagai "properti industri komputasi".

Lima, setelah pelatihan, adalah perang biaya inferensi

Sekarang banyak orang merasa NVIDIA terlalu kuat, sehingga peluang chip AI sudah habis dimakan oleh NVIDIA. Penilaian ini hanya benar sebagian.

Pada tahap pelatihan model besar, keunggulan NVIDIA sangat kuat. Bukan hanya GPU-nya yang kuat, tetapi juga CUDA, ekosistem pengembang, sistem jaringan, solusi keseluruhan, dan rantai alat perangkat lunaknya semuanya unggul. Namun, setelah AI memasuki tahap inferensi skala besar, logikanya berubah. Pada tahap pelatihan, yang paling penting adalah membuat model; pada tahap inferensi, yang paling penting adalah membuat model melayani sejumlah besar pengguna setiap hari. Pelatihan lebih mirip pengeluaran modal, sedangkan inferensi lebih mirip biaya operasional.

Ketika AI memasuki layanan pelanggan, kantor, pemrograman, keuangan, pendidikan, kesehatan, dan manufaktur, setiap hari menghasilkan panggilan dalam jumlah besar. Pada saat ini, orang-orang menyadari bahwa logika ekonomi token berbeda dengan logika ekonomi lalu lintas. Biaya marjinal ekonomi lalu lintas menurun, sehingga memungkinkan akuisisi pengguna dalam skala besar sebelum mempertimbangkan pendapatan, karena biaya jaringan per pengguna tambahan terus menurun. Namun, logika ekonomi token berbeda: hal ini membuat perusahaan model besar dan penyedia cloud merasakan biaya ekonomi yang sama sekali berbeda, yaitu biaya marjinalnya tetap bahkan meningkat. Pelatihan adalah investasi satu kali dengan imbal hasil jangka panjang, tetapi inferensi bukanlah demikian. Jika setiap layanan pengguna AI mengakibatkan kerugian, dan suatu tugas dipanggil beberapa juta atau bahkan ratusan juta kali per hari, maka tidak ada perusahaan yang mampu bertahan. Inilah mengapa bahkan DouBao, model besar dari ByteDance, harus mulai menerapkan biaya.

Pada saat ini, peluang baru muncul, dan orang-orang mulai memikirkan cara mengurangi biaya. Mengapa semua tugas harus menggunakan GPU umum termahal? Bisakah kita menggunakan chip khusus? Bisakah kita menggunakan ASIC dengan konsumsi daya lebih rendah, throughput lebih tinggi, dan lebih cocok untuk skenario tetap?

Inilah mengapa kasus-kasus seperti Broadcom, AMD, dan Google TPU patut diperhatikan.

Reuters melaporkan bahwa Broadcom memperkirakan peluang pendapatan dari chip AI khusus dapat melebihi $100 miliar pada tahun 2027, didorong oleh permintaan cepat dari perusahaan teknologi besar akan chip AI khusus. [7] AMD dalam laporan tahunan 2024 mengungkapkan bahwa pendapatan tahunan bisnis AI pusat datanya telah melebihi $5 miliar, dengan pelanggan seperti Meta, Microsoft, dan Oracle secara besar-besaran menerapkan accelerator AMD Instinct MI300. [8] Google Cloud menekankan bahwa TPU v5e dirancang untuk efisiensi biaya, mampu menyediakan volume kueri lebih tinggi dengan biaya yang sama. [9]

Jadi, masa depan chip AI tidak akan hanya memiliki satu bentuk. NVIDIA akan tetap kuat, tetapi penyedia cloud yang mengembangkan chip sendiri, ASIC khusus, chip akselerasi inferensi, dan chip AI edge juga akan menemukan posisi mereka. Ini bukan penggantian sederhana terhadap NVIDIA, melainkan mengambil sebagian dari pasar keuntungan di era inferensi. AI memasuki era inferensi dari era pelatihan, di mana optimasi biaya akan menjadi kunci penetapan harga baru.

Enam, setelah modul cahaya, adalah seluruh jaringan AI

Banyak orang menganggap modul optik sudah naik sepenuhnya, sehingga pasar AI telah berakhir. Saya tidak melihatnya demikian. Modul optik hanyalah lapisan pertama yang terlihat dari jaringan AI. Masih ada chip switching, switch, DPU, SmartNIC, CPO, fotonic silikon, penjadwalan klaster, dan sistem operasi jaringan.

Inti dari pusat data AI adalah menghubungkan sejumlah besar GPU menjadi satu superkomputer. Aset paling mahal di sini adalah GPU, dan hal yang paling tidak dapat diterima adalah GPU menganggur. Jika latensi jaringan tinggi, GPU menunggu data; jika efisiensi pertukaran rendah, GPU menunggu data; jika arsitektur komunikasi buruk, GPU tetap menunggu data.

Jadi, nilai jaringan AI bukan hanya mentransmisikan data, tetapi juga meningkatkan utilitas keseluruhan klaster GPU. Di pusat data internet biasa, jika jaringan sedikit lebih lambat, pengguna hanya mengalami pemuatan yang lebih lambat; namun di pusat data AI, jika jaringan sedikit lebih lambat, bisa menyebabkan penurunan utilitas peralatan senilai ratusan juta hingga miliaran dolar AS.

Platform InfiniBand Quantum-X800 dari NVIDIA menonjolkan jaringan end-to-end 800 Gb/s yang dirancang untuk melayani model AI dengan parameter triliunan; Spectrum-X Ethernet menekankan peningkatan kinerja jaringan AI dan dukungan untuk ekspansi cluster GPU skala besar. [10] TrendForce juga menunjukkan bahwa permintaan terhadap modul transceiver optik 800G dan lebih tinggi dalam koneksi cluster server AI sedang meningkat pesat, dan pasar modul optik AI berpotensi terus memperluas. [11]

Jadi, jaringan AI di masa depan akan terus ditingkatkan: dari 400G ke 800G, lalu ke 1.6T; dari modul optik tradisional ke CPO; dari switching elektronik ke integrasi optoelektronik; dari jaringan biasa ke AI fabric; dari perangkat tunggal ke pengelolaan seluruh kluster. Pasar modal selanjutnya tidak akan hanya melihat bisnis modul optik, tetapi akan melihat siapa yang dapat meningkatkan efisiensi koneksi kluster AI, siapa yang dapat mengurangi waktu tunggu GPU, dan siapa yang dapat membuat kluster berbasis sepuluh ribu hingga seratus ribu GPU lebih stabil.

Tujuh, setelah token menjadi lebih murah, pintu masuknya akan berganti orang.

Aplikasi skala besar di era AI bergantung pada apakah biaya token dapat terus menurun. Semakin mahal token, semakin sulit AI untuk diadopsi; semakin murah token, semakin mudah AI masuk ke dalam proses bisnis dan kehidupan sehari-hari.

Laporan AI Index Stanford 2025 menunjukkan bahwa biaya query model yang mencapai tingkat GPT-3.5 turun dari sekitar $20 per juta Token pada November 2022 menjadi sekitar $0,07 pada Oktober 2024, menurun lebih dari 280 kali dalam sekitar 18 bulan; kecepatan penurunan harga inferensi LLM bervariasi tergantung pada tugasnya, mulai dari 9 kali hingga 900 kali per tahun. [12]

Data ini menunjukkan bahwa kekuatan deflasioner jangka panjang sejati di industri AI mulai muncul. Siapa pun yang dapat menyelesaikan tugas yang sama dengan lebih sedikit token, lebih sedikit memori GPU, lebih sedikit listrik, dan lebih sedikit waktu inferensi, itulah yang bernilai.

Perusahaan semacam ini, saya sebut sebagai aliran kompresi token.

Mereka mungkin merupakan perusahaan model, platform inferensi, perusahaan chip, penyedia cloud, atau perusahaan infrastruktur AI perusahaan. Yang penting bukanlah apa nama mereka, tetapi apakah mereka dapat menurunkan biaya tugas yang sama, memperpendek rantai inferensi, mengurangi panggilan tidak efektif, dan menghasilkan hasil yang lebih stabil.

Beberapa teknologi penting di sini: MoE, kuantisasi, distilasi, cache, speculative decoding, dan routing model. Terutama routing model, tidak semua tugas memerlukan pemanggilan model termahal. Sistem AI yang matang akan secara otomatis memilih model dan jalur paling sesuai berdasarkan tingkat kesulitan tugas, anggaran biaya, persyaratan kecepatan, persyaratan privasi, dan persyaratan akurasi. Tentu saja, routing model juga rentan terhadap tekanan dari perusahaan besar, dan moatnya tidak terlalu kuat.

Setelah biaya turun, masalah akses menjadi lebih penting. Banyak orang percaya bahwa akses di era AI akan menjadi platform pengelolaan model, seperti Meituan di era AI. Perbandingan ini masuk akal, tetapi belum cukup mendalam. Akses AI yang sebenarnya belum tentu berupa platform yang memungkinkan Anda memilih model, tetapi lebih mungkin berupa sistem yang terintegrasi ke dalam alur kerja.

Pengguna biasa tidak akan secara aktif membuka platform penjadwalan model setiap hari. Pengguna perusahaan juga tidak akan memanggil model hanya untuk memanggil model. Pengguna menginginkan penyelesaian tugas, perusahaan menginginkan efisiensi proses, dan karyawan menginginkan hasil kerja. AI pada akhirnya akan tertanam di Office, Feishu, DingTalk, WeCom, ERP, CRM, editor kode, browser, email, pencarian, sistem keuangan, sistem layanan pelanggan, dan sistem perdagangan. Siapa yang mengendalikan alur kerja, dialah yang mengendalikan hak pemanggilan AI.

Microsoft mengungkapkan dalam laporan tahunan 2025 bahwa total pengguna aktif bulanan untuk keluarga produk Copilot di segmen bisnis dan konsumen melebihi 100 juta, serta semakin mengintegrasikan Microsoft 365 Copilot ke dalam alur kerja perkantoran. [13] Hal ini menunjukkan bahwa pintu masuk AI tidak harus berupa aplikasi terpisah, tetapi bisa berupa lapisan cerdas dalam alur kerja yang sudah ada.

Titik masuk programmer mungkin berupa editor kode dan platform hosting kode; titik masuk kantor mungkin berupa Microsoft 365, Google Workspace, Feishu, DingTalk; titik masuk operasional perusahaan mungkin berupa ERP, CRM, sistem keuangan; titik masuk pribadi mungkin berupa sistem operasi ponsel, browser, kotak pencarian, kacamata cerdas. Titik masuk sejati di era AI bukanlah daftar model, melainkan titik masuk alur kerja.

Delapan, tantangan sebenarnya dari AI perusahaan adalah memasuki proses

Agar AI menjadi titik masuk alur kerja, ada satu prasyarat: AI harus masuk ke dalam proses nyata perusahaan. Tantangan terbesar AI perusahaan bukanlah mengintegrasikan chatbot, tetapi apakah model dapat membaca data perusahaan dengan aman, memahami alur bisnis, memanggil sistem, mencatat log, menerima audit, dan mengintegrasikan mekanisme persetujuan manusia.

Banyak perusahaan saat ini menggunakan AI hanya pada tahap di mana karyawan bertanya, menulis, dan merangkum sendiri. Ini dapat meningkatkan efisiensi individu, tetapi tidak benar-benar mengubah struktur organisasi. AI perusahaan yang sejati adalah ketika Agent masuk ke dalam proses.

Agen layanan pelanggan tidak hanya menjawab pertanyaan, tetapi juga harus memeriksa pesanan, melihat logistik, menilai syarat pengembalian dana, dan memanggil sistem purna jual; Agen keuangan tidak hanya membuat laporan, tetapi juga harus membaca bukti, melakukan reconciliasi, mengidentifikasi anomali, dan menghasilkan pendapat persetujuan; Agen investasi dan riset tidak hanya merangkum berita, tetapi juga harus mengambil data, membangun model, membandingkan perusahaan, dan melacak risiko; Agen hukum tidak hanya menulis kontrak, tetapi juga harus mencari ketentuan, mengidentifikasi risiko, menghubungkan kasus, dan menyimpan jejak perubahan.

Di baliknya diperlukan seluruh infrastruktur: database, pencarian vektor, manajemen izin, tata kelola data, integrasi sistem, mesin alur kerja, log audit, kepatuhan dan keamanan, pengetahuan perusahaan, serta platform orkestrasi Agent. Hal-hal ini terdengar tidak se-menarik model besar, tetapi mereka adalah fondasi nyata bagi penerapan AI di perusahaan. Uang pertama yang seharusnya dihabiskan perusahaan untuk menerapkan AI adalah untuk membeli keamanan, data, izin, proses, integrasi, dan kepatuhan, bukan sekadar menerapkan model besar untuk menjalankan tugas-tugas yang terlihat menarik.

Masih ada perubahan lebih besar yang tersembunyi di sini: uang besar dalam aplikasi AI tidak selalu berasal dari anggaran perangkat lunak, tetapi mungkin berasal dari anggaran sumber daya manusia. SaaS menjual alat, sedangkan AI Agent menjual hasil. Alat memerlukan manusia untuk mengoperasikannya, sedangkan Agent langsung menyelesaikan tugas tersebut.

Sistem AI layanan pelanggan, jika hanya menjual perangkat lunak, batas atasnya adalah pasar perangkat lunak layanan pelanggan; tetapi jika benar-benar menggantikan sejumlah besar staf layanan pelanggan manual, batas atasnya adalah biaya outsourcing layanan pelanggan dan biaya tenaga kerja layanan pelanggan perusahaan. Sistem AI hukum, jika hanya menjual alat dokumen, batas atasnya terbatas; tetapi jika mampu menggantikan pengacara pemula, tinjauan kontrak, dan pengumpulan due diligence, batas atasnya adalah kumpulan biaya layanan hukum.

Harvey adalah kasus AI hukum yang patut diamati. Menurut TIME tahun 2025, Harvey dinilai sekitar 5 miliar dolar AS, memiliki lebih dari 300 klien, mencakup 53 negara, dan masuk ke dalam tujuh dari sepuluh kantor hukum dengan pendapatan tertinggi di Amerika Serikat. [14] Ini menunjukkan bahwa penerapan AI dalam skenario pekerjaan pengetahuan bernilai tinggi bukan sekadar penggantian alat sederhana, melainkan memasuki kolam biaya tenaga kerja dalam layanan profesional.

Perusahaan aplikasi AI yang benar-benar unggul di masa depan tidak akan hanya mengklaim dirinya sebagai perusahaan perangkat lunak, tetapi akan mengatakan seberapa banyak pekerjaan yang dapat mereka selesaikan untuk klien, seberapa banyak tenaga kerja yang dapat mereka hemat, seberapa banyak kesalahan yang dapat mereka kurangi, seberapa banyak konversi yang dapat mereka tingkatkan, dan seberapa banyak siklus pengiriman yang dapat mereka perpendek. Pasar modal dulu melihat ARR, di masa depan juga akan melihat seberapa besar pool biaya tenaga kerja yang dapat mereka kurangi.

Sembilan, Jangan Abaikan AI Lokal dan Finansialisasi Kekuatan Komputasi

Masih ada dua tren lain yang saat ini belum paling panas, tetapi tidak bisa diabaikan dalam jangka menengah dan panjang. Salah satunya adalah AI lokal. Saat ini, sebagian besar token masih diproduksi di pusat data云端, ketika Anda bertanya kepada model, pada dasarnya pusat data jauh yang membantu menghitungnya. Namun, di masa depan, tidak mungkin semua inferensi AI ditempatkan di云端.

Alasannya sederhana: inferensi di cloud terlalu mahal, banyak skenario membutuhkan latensi rendah, dan banyak data tidak dapat diunggah ke cloud. Perangkat terminal juga akan menjadi semakin cerdas. Oleh karena itu, sebagian token di masa depan akan berpindah dari cloud ke lokal, atau bisa disebut sisi terminal. Ponsel akan menjalankan AI, PC akan menjalankan AI, mobil akan menjalankan AI, robot akan menjalankan AI, kacamata pintar akan menjalankan AI, dan workstation lokal juga akan menjalankan AI.

Setelah AI di perangkat dimulai, akan memicu siklus perangkat keras baru. Chip AI perangkat, NPU, penyimpanan berdaya rendah, manajemen daya, pendinginan, sensor, modul kamera, array mikrofon, PC AI, ponsel AI, kacamata AI, robot, dan platform komputasi cerdas otomotif akan memasuki penilaian ulang rantai pasokan baru.

Namun, garis ini harus dilihat secara objektif. Arah AI sisi perangkat memang benar, tetapi saat ini masih kekurangan aplikasi killer yang benar-benar nyata. AI PC dan AI ponsel saat ini lebih banyak didorong oleh produsen perangkat keras, sementara di sisi pengguna belum terbentuk kebutuhan yang harus diganti. Oleh karena itu, AI sisi perangkat tidak akan menjadi garis utama yang pertama kali meledak, tetapi akan menjadi garis utama penting jangka menengah-panjang.

Garis lainnya adalah finansialisasi hashrate. Infrastruktur AI terlalu berat. GPU mahal, pusat data mahal, kontrak listrik mahal, siklus pembangunan panjang, dan membutuhkan modal besar. Mengandalkan neraca keuangan perusahaan teknologi saja belum tentu solusi terbaik.

Beberapa jenis aset keuangan baru yang mungkin muncul di masa depan: kontrak penyewaan GPU, hak atas pendapatan komputasi, REIT pusat data, dana infrastruktur AI, perjanjian pembelian listrik jangka panjang, pembiayaan berbasis jaminan GPU, pembiayaan terstruktur berbasis pendapatan inferensi, serta aset komputasi yang di-RWA-kan.

Tim bisnis aset digital di Fosun Wealth, tempat saya bekerja, merupakan salah satu tim penerbitan RWA paling profesional di Hong Kong. Berdasarkan analisis bisnis langsung yang saya lakukan, aset komputasi RWA memiliki nilai keuangan yang sangat tinggi dan potensi besar untuk perdagangan kompatibel secara global di masa depan. FinChain StarChain dan StarRoad membantu produsen komputasi tradisional besar dalam menemukan jalur keuangan baru yang kompatibel melalui tokenisasi, mulai dari daya komputasi Bitcoin hingga daya komputasi AI.

Di luar negeri telah ada contoh sukses dalam fiksalisasi daya komputasi, dan CoreWeave merupakan yang paling khas. Pada Maret 2026, CoreWeave mengumumkan penyelesaian fasilitas pinjaman jangka waktu delay sebesar US$8,5 miliar, dan menyebutnya sebagai pembiayaan pertama berbasis GPU dengan peringkat investasi. [15] Ini menunjukkan bahwa GPU, rak, dan kontrak daya komputasi sedang dihargai ulang oleh pasar keuangan sebagai aset infrastruktur yang dapat dijaminkan dan didanai.

Ini sangat mirip dengan kereta api, telekomunikasi, dan komputasi awan. Di era kereta api, perusahaan kereta api membiayai pembangunan jalur kereta melalui obligasi; di era telekomunikasi, operator membangun jaringan dengan modal jangka panjang; di era komputasi awan, penyedia cloud menghabiskan modal besar untuk membangun pusat data. Di era AI, GPU, kabinet, kontrak listrik, dan pendapatan inferensi masa depan juga akan dipaketkan, dihargai, dan diperdagangkan kembali oleh pasar keuangan.

Sepuluh: Peluang tertinggi: Perusahaan berbasis AI akan menulis ulang laporan laba rugi

Yang dibahas sebelumnya adalah seluruh rantai industri. Namun, dampak jangka panjang terbesar dari AI bukan hanya pada rantai industri, melainkan pada bentuk organisasi yang akan ditulis ulang.

Dulu, perusahaan terdiri dari manusia yang membentuk departemen. Departemen penjualan, layanan pelanggan, keuangan, hukum, riset dan investasi, serta operasional, masing-masing memiliki posisi, proses, persetujuan, dan kinerja. Setelah AI Agent masuk, organisasi akan berubah: satu orang dapat mengelola beberapa Agent, satu departemen dapat diperkecil oleh alur kerja Agent, posisi back-office dan middle-office akan diotomatisasi, jangkauan manajemen akan membesar, dan perusahaan akan berubah dari organisasi padat tenaga kerja menjadi organisasi kolaborasi manusia-mesin.

Ini berarti bahwa di masa depan, pasar modal akan menilai ulang sebuah perusahaan: perusahaan yang native AI. Bukan sekadar membeli beberapa alat AI, atau membiarkan karyawan menggunakan ChatGPT untuk menulis konten, tetapi merancang ulang struktur organisasi dari awal berdasarkan AI. Lebih sedikit orang, pendapatan lebih tinggi, output per orang lebih tinggi, biaya marjinal lebih rendah, dan kecepatan pengiriman lebih cepat.

Jadi, dampak terbesar AI terhadap pasar modal bukan hanya "siapa yang akan naik di rantai pasok AI", tetapi juga "di seluruh industri, siapa yang bisa menggunakan AI untuk menulis ulang laporan laba rugi mereka sendiri". Pasar masa depan akan memberi penghargaan kepada dua jenis perusahaan: pertama, perusahaan yang menjual infrastruktur AI dan kemampuan AI; kedua, perusahaan yang menggunakan AI untuk merekonstruksi struktur biaya dan pendapatan mereka sendiri. Yang terakhir ini secara tampak mungkin bukan perusahaan AI, tetapi efisiensi organisasi, margin laba, dan output per orang mereka akan mengalami perubahan mendasar.

Penutup: AI sedang mendefinisikan ulang kelangkaan

Sampai di sini, jika hanya melihat GPU, modul optik, listrik, pendinginan cair, ASIC, pusat data, dan perangkat edge, sebenarnya masih menganggap AI sebagai satu rantai industri teknologi. Perubahan yang lebih dalam adalah, AI akan mendefinisikan ulang apa yang langka.

Dulu yang langka adalah GPU, sehingga NVIDIA naik; kemudian yang langka adalah HBM dan modul optik, sehingga penyimpanan dan modul optik naik; selanjutnya yang langka adalah listrik, pendinginan cair, jaringan AI, chip inferensi, saluran data, titik masuk alur kerja, data perusahaan, dan eksekusi organisasi.

Jika membagi gelombang pasar AI ini menjadi tahapan, tahap pertama membeli infrastruktur komputasi, tahap kedua membeli kemampuan komputasi untuk beroperasi secara stabil dan murah, dan tahap ketiga membeli kemampuan komputasi untuk masuk ke dalam proses bisnis dan menghasilkan pendapatan serta keuntungan nyata.

Modul cahaya naik sepuluh kali lipat, bukan akhir cerita, tetapi pertama kalinya pasar modal melihat dengan jelas hambatan fisik infrastruktur AI. Revaluasi yang lebih besar akan terjadi pada hambatan baru berikutnya yang belum dihargai secara memadai.

Listrik, pendinginan cair, pusat data AI, ASIC khusus, jaringan AI, kompresi token, routing model, pipeline data perusahaan, titik masuk alur kerja, AI di perangkat akhir, komersialisasi daya komputasi, dan perusahaan AI-native akan bersama-sama membentuk peta kekayaan berikutnya dari rantai nilai AI.

Tentu, ini bukan berarti setiap perusahaan akan naik, atau setiap konsep layak dibeli. Dalam setiap gelombang revolusi industri, kekayaan tidak dibagi secara merata. Perusahaan yang benar-benar akan dihargai secara jangka panjang oleh pasar modal adalah mereka yang menguasai titik bottleneck, memiliki pelanggan, pesanan, hambatan teknologi, keunggulan biaya, dan posisi ekosistem.

Ringkasan satu kalimat: Peluang pertama AI adalah siapa yang bisa membangun daya komputasi; peluang berikutnya AI adalah siapa yang bisa mendukung, mengoptimalkan, dan mengoordinasikan daya komputasi, serta pada akhirnya mengubah daya komputasi menjadi hasil bisnis nyata.

Catatan dan sumber

Informasi berikut digunakan untuk mendukung fakta sejarah, data publik, dan kasus industri yang disebutkan dalam teks. Untuk memudahkan editor media keuangan memverifikasi, prioritas diberikan pada lembaga resmi, pengumuman perusahaan, media terkemuka, atau sumber primer.

[1] Tentang harga saham Yuanjie Technology yang melebihi Kweichow Moutai selama perdagangan dan menjadi perwakilan saham baru termahal di A-share: Sina Finance, 17 April 2026, "Melampaui Moutai, Raja Saham Baru A-Share Muncul". https://finance.sina.com.cn/wm/2026-04-17/doc-inhuupte2305062.shtml

[2] Mengenai biaya kabel transatlantik tahun 1866: PBS American Experience, "How the Early Cable Was Used", menjelaskan bahwa biaya awal kabel transatlantik tahun 1866 adalah $10 per kata, dengan minimum 10 kata, setara dengan gaji sepuluh minggu pekerja terampil. https://www.pbs.org/wgbh/americanexperience/features/cable-how-early-cable-was-used/

[3] Mengenai kasus burung merpati Reuters: Reuters, “The long history of speed at Reuters”, menyebutkan bahwa Reuters di masa awal menggunakan burung merpati untuk mengirimkan informasi keuangan. https://www.reuters.com/article/business/the-long-history-of-speed-at-reuters-idUSKBN2761WD/

[4] Mengenai biaya panggilan transkontinental AS tahun 1915: JSTOR Daily, “AT&T: Kelahiran Jaringan Sosial Pertama”, menyebutkan biaya panggilan pantai-ke-pantai selama 3 menit pada tahun 1915 adalah 20,70 dolar AS. https://daily.jstor.org/birth-first-social-network/

[5] Mengenai NVIDIA GB200 NVL72: Halaman resmi NVIDIA menjelaskan bahwa GB200 NVL72 menghubungkan 36 Grace CPU dan 72 Blackwell GPU, menggunakan desain rack-scale dan pendingin cair. https://www.nvidia.com/en-us/data-center/gb200-nvl72/

[6] Mengenai konsumsi listrik pusat data global: International Energy Agency, “Energy demand from AI”, memperkirakan konsumsi listrik pusat data global akan mencapai sekitar 945 TWh pada tahun 2030, kurang dari 3% dari total konsumsi listrik global. https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai

[7] Tentang chip AI khusus Broadcom: Reuters, 2026-03-04, “Broadcom memperkirakan pendapatan kuartal kedua di atas perkiraan”, melaporkan bahwa Broadcom memperkirakan pendapatan chip AI akan melebihi $100 miliar pada tahun 2027. https://www.reuters.com/technology/broadcom-forecasts-second-quarter-revenue-above-estimates-2026-03-04/

[8] Mengenai bisnis AI pusat data AMD: Laporan Tahunan AMD 2024, mengungkapkan pendapatan tahunan bisnis AI pusat data melebihi 5 miliar dolar AS, serta menyebutkan Meta, Microsoft, Oracle, dan lainnya yang menerapkan akselerator AMD Instinct MI300. https://ir.amd.com/financial-information/sec-filings/content/0001193125-25-067185/0001193125-25-067185.pdf

[9] Mengenai efisiensi biaya Google TPU v5e: Google Cloud Blog, "Performance per dollar of GPUs and TPUs for AI inference", menyebutkan bahwa TPU v5e meningkatkan jumlah kueri dengan biaya yang sama. https://cloud.google.com/blog/products/compute/performance-per-dollar-of-gpus-and-tpus-for-ai-inference

[10] Tentang platform jaringan AI NVIDIA: Halaman resmi NVIDIA Quantum-X800 menyatakan bahwa produk ini merupakan jaringan InfiniBand 800 Gb/s end-to-end. https://www.nvidia.com/en-us/networking/products/infiniband/quantum-x800/

[11] Mengenai pasar modul transceiver optik AI: TrendForce, 2026-04-20, “Pasar Global Transceiver Optik AI Akan Mencapai US$26 Miliar”, menunjukkan permintaan untuk modul transceiver optik 800G dan lebih tinggi meningkat pesat. https://www.trendforce.com/presscenter/news/20260420-13017.html

[12] Mengenai penurunan biaya inferensi AI: Stanford HAI, “AI Index 2025: State of AI in 10 Charts”, menunjukkan bahwa biaya query model setara GPT-3.5 turun lebih dari 280 kali dalam sekitar 18 bulan. https://hai.stanford.edu/news/ai-index-2025-state-of-ai-in-10-charts

[13] Mengenai jumlah pengguna Microsoft Copilot: Laporan Tahunan Microsoft 2025, mengungkapkan bahwa keluarga produk Copilot mencapai lebih dari 100 juta pengguna aktif bulanan secara gabungan di segmen bisnis dan konsumen. https://www.microsoft.com/investor/reports/ar25/index.html

[14] Tentang kasus AI hukum Harvey: Daftar Perusahaan Paling Berpengaruh Global TIME 2025 melaporkan valuasi Harvey sekitar $5 miliar, dengan lebih dari 300 klien yang mencakup 53 negara. https://time.com/collections/time100-companies-2025/7289586/harvey/

[15] Mengenai pembiayaan berbasis GPU CoreWeave: Pengumuman hubungan investor CoreWeave, pada Maret 2026 diumumkan penyelesaian fasilitas pinjaman jangka waktu delay sebesar USD 8,5 miliar, yang disebut sebagai pembiayaan berbasis GPU pertama berperingkat investasi. https://investors.coreweave.com/news/news-details/2026/CoreWeave-Closes-Landmark-8-5-Billion-Financing-Facility-Achieving-First-Investment-Grade-Rated-GPU-backed-Financing/default.aspx

Penjelasan: Artikel ini adalah esai pandangan industri, catatan kaki digunakan untuk menjelaskan sumber fakta, bukan merupakan saran investasi apa pun.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.