Nvidia baru saja melaporkan kuartal lain yang akan membuat sebagian besar perusahaan lain menangis iri. Pendapatan mencapai $57 miliar untuk Q3 FY2026, naik 62% year-over-year, dengan segmen pusat data saja menghasilkan $51,2 miliar.
Angka-angka di balik narasi
Pendapatan pusat data Nvidia sebesar $51,2 miliar tumbuh 25% secara kuartal-ke-kuartal dan 66% secara tahun-ke-tahun. Hal ini menjadikan operasi pusat data perusahaan di atas laju tahunan $200 miliar.
Perusahaan mengendalikan sekitar 80% pasar akselerator AI. Dominasi ini bukan hanya tentang perangkat keras. Ini tentang ekosistem perangkat lunak CUDA yang mengikat pengembang ke arsitektur Nvidia.
Pasar inferensi AI global diproyeksikan tumbuh dari $106,15 miliar pada 2025 menjadi $254,98 miliar pada 2030, dengan tingkat pertumbuhan tahunan majemuk sebesar 19,2%. Arsitektur Blackwell dan Blackwell Ultra dirancang khusus untuk meningkatkan ekonomi inferensi, sehingga menjalankan model AI di produksi menjadi lebih murah dan lebih cepat.
Mengapa inferensi lebih penting daripada pelatihan
Melatih model AI adalah biaya sekali jalan (atau berkala). Inferensi—menjalankan model yang telah dilatih untuk melayani pengguna nyata—terjadi secara terus-menerus. Setiap permintaan ChatGPT, setiap hasil pencarian yang dihasilkan AI, setiap interaksi layanan pelanggan otomatis adalah beban inferensi. Beberapa perkiraan industri menunjukkan bahwa inferensi pada akhirnya bisa menyumbang 80-90% dari seluruh permintaan komputasi AI.
CEO Nvidia, Jensen Huang, telah mengisyaratkan transisi ini selama beberapa kuartal. Arsitektur Blackwell dirancang untuk menangani pola komputasi spesifik inferensi, di mana latensi dan biaya-per-pertanyaan sama pentingnya dengan throughput mentah.
Reaksi aneh pasar
Meskipun melaporkan angka yang melampaui ekspektasi, saham Nvidia justru bergerak lebih rendah. Saham ini kini berada di bawah 22x laba masa depan, sebuah valuasi yang terasa sederhana bagi perusahaan yang tumbuhkan pendapatan sebesar 62% per tahun.
Sementara Nvidia mendominasi pelatihan, beban inferensi lebih beragam dan berpotensi lebih mudah diakses oleh pesaing. Chip khusus dari Google, Amazon, dan sekelompok startup yang terus bertambah semuanya menargetkan inferensi secara khusus. Ruang jaringan GPU terdesentralisasi juga berkembang, berpotensi menawarkan komputasi inferensi dengan biaya lebih rendah dengan mengagregasi perangkat keras yang kurang dimanfaatkan.
Kelipatan pendapatan maju di bawah 22x menunjukkan bahwa pasar telah memperhitungkan sejumlah versi risiko ini. Apakah itu peluang atau peringatan sepenuhnya bergantung pada apakah Nvidia dapat mempertahankan dominasinya seiring pergeseran AI dari membangun model ke menjalankannya secara skala besar.
