Industri AI akan segera mencapai titik balik. Menurut Epoch AI, sebuah organisasi nirlaba yang memantau tren kecerdasan buatan, daya komputasi yang dialokasikan untuk menjalankan model AI akan tumbuh lebih cepat daripada daya komputasi yang digunakan untuk membangunnya pada tahun 2030.
Angka-angka di balik pergeseran
Proyeksi Epoch AI menggambarkan sebuah industri di mana ekonomi penyebaran akan semakin mendominasi ekonomi pengembangan. Organisasi ini memperkirakan hampir setengah dari seluruh komputasi inferensi akan bermigrasi ke ASIC, atau Application-Specific Integrated Circuits, pada akhir dekade ini. ASIC adalah chip yang dirancang untuk melakukan satu hal dengan sangat baik, berbeda dengan GPU generik yang saat ini menjadi daya utama sebagian besar beban kerja AI.
Sementara itu, pangsa komputasi pelatihan dalam total operasi AI diproyeksikan tetap stabil sekitar 5%. Komputasi pelatihan untuk model AI terdepan saat ini tumbuh dengan laju tahunan 4 hingga 5 kali. Basis komputasi AI terpasang secara keseluruhan berkembang dengan kecepatan serupa.
Secara historis, inferensi telah mewakili 60% hingga 80% dari komputasi dalam penerapan nyata.
Pada tahun 2030, pelatihan frontier diperkirakan mencapai sekitar 2e29 FLOP. Kemajuan ini sebanding dengan lompatan dari GPT-2 ke GPT-4, yang didukung oleh sumber daya dengan biaya lebih dari $100 miliar. Setiap pelatihan frontier tersebut mungkin memerlukan daya komputasi antara 4 hingga 16 gigawatt.
Proyek AI Epoch memperkirakan total kapasitas daya AI di AS dapat melebihi 50 GW pada tahun 2030, dengan kapasitas global melebihi 100 GW.
Mengapa ASICs memakan inferensi
Google sudah menemukan ini bertahun-tahun lalu dengan Tensor Processing Units-nya. Amazon memiliki chip Inferentia-nya. Tren yang diproyeksikan Epoch AI menunjukkan bahwa ini bukan strategi niche, melainkan arah yang akan diambil sekitar setengah pasar inferensi pada akhir dekade ini.
Batasan pada jalur pertumbuhan ini tidak sepele. Permintaan daya, kapasitas produksi chip, dan keterbatasan transfer data semuanya menimbulkan tantangan nyata. Penilaian Epoch AI adalah bahwa bottleneck-bottleneck ini dapat dikelola di bawah asumsi pertumbuhan saat ini.
Apa artinya ini bagi para investor
Jika komputasi inferensi adalah arah pertumbuhan masa depan, teori investasi untuk sektor semikonduktor berubah secara signifikan. Pelatihan masih membutuhkan GPU, dan anggaran pelatihan masih tumbuh 4 hingga 5 kali lipat setiap tahun. Namun, peluang pendapatan berulang dengan volume lebih tinggi semakin berada di inferensi.
Ketika Anda membicarakan 50 GW kapasitas daya AI di AS saja, itu merupakan pembangunan besar-besaran pusat data, sistem pembangkit listrik, dan sistem pendingin.
Risiko yang perlu diawasi adalah apakah tingkat pertumbuhan tahunan 4 hingga 5 kali dalam komputasi dapat dipertahankan. Proyeksi Epoch AI mengasumsikan tren saat ini berlanjut, tetapi kendala energi dan dinamika pasokan chip geopolitik semuanya bisa menimbulkan hambatan.
