Industri AI akan segera mencapai titik belok. Menurut Epoch AI, sebuah organisasi bukan keuntungan yang memantau tren kecerdasan buatan, kuasa pengiraan yang didedikasikan untuk menjalankan model AI akan tumbuh lebih cepat daripada kuasa pengiraan yang digunakan untuk membina mereka pada tahun 2030.
Nombor di belakang perubahan
Proyeksi Epoch AI menggambarkan satu industri di mana ekonomi pelaksanaan akan semakin mendominasi ekonomi pembangunan. Organisasi ini menganggarkan hampir separuh daripada semua pengiraan inferens akan berpindah ke ASIC, atau Litar Terpadu Khusus-Aplikasi, pada akhir dekad ini. Ini adalah cip yang direka untuk melakukan satu perkara sahaja dengan sangat baik, berbeza dengan GPU generik yang kini menggerakkan kebanyakan beban kerja AI.
Sementara itu, bahagian pengiraan latihan dalam operasi AI keseluruhan dijangka kekal stabil pada kira-kira 5%. Pengiraan latihan untuk model AI terkini kini tumbuh pada kadar tahunan 4 hingga 5 kali. Pangkalan pengiraan AI yang dipasang secara keseluruhan sedang mengembang pada kadar yang serupa.
Secara sejarah, inferens telah mewakili 60% hingga 80% pengiraan dalam pelaksanaan sebenar.
Pada tahun 2030, latihan frontier dijangka mencapai kira-kira 2e29 FLOP. Kemajuan ini sebanding dengan lompatan dari GPT-2 ke GPT-4, yang disokong oleh sumber yang berharga lebih daripada $100 bilion. Setiap latihan frontier tersebut mungkin memerlukan antara 4 hingga 16 gigawatt kuasa pengiraan.
Kapasiti kuasa AI keseluruhan projek Epoch AI di AS boleh melebihi 50 GW pada tahun 2030, dengan kapasiti global melebihi 100 GW.
Mengapa ASIC sedang memakan inferens
Google telah mengenali ini bertahun-tahun lalu dengan Unit Pemprosesan Tensor-nya. Amazon mempunyai cip Inferentia-nya. Trend yang diproyeksikan oleh Epoch AI menunjukkan bahawa ini bukan strategi terbatas, tetapi arah yang akan diambil oleh lebih kurang separuh pasaran inferens pada penghujung dekad ini.
Kendala terhadap lintasan pertumbuhan ini bukanlah perkara kecil. Permintaan kuasa, kapasiti penghasilan cip, dan had penghantaran data semuanya menimbulkan cabaran sebenar. Penilaian Epoch AI ialah bahawa bottleneck-bottleneck ini boleh dikendalikan di bawah anggaran pertumbuhan semasa.
Apa yang ini bermaksud kepada pelabur
Jika pengiraan inferens adalah di mana pertumbuhan sedang bergerak, teori pelaburan untuk sektor semikonduktor berubah secara bermakna. Latihan masih memerlukan GPU, dan bajet latihan masih meningkat sebanyak 4 hingga 5 kali setiap tahun. Tetapi peluang pendapatan berulang dengan volum yang lebih tinggi semakin terletak pada inferens.
Apabila anda berbincang mengenai 50 GW kapasiti kuasa AI di AS sahaja, itu adalah pembinaan besar-besaran pusat data, sistem penghasilan kuasa, dan sistem penyejukan.
Risiko yang perlu dipantau ialah sama ada kadar pertumbuhan tahunan 4 hingga 5 kali dalam pengiraan adalah berterusan. Proyeksi Epoch AI mengandaikan trajektori semasa berterusan, tetapi sekatan tenaga dan dinamik bekalan cip geopolitik boleh menyebabkan gangguan.
